선생님 ㅠㅠ 블로그 글 읽고 여기로 넘어왔는데요 3개의 집단이면 anova를 하고, anova는 t 검정의 상위개념이러는건 알겠는데 t와 다르게 분산을 비교하므로 f test의 일종으로봐야하나요? 값도 f수치? 로 나오니깐요.. 또 하나 질문 드리자면 3개의 집단의 몸무게 비교일때 anova로는 건강한 성인의 몸무게 평균과 비교할수없는거죠..? 세개의 집단의 분산 비교만 할수있는거죠?
안녕하세요 선생님. 유익한 강의 감사합니다. 질문 드리고 싶은 점이 있어 댓글 남기게 되었습니다. ANOVA는 GLM(일반선형분석법)에 종속되는 것으로 알고 있습니다. 하지만 정확하게 어떤 차이가 있는지 알고 싶습니다. 구글링을 통해 그 차이점에 대해 찾아 보았으나 이해가 되지 않아 선생님께 질문드립니다. 답변 꼭 부탁드립니다! 감사합니다.
Generalized Linear Model (GLM)과 Analysis of Variance (ANOVA)는 두 가지 다른 통계 모델입니다. GLM은 선형 회귀 모델을 확장한 것으로, 일반적인 선형 회귀 모델에서 예측변수와 응답변수 간의 관계를 선형으로 가정하는 것이 아니라, 이를 비선형으로 가정할 수 있도록 해줍니다. 이로 인해 GLM은 응답변수가 이산적인 경우나 연속적인 경우 모두 사용 가능합니다. ANOVA는 분산분석(Analysis of Variance)의 약자로, 여러 그룹의 평균 차이를 검정하는 통계적 방법입니다. ANOVA는 선형 모델에서 설명변수의 효과를 측정하는데 사용됩니다. 두 가지 모델은 서로 다른 목적을 가지고 있으며, 그렇기 때문에 다른 상황에서 사용됩니다. GLM은 응답변수가 이산적이거나 연속적인 경우에 사용되며, ANOVA는 설명변수의 효과를 측정할 때 사용합니다.
좋은 영상 너무 감사합니다!! 처음 통계를 배우는 문과에게 너무 도움이 되네요ㅠㅠ 근데 이해되지 않는 부분이 하나 있습니다. 집단간 평균차이(F)가 있으려면 그룹 간 분산(분자)이 커야하는 건 알겠는데, 그룹 내 분산(분모)은 왜 연관이 되는지 잘 모르겠습니다.. 어차피 평균이 차이가 나면 각 그룹들 분산이 아무리 좁아진들 어차피 차이는 그대로 나는 거 아닌가요..?ㅠ
선생님, 안녕하세요. 강의 잘 들었습니다. 저는 분자생물학을 전공하고 있는 대학원생입니다. 선생님 강의들이 통계분석에 참 많은 도움이 되었습니다. 당장이라도 찾아가서 뽀뽀하고 싶네요. 이 동영상 관련하여 몇가지 질문 드리고 싶은게 있습니다. 1. F value나 T value를 사용하기 위해서 정규성 검정과 등분산 검정이 이루어져야 하는 것이 맞나요? 2. 선생님께서는 F value나 T value를 구하기 위해 표본의 s.e.m. 값을 활용하셨는데, s.d.로 value를 구하고 사람들이 알 수 있게 표기만 해 놓으면 괜찮은 것인가요? 감사합니다.
@@AngeloYeo 선생님, 답변 대단히 감사합니다. 사랑합니다... 구원자세요.. 물론입니다. s.d.는 표본들의 표준편차고, s.e.m은 표본 평균의 표준오차죠! 이렇게 여쭤보는 이유는 제가 생물학 논문들을 읽다보면 s.d.로 t-test를 하는 경우가 많기 때문입니다.(아니면 제가 해석을 잘못하고 있는 것일 수도 있습니다) 저는 정석이 궁금합니다. 예를들어, 감기약 실험을 한다고 하면, 감기 걸린 일반인들 20명에서 10명은 컨트롤 그룹으로 두고 감기약을 먹는 사람은 10명으로 두어 회복하는 시간을 기록했습니다. (모집단이 두 개: 컨트롤, 감기약) 그럼 컨트롤 그룹의 회복시간을 평균한 값, 그리고 감기약을 먹는 그룹의 회복시간을 평균한 값 이 나오죠. 여기서 실험의 신뢰도를 높히기 위해서는 (가장 효율적인 방법이라고 생각되는 방법을 말씀드리면) -> 각 그룹의 표본값을 부트스트랩(1,000번 다시 뽑음)하여 수 많은 표본 평균을 구한 값으로 정규성검정, 등분산검정하여 t-test와 anova를 실시한다. (정규성검정 or 등분산검정에서 모집단의 분포가 정규분포가 아니라고 판명된 경우 비모수검정을 실시한다) 각 그룹 표본 평균의 신뢰구간이 95라고 하고 유의수준을 0.05로 두었을 때, p-value가 0.05 보다 작을 경우 (그래프의 에러바는 s.e.m.으로 표시) 우리는 감기약이 두 그룹간 유의적 차이를 만들어 낸다고 할 수 있을까요?
나이 서른일곱 엘지에서 수율하고있는 책임입니다. 매번 주입식으로 배운 교육을 이렇게 체계적으로 쉽게 설명해주셔서 넘 감사드립니다
댓글 감사합니다. 도움되었으면 좋겠습니다 😁
떨고있던 문과 석사생인데 친절한 설명에 감동받고 갑니다
아 진짜 너무 감사해요 ㅠㅠㅠ 진짜 설명 찰떡이에요
좋게 봐주셔서 감사합니다 😊
아노바 공부할 때 왜 '분산'분석일까 평균비교가 목적인데 평균분석이 아닐까 생각했었는데 이런 의미가 있었군요 좋은 영상 잘보고 갑니다~
좋게 봐주셔서 감사합니다 ~~~^^ 저와 같은 고민을 하셨던 분이 계셔서 매우 반갑습니다 ㅎㅎ 도움 되었다니 다행입니다!
매번 면접 준비할 때 마다 통계 공부를 하는데, 이해도 잘 안되고 쉽게 잊어버렸어요. t-test부터 이 강의는 정말 쉽고 간단하네요. 감사합니다.
이렇게 쉽게 설명해주시니 감사합니다!
덕분에 도움이 많이 됩니다
설명 진짜 깔끔쓰
최고...!!최고!
감사합니다 ^^...
우 오 아ㅏㅇ아아아... 신속한 피드백 정말 감사드립니다. 딱 문과에게 필요한 수준의 깊은(공대에겐 얕은) 통계지식을 보여주시네요. 진짜 선생님 덕분에 많이 배웁니다.
좋게 봐주셔서 감사합니다 ~~ ^^
선생님 ㅠㅠ 블로그 글 읽고 여기로 넘어왔는데요
3개의 집단이면 anova를 하고, anova는 t 검정의 상위개념이러는건 알겠는데
t와 다르게 분산을 비교하므로 f test의 일종으로봐야하나요? 값도 f수치? 로 나오니깐요..
또 하나 질문 드리자면
3개의 집단의 몸무게 비교일때 anova로는 건강한 성인의 몸무게 평균과 비교할수없는거죠..?
세개의 집단의 분산 비교만 할수있는거죠?
감사합니다. 이해도를 높이는 영상입니다
감사합니다 이해하는 데 도움이 됐습니다. 그런데 궁금한 점이 있습니다. 두 선형 모형 a+bx1과 a+bx1+cx2+dx3 중 더 나은 모형을 선택할 때도 왜, 어떻게 F 검정을 사용하는지 궁금합니다. 이때의 검정은 일원 분산 분석 인가요 이원 분산 분석인가요?
안녕하세요 선생님. 유익한 강의 감사합니다.
질문 드리고 싶은 점이 있어 댓글 남기게 되었습니다.
ANOVA는 GLM(일반선형분석법)에 종속되는 것으로 알고 있습니다. 하지만 정확하게 어떤 차이가 있는지 알고 싶습니다. 구글링을 통해 그 차이점에 대해 찾아 보았으나 이해가 되지 않아 선생님께 질문드립니다. 답변 꼭 부탁드립니다! 감사합니다.
Generalized Linear Model (GLM)과 Analysis of Variance (ANOVA)는 두 가지 다른 통계 모델입니다.
GLM은 선형 회귀 모델을 확장한 것으로, 일반적인 선형 회귀 모델에서 예측변수와 응답변수 간의 관계를 선형으로 가정하는 것이 아니라, 이를 비선형으로 가정할 수 있도록 해줍니다. 이로 인해 GLM은 응답변수가 이산적인 경우나 연속적인 경우 모두 사용 가능합니다.
ANOVA는 분산분석(Analysis of Variance)의 약자로, 여러 그룹의 평균 차이를 검정하는 통계적 방법입니다. ANOVA는 선형 모델에서 설명변수의 효과를 측정하는데 사용됩니다.
두 가지 모델은 서로 다른 목적을 가지고 있으며, 그렇기 때문에 다른 상황에서 사용됩니다. GLM은 응답변수가 이산적이거나 연속적인 경우에 사용되며, ANOVA는 설명변수의 효과를 측정할 때 사용합니다.
직관적으로 말하자면, 데이터에서 그룹 간 차이 정도가 그냥 그럴 수도 있는 정도(그룹 내 분산)면 평균간 차이가 없다는 null 가설을 기각 못하는 것이겠네요
좋은 영상 너무 감사합니다!! 처음 통계를 배우는 문과에게 너무 도움이 되네요ㅠㅠ 근데 이해되지 않는 부분이 하나 있습니다.
집단간 평균차이(F)가 있으려면 그룹 간 분산(분자)이 커야하는 건 알겠는데, 그룹 내 분산(분모)은 왜 연관이 되는지 잘 모르겠습니다.. 어차피 평균이 차이가 나면 각 그룹들 분산이 아무리 좁아진들 어차피 차이는 그대로 나는 거 아닌가요..?ㅠ
평균간 차이를 분포들의 표준오차로 나눈 값으로 통계적 차이를 보기 때문에 분모 값이 작아지는 것이 의미가 있는 것입니다. 반대로 생국해서 단순 평균간 차이가 나더라도 분산이 너무 크면 두 분포를 과연 구분할 수 있을까를 생각해보시면 답이 나올지도 모르겠네요
@@AngeloYeo 정말 감사합니다. 추가로 의문이 생겨서 여쭤보려고 했는데 블로그에 놀라울 정도로 깔끔하게 정리해두셨네요.. 존경합니다ㅠ 많이 보고 배우겠습니다!
굿
선생님, 안녕하세요. 강의 잘 들었습니다. 저는 분자생물학을 전공하고 있는 대학원생입니다. 선생님 강의들이 통계분석에 참 많은 도움이 되었습니다. 당장이라도 찾아가서 뽀뽀하고 싶네요.
이 동영상 관련하여 몇가지 질문 드리고 싶은게 있습니다.
1. F value나 T value를 사용하기 위해서 정규성 검정과 등분산 검정이 이루어져야 하는 것이 맞나요?
2. 선생님께서는 F value나 T value를 구하기 위해 표본의 s.e.m. 값을 활용하셨는데, s.d.로 value를 구하고 사람들이 알 수 있게 표기만 해 놓으면 괜찮은 것인가요?
감사합니다.
안녕하세요.
1. 맞습니다.
2. 안됩니다. 표준오차와 표준편차는 다른 개념입니다.
@@AngeloYeo 선생님, 답변 대단히 감사합니다. 사랑합니다... 구원자세요..
물론입니다. s.d.는 표본들의 표준편차고, s.e.m은 표본 평균의 표준오차죠!
이렇게 여쭤보는 이유는 제가 생물학 논문들을 읽다보면 s.d.로 t-test를 하는 경우가 많기 때문입니다.(아니면 제가 해석을 잘못하고 있는 것일 수도 있습니다)
저는 정석이 궁금합니다.
예를들어, 감기약 실험을 한다고 하면,
감기 걸린 일반인들 20명에서 10명은 컨트롤 그룹으로 두고 감기약을 먹는 사람은 10명으로 두어 회복하는 시간을 기록했습니다. (모집단이 두 개: 컨트롤, 감기약)
그럼 컨트롤 그룹의 회복시간을 평균한 값, 그리고 감기약을 먹는 그룹의 회복시간을 평균한 값 이 나오죠.
여기서 실험의 신뢰도를 높히기 위해서는 (가장 효율적인 방법이라고 생각되는 방법을 말씀드리면)
-> 각 그룹의 표본값을 부트스트랩(1,000번 다시 뽑음)하여 수 많은 표본 평균을 구한 값으로 정규성검정, 등분산검정하여 t-test와 anova를 실시한다. (정규성검정 or 등분산검정에서 모집단의 분포가 정규분포가 아니라고 판명된 경우 비모수검정을 실시한다)
각 그룹 표본 평균의 신뢰구간이 95라고 하고 유의수준을 0.05로 두었을 때, p-value가 0.05 보다 작을 경우
(그래프의 에러바는 s.e.m.으로 표시)
우리는 감기약이 두 그룹간 유의적 차이를 만들어 낸다고 할 수 있을까요?
@@wittgensteinludwig8944 😁 별말씀을요 댓글 감사합니다
@@AngeloYeo 선생님!! 제가 대댓글에 질문 남겼는데 확인해 주실 수 있으십니까!!
@@wittgensteinludwig8944 거의 맞습니다 s.d. 는 표본들의 표준편차이고 s.e.m 은 표본 평균의 표준편차입니다.
그룹이 2개인데 t-test로 안하고 실수로 f로 돌렸어요. 이때 나온 분산분석의 유의확률이 0.001, 0.008 이랬는데 그대로 쓰면 크게 문제가 되나요? (spss를 쓰려면 또 학교에 가야 하는데 제출기한 전까지 갈 일이 없어서요ㅠㅠ)
그룹이 두 개인 경우에는 anova의 f와 t는 동일한 역할을 하긴 합니다. 다만 등분산 가정이 성립할 때만 그렇긴한데... f를 쓰더라도 크게 문제는 없을 것 같아요
@@AngeloYeo 답변 감사합니다!!
FBI WARNING이라니...
warning계의 국룰 아니겠습니까... 🤣
@@AngeloYeo ㅋㅋㅋㅋ 그렇죠
다음주 토요일이 시험이라 영상은 다음에 보도록 하겠습니다 ㅠㅠ
넵 편하게 보세요 ㅎㅎ
Anova분석을 하려면 최소 몇 케이스는 돼야 하나요?
그룹 가운데 한 그룹이 30케이스가 안되는데 가능할까요
30정도면 충분할 것 같은데요. 정확히 확인하려면 정규성 검정을 수행해보시기 바랍니다.
방학 끝내고 왔더니 분산은 이미 뇌에서 삭제 ㅜ Arrr 통계....
힘내세요... 또르르...
Hi, I’m Korean student. I request manifold learning. And when do you want to go megastudy? haha
매니폴드 러닝 영상으로 만들어볼지 한번 고민해보겠습니다. 만약 한다면 t-SNE만 다루게 될 것 같습니다. 다른 것들은 거의 사장되었다시피 해서...
오호 t-SNe 정말 감사합니다. 연구하시는 전공이 어느쪽일지 매우 궁금합니다. 나중에라도 QnA 같은걸 해주실 의향도 있으실지요. 해외 유명 통계 강의들보다 5배는 유익합니다..
ㅎㅎ 저는 연구를 주로 하는 것은 아니고 일반 회사원입니다. QnA는 예전에 한 적 있었는데 QnA 를 라이브로라도 한번 해야겠네요 ㅋㅋ
선생님 강의 잘 듣고 있습니다. 혹시 분산분석에서 Mean Square의 기대값 E(V)를 어떻게 계산하는지 쉽게 설명해 주실 수 있는지 문의드립니다. 인터넷에 나와 있는 자료들을 살펴보았지만, 도저히 이해가 되지 않네요 T.T
여기서 말하는 F가 F-value 인가요?
네 맞습니다
@@AngeloYeo 감사합니다!
대학원생 ㅋㅋㅋㅋ