여기서 한가지 질문은 n 을 무한대로 보내야지만 lim {(1+a/n)^(n/a)}^a 가 e^a 로 수렴한다고 하셨고 이를 식 안에 대입해야지만 Xbar의 MGF 가 정규분포의 MGF 와 같아지는데, 첫째, 사실 실제에서 추출하는 샘플사이즈 n 은 30보다 큰 수 예를 들어 100 혹은 500 등으로 무한대와는 거리가 멀고 (즉, n 을 무한대로 놓을 수 없고), 이럴때 n을 무한대로 보내야만 두 확률변수의 MGF가 같아지는 것이므로 무한대가 아닌 우리가 가지는 사이즈 n 으로는 이런 n을 무한대로 보낼때만 같아지는 (Xbar 의 분포가 정규분포가 된다고 말할 수 있는) 이 결론을 대입하기 어려운 것 아닌가요? 결론적으로 말해, n 이 무한대일때만 성립하는 식이 아닌가하는 것이 저의 질문입니다. n 이 무한대가 아니라면 절대 표본평균의 적률생성함수와 정규분포의 적률생성함수는 같아지지 않는것 아닌가요? 이해하기 어려운 것은 무한대일때 이런 등식이 성립하므로 n 이 증가할수록 이 등식에 가까워진다고 결론 내린 것 같은데 물론 100 보다 200이라면 200 이 무한대에 100보다 가깝지만 제 말은 200 이라도 위 첫째줄 식의 e^a 로 수렴하지 않는다는 것입니다. (즉, 보통의 통계학 책에서 기술하듯이, n 이 적당히 크다면 정규분포에 가까워진다라고 말할 수 없지 않을까 하는 생각이 듭니다. 적당히 커서는 안되고 거의 무한대에 가까워야 하는 것 아닌가...) 제 질문을 이해할 수 있도록 자세하게 쓰려고 노력했습니다.
n이 적당히 크면 정규분포로 근사할 서 있다고 통계책에 적혀있을겁니다. 근사는 "오차"를 갖고 있습니다. 실제 정규분포와 근사시킨 분포의 차이를 "오차"라고 둔다면. n이 커질 수록 이 오차가 작아지는 것입니다. 어느 정도 무시할 수 있는 수준의 오차를 허용하는 적당한 수가 30이라고 "알려져 있는"것이죠. 이 오차를 정량화해서 정말 무시할 수 있는 수준인지 통계적으로 판별하는 것이 정규성검정입니다. n이 무한대로 가야 등식이 성립하는 것은 맞습니다. 그럼 나머지는 다 성립하지 않느냐? 맞습니다 등식은 성립하지 않습이다. 오차를 떠안고 "근사"시키는 것입니다.
다른 강의 교안을 보다가 의문인 점이 생겨 여러 강의나 증명들을 보는데 다들 비슷하네요...자연대수 정의를 사용해서 (2)번 식에서 e^(mt+s²t²/2) 가는 부분에서 n분의 K가 너무 자연스럽게 없어지는 부분이 저한텐 어색하게 느껴집니다. 어떤 분은 n분의 K가 줄어드는 속도가 더 빠르다고 설명해주신 분도 있는데 왜 그런지가 궁금합니다.
글이 더 편하신 분
hsm-edu.tistory.com/26
이 강의에서 사용된 S는 표본분산이 아니라. 표본평균의 분산입니다.
표본분산이라고 잘못 말했네요.
표본평균의 분산이고. S라는 기호를 사용했습니다.
정주행중입니다. 정말 대단하십니다.
감사합니다^^
와 진짜 지금 제일 궁금했던건데 딱 이렇게 영상 올려주셨었네요 ㅠㅠ
감사하단 말씀 먼저 올리고 영상 시청하겠습니다
ㅁㅊ 내가 이런댓글을 썼다고?
천재이신가요.. 대단하십니다.
감사합니다^^
정말 정말 감사합니다.
진짜.......... 감사합니다..................... 절할게요......
감사합니다.
여기서 한가지 질문은
n 을 무한대로 보내야지만 lim {(1+a/n)^(n/a)}^a 가 e^a 로 수렴한다고 하셨고
이를 식 안에 대입해야지만 Xbar의 MGF 가 정규분포의 MGF 와 같아지는데,
첫째, 사실 실제에서 추출하는 샘플사이즈 n 은 30보다 큰 수 예를 들어 100 혹은 500 등으로 무한대와는 거리가 멀고 (즉, n 을 무한대로 놓을 수 없고), 이럴때 n을 무한대로 보내야만 두 확률변수의 MGF가 같아지는 것이므로 무한대가 아닌 우리가 가지는 사이즈 n 으로는 이런 n을 무한대로 보낼때만 같아지는 (Xbar 의 분포가 정규분포가 된다고 말할 수 있는) 이 결론을 대입하기 어려운 것 아닌가요?
결론적으로 말해, n 이 무한대일때만 성립하는 식이 아닌가하는 것이 저의 질문입니다. n 이 무한대가 아니라면 절대 표본평균의 적률생성함수와 정규분포의 적률생성함수는 같아지지 않는것 아닌가요?
이해하기 어려운 것은 무한대일때 이런 등식이 성립하므로 n 이 증가할수록 이 등식에 가까워진다고 결론 내린 것 같은데 물론 100 보다 200이라면 200 이 무한대에 100보다 가깝지만 제 말은 200 이라도 위 첫째줄 식의 e^a 로 수렴하지 않는다는 것입니다. (즉, 보통의 통계학 책에서 기술하듯이, n 이 적당히 크다면 정규분포에 가까워진다라고 말할 수 없지 않을까 하는 생각이 듭니다. 적당히 커서는 안되고 거의 무한대에 가까워야 하는 것 아닌가...)
제 질문을 이해할 수 있도록 자세하게 쓰려고 노력했습니다.
n이 적당히 크면 정규분포로 근사할 서 있다고 통계책에 적혀있을겁니다. 근사는 "오차"를 갖고 있습니다.
실제 정규분포와 근사시킨 분포의 차이를 "오차"라고 둔다면. n이 커질 수록 이 오차가 작아지는 것입니다.
어느 정도 무시할 수 있는 수준의 오차를 허용하는 적당한 수가 30이라고 "알려져 있는"것이죠.
이 오차를 정량화해서 정말 무시할 수 있는 수준인지 통계적으로 판별하는 것이 정규성검정입니다.
n이 무한대로 가야 등식이 성립하는 것은 맞습니다. 그럼 나머지는 다 성립하지 않느냐? 맞습니다 등식은 성립하지 않습이다. 오차를 떠안고 "근사"시키는 것입니다.
1:14
표본분산의 기대값이 시그마제곱이고
표본평균의 분산이 n분의 시그마제곱인데
왜 표본분산이랑 표본평균의 분산이랑 같나요?
앞의 강의까지 다 보고왔는데도 모르겠네요 ㅠ
표본평균의 분산이라는 의미로 사용한건데. 표본분산이랑 같은 기호를 써버렸네요. 말도 잘못하구요.ㅜ정정내용 댓글로 달겠습니다. 감사합니다
다른 강의 교안을 보다가 의문인 점이 생겨 여러 강의나 증명들을 보는데 다들 비슷하네요...자연대수 정의를 사용해서 (2)번 식에서 e^(mt+s²t²/2) 가는 부분에서 n분의 K가 너무 자연스럽게 없어지는 부분이 저한텐 어색하게 느껴집니다. 어떤 분은 n분의 K가 줄어드는 속도가 더 빠르다고 설명해주신 분도 있는데 왜 그런지가 궁금합니다.
저도 이부분을 두고 고민중입니다ㅠ아직까지 명쾌한 답을 못얻었습니다
그렇군요..답변 감사합니다. 아무래도 극한을 엄밀하게 정의해서 푸는게 맞지만 풀이가 상당히 까다로워서...통계강의에선 잘 안 다뤄주는 모양이에요. 통계 공부를 하다가 이런 문제를 접할 때 마다 답답하네요ㅠㅠ
직접 표본을 추출해서 그래프로 그려보면 중심극한정리가 성립하는걸 보일 수 있어서 확실히 맞는 정리이긴 한데요. 수식으로 완벽히 이해하고 싶은데 쉽지않네요. 고민하다보면 언젠가 알게되겠죠 ㅋ