영상 감사합니다. 늘 궁금했던 것이 만약 모집단이 저 서울의 집값처럼 positive skew 분포를 하고 n이 10만일 때, 표본의 n을 30 정도가 아니라 9만정도까지 올린다고 하면, 그래도 표본은 정규분포를 따를까요? 중심극한정리라는 것이, 표본의 n을 늘리면 표본의 평균이 모집단의 "평균"에 근사한다는 것인지 아니면 모집단 분포의 "모양"에 근사한다는 것인지 전문가분께 여쭤보고 싶었습니다.
아 그게여.. 정규분포가 된다는게 핵심이에여. 모분포가 어떤 분포라도 샘플크기가 30이상되면 그 샘플의 평균의 분포가 정규분포가 된다는 겁니다. 이게 왜 그러냐면 정규분포가 분포계의 명품입니다 명품 중의 명품. 에르메스라고 보면 되겟습니다. 근데 모집단 분포가 스큐가 된 ㅂㅅ 같은 분포여도 (옷으로 치면 경동시장 바닥에서 3벌에 만원 하는 거) 샘플사이즈가 30만 넘어가면 그 평균의 분포가 명품이 된다는 개쩌는 이론이 중극정리입니다
전 영상에서 제가 확실하게 이해 못한 부분이 동전 N회를 던졌을 때 앞면이 나오는 횟수가 N/2로 나눈 값(평균)을 중앙으로 정규분포 형태를 띄는 것인데 당연히 평균은 정규 분포를 따르다 보니 ... 조금 이해가 덜 된것 같았습니다. 이번 영상에서 아파트 가격의 분포처럼 정규분포 형태가 아니더라도 여러 번 샘플링(표집)을 하면 평균(표집평균)은 정규분포 형태를 따른다(수렴한다). 제가 똑바로 중심극한 정리를 이해한 것이 맞습니까?
음... 제가 알던 내용과 차이가 있어서 질문드립니다. 중심극한정리가 단일한 표본의 크기만 늘리면 그 표본의 평균이 정규분포를 따른다는 것일까요? 표본의 크기도 늘리고 각 표본을 여러번 샘플링 했을때 그 평균이 정규분포를 따른다는 걸까요? 저는 후자로 이해하고 있는데 설명을 듣다보니 전자로 들리는 것 같아서 질문드립니다.
@@asdf7722 분포라는게 2가지의 유형이 있는 것 같은데 맞나요? 1. 데이터의 분포 (모집단 분포) 2. 샘플평균의 분포 (=표본분포) 분포라는게 그냥 좌표상에 데이터를 찍는거지만, 저 두가지가 같이 있으니깐 의미가 헷갈리더라구요 ㅋㅋ;; 그래서 정리하자면, 중심극한정리의 원리는 표집을 할 때 확률이 낮은 데이터는 잘 안 걸리므로 표본평균이 모평균에 가까운 표본들이 많이 나오고, 혹시나 확률이 낮은 데이터가 많이 포함된 특이한 케이스의 표본은 적게 나와서, 결국 정규분포를 띄게 되는건가요?
정말 정신없이 극한정리1과 2를 보았습니다, 적절한 예시와 설명이시네요. 감사합니다!!
제가 아직 이해를 잘 못한건지 모르겠습니다. 두 선택지 중 기댓값(평균) 은 같으니 결국 어떤 선택이 더 좋은게 없는 것인가요?
기대값은 같지만 배리언스는 다르니까 한번만 선택하라고 하면 중심에 몰려잇는 분포에서 선택할 수록 기대값 근처의 값이 표집됩니다
안녕하세요? 원의 성질?도 영상한번 부탁드려요.
넹
뱁새당
재미 있어요. 👏
감사함니당
30건인 이유는 무엇인가요!
이거 저 약간 기억이 가물가물한데.. 최대한 간단하게 설명드리면.. 최소 샘플이 30은 되야 중심극한정리를 써먹을 수 있다.. 정도로 이해하시 될 것 같음다!
@@asdf7722 오 역시 명쾌한설명 감사합니다아!
영상 감사합니다. 늘 궁금했던 것이 만약 모집단이 저 서울의 집값처럼 positive skew 분포를 하고 n이 10만일 때, 표본의 n을 30 정도가 아니라 9만정도까지 올린다고 하면, 그래도 표본은 정규분포를 따를까요? 중심극한정리라는 것이, 표본의 n을 늘리면 표본의 평균이 모집단의 "평균"에 근사한다는 것인지 아니면 모집단 분포의 "모양"에 근사한다는 것인지 전문가분께 여쭤보고 싶었습니다.
아 그게여.. 정규분포가 된다는게 핵심이에여.
모분포가 어떤 분포라도 샘플크기가 30이상되면 그 샘플의 평균의 분포가 정규분포가 된다는 겁니다.
이게 왜 그러냐면 정규분포가 분포계의 명품입니다 명품 중의 명품. 에르메스라고 보면 되겟습니다.
근데 모집단 분포가 스큐가 된 ㅂㅅ 같은 분포여도 (옷으로 치면 경동시장 바닥에서 3벌에 만원 하는 거) 샘플사이즈가 30만 넘어가면 그 평균의 분포가 명품이 된다는 개쩌는 이론이 중극정리입니다
전 영상에서 제가 확실하게 이해 못한 부분이 동전 N회를 던졌을 때 앞면이 나오는 횟수가 N/2로 나눈 값(평균)을 중앙으로 정규분포 형태를 띄는 것인데
당연히 평균은 정규 분포를 따르다 보니 ... 조금 이해가 덜 된것 같았습니다.
이번 영상에서 아파트 가격의 분포처럼 정규분포 형태가 아니더라도 여러 번 샘플링(표집)을 하면 평균(표집평균)은 정규분포 형태를 따른다(수렴한다).
제가 똑바로 중심극한 정리를 이해한 것이 맞습니까?
완-벽 살짝만 더하면 정규분포가 아니더라도 여러번 샘플링을하고 그 샘플크기가 커지면 커질수록 정규분포를 따르고 그 정규분포의 평균은 모집단의 평균, 분산은 모분산을 샘플크기로 나눈 값이다.. 라고 덧붙이면 더욱 든든하겠습니다.
2부 기다렸어요~~~
결국 샘플링 기법을 사용하면 모수와는 다른 정규분포로 데이터가 정리 되는데 이러면 데이터를 왜곡 시키게 되는것 아닌가요?
제가 질문 이해를 못했는데 좀 더 쉽게 설명부탁드립니다
@@asdf7722 원래 모수 데이터는 비대칭 분포인데 샘플링을 하면 정규 분포가 되니 데이터에 왜곡이 일어나는게 아닌가 질문드렸습니다~
아 그쳐 근데 중심극한정리는 그 값에 대한 분포가 아니라 "그 값들의 평균"에 대한 분포에 대한 내용이라 왜곡은 없다고 생각하시면 됨니다~ 핵심은 "그 값들의 평균" 입니다! 그 값 자체가 아니라
뭐냐고 ~ 당신은 통계의 왕입니까?
음... 제가 알던 내용과 차이가 있어서 질문드립니다. 중심극한정리가 단일한 표본의 크기만 늘리면 그 표본의 평균이 정규분포를 따른다는 것일까요? 표본의 크기도 늘리고 각 표본을 여러번 샘플링 했을때 그 평균이 정규분포를 따른다는 걸까요? 저는 후자로 이해하고 있는데 설명을 듣다보니 전자로 들리는 것 같아서 질문드립니다.
아!! 음.. 이게 일단 최대한 간단하게 말씀드리면 n -> infinity 가 될 때 상황인데.. 이때 n은 평균낼 때 사용하는 확률변수의 표본크기입니다~ 여러번 샘플링하는건 분포를 만들어야되는까 당연히 하는 것.. 이라고 생각하시면 될 것 같습니다
@@asdf7722 아~ '분포'라는 키워드가 여러번 샘플링한 결과이기 때문에 '샘플링'은 이미 포함되는 것으로 보는게 맞네여. 아 그렇네~ ㅋㅋㅋ 바보 같은 질문이었네여 ㅋㅋㅋㅋㅋ 감사합니다~ n에 대한 설명도 감사합니다~ 이해됐습니다 ㅎㅎ
사실 내가 흠칫해서 다시 책 펴본건 둘만의 비밀로 합시다
근데 평균이 같으면 a, b 안의 기대수익은 동일한건가요?
질문을 잘 이해 못함여... ㅈㅅ 모평균을 말하는거심?
넵
표본평균부터 이해하고 오겠습니다 ㅋㅋ
ㄱㄱㄱ
@@asdf7722 분포라는게 2가지의 유형이 있는 것 같은데 맞나요?
1. 데이터의 분포 (모집단 분포)
2. 샘플평균의 분포 (=표본분포)
분포라는게 그냥 좌표상에 데이터를 찍는거지만, 저 두가지가 같이 있으니깐 의미가 헷갈리더라구요 ㅋㅋ;;
그래서 정리하자면, 중심극한정리의 원리는 표집을 할 때 확률이 낮은 데이터는 잘 안 걸리므로 표본평균이 모평균에 가까운 표본들이 많이 나오고, 혹시나 확률이 낮은 데이터가 많이 포함된 특이한 케이스의 표본은 적게 나와서, 결국 정규분포를 띄게 되는건가요?
ㅇㅇ 1번은 이제 우리가 전수 조사만를 해야만 아는 분포고 2번은 우리가 수집란 일부 데이터에 추상적인걸(중신극한정리에 의해 유도된) 더해서 만들어진 분포인거죠
중극정리는 이해하신 방향이 맞슴 디테일은 이제 수식을 좀 가져와야되는데 이정도면 이해하는 정도면 충분!
@@asdf7722 와, 감사합니다! 2~3번은 봐야 이해가 가네요 ㅋㅋ
덕분에 추석을 마음 편히 지낼 수 있을 것 같아요. (계속 새로운걸 더 볼텐지만 ㅎㅎ)
추석 연휴 잘 보내세요~~^^
들숨에 건강을 날숨에 재물을🙏
그럼 중심이란 표본평균(=모평균)을 의미하는 건가요?
넵
이해가 잘 되네요^^
교수님 수업을 들어도 이해가 안 갔는데 여기서 이해하고 갑니다 감사합니다
빛오터~~~
😊