На 6:45 говорится, что увеличение выборки с 10 до 20 человек даст большее снижение стандартной ошибки среднего, чем увеличение выборки с 100000 до 200000 человек. Что неверно, так как в обеих случаях ошибка среднего унизится в \sqrt{2}...
Ребят - не могли бы Вы мне внести некоторую ясность. В формуле спикера, на мой взгляд, есть некоторая неточность - НА МОЙ взгляд, а именно - при вычислении стандартной ошибки, в числителе стоит сигма, т.е. стандартное отклонение генеральной совокупности, т.е. собственно параметр, КОТОРЫЙ делится на корень из счета выборки. НО! разве в числителе не должно стоять стандартное отклонение ВЫБОРКИ, т.е. статистки. Просто стандартное отклонение генсовокупности - это как раз цель расчета, посредством приближенного вычисление стандартного отклонения выборки (Sx) на корень из счета выборки. Можете меня поправить, если я неверно понял?! Спасибо заранее.
А в случае стратифицированной выборки, когда мы оцениваем среднее, N в знаменателе, это количество классов (по которым мы сгруппировали -- mobile, web, ...) или количество пользователей всего? И как в таком случае оценивать дисперсию: в пределах класса или по всей совокупности? Просто по-другому посчитав среднее дисперсия не уменьшиться, разве не так?
...и потом считали бы взвешенное среднее, то средние выборочные были бы одинаковы в среднем, но дисперсия выборочных средних... tom, while den had had had had had had had had had had had a better effect on the teacher
Подскажите. Анатолий говорит, что дисперсия выборки всегда меньше дисперсии генеральной совокупностию. Допустим генеральная совокупность состоит из 10 человек, рост людей. Столько людей осталось на земле. 180, 170, 175, 168, 172, 173, 179, 181, 175, 174. Отсюда возьмем выборку 180, 175, 168, 175, 174. Посчитаем дисперсию с учетом деления на n-1 и получим, что дисперсия по выборке стала больше, чем дисперсия по генеральной совокупности.
Ну скажем так, обычно меньше, или, если еще точнее, то при многократных выборках выборочная дисперсия будет стремиться к значению, меньшему, чем значение дисперсии ген. совокупности. Например мы можем взять выборку 180, 175, 168, 174, и у нее дисперсия будет больше без всякого деления на n-1, но в среднем при многократных выборках она будет стремиться к меньшему значению. Тут суть в том, что дисперсия это сумма квадратов разностей между каждым элементом выборки и выборочным средним (деленная на кол-во элементов), и так получается, что если вместо выборочного среднего подставить любое другое значение (в том числе и среднее генеральной совокупности), то итоговое выражение уже будет больше. А значит при многократных выборках среднее будет стремиться к истинному среднему, а вот дисперсия будет несколько занижена по сравнению с истинной.
Анатолий Карпов просто супер! Курс на степике от него крайне рекомендую, мастхэв начинающим
На степике там 1000 и 1 ошибка
Там не очень курс. Он не объясняет формулы и значения
Спасибо за материал! Очень полезно.
Анатолий всегда на высоте)
На 6:45 говорится, что увеличение выборки с 10 до 20 человек даст большее снижение стандартной ошибки среднего, чем увеличение выборки с 100000 до 200000 человек. Что неверно, так как в обеих случаях ошибка среднего унизится в \sqrt{2}...
Очень классный презентующий, просто супер!
Спасибо большое. Готовлюсь к собесу. прям круто.
Отличное объяснение, спасибо!
Ребят - не могли бы Вы мне внести некоторую ясность. В формуле спикера, на мой взгляд, есть некоторая неточность - НА МОЙ взгляд, а именно - при вычислении стандартной ошибки, в числителе стоит сигма, т.е. стандартное отклонение генеральной совокупности, т.е. собственно параметр, КОТОРЫЙ делится на корень из счета выборки. НО! разве в числителе не должно стоять стандартное отклонение ВЫБОРКИ, т.е. статистки. Просто стандартное отклонение генсовокупности - это как раз цель расчета, посредством приближенного вычисление стандартного отклонения выборки (Sx) на корень из счета выборки. Можете меня поправить, если я неверно понял?! Спасибо заранее.
Мне кажется, все так как ты описал, стандартная ошибка среднего рассчитывается на основе стандартного отклонения по выборке
@@aleksandrsmurov5135 СПАСИБО! А то я даже разуверился в верности тех базовых понятий, которые я думал-таки уловил из универа...
@@АндрейТимонин-ч6к можешь просто загуглить для уверенности, там информация вполне доступная, много сайтов с формулами
А в случае стратифицированной выборки, когда мы оцениваем среднее, N в знаменателе, это количество классов (по которым мы сгруппировали -- mobile, web, ...) или количество пользователей всего? И как в таком случае оценивать дисперсию: в пределах класса или по всей совокупности? Просто по-другому посчитав среднее дисперсия не уменьшиться, разве не так?
не "наверху" и "внизу", а в числителе и в знаменателе
...и потом считали бы взвешенное среднее, то средние выборочные были бы одинаковы в среднем, но дисперсия выборочных средних...
tom, while den had had had had had had had had had had had a better effect on the teacher
Тестовый комментарий
T-критерий превратился в p-value?
Кто это?
«И поэтому внизу корень» - почему, бл*ть, поэтому? Вообще не следит за тем, что говорит, где логика?
слов много, толку мало, где практика, формулы во второй части?
Кому как.
Подскажите. Анатолий говорит, что дисперсия выборки всегда меньше дисперсии генеральной совокупностию. Допустим генеральная совокупность состоит из 10 человек, рост людей. Столько людей осталось на земле. 180, 170, 175, 168, 172, 173, 179, 181, 175, 174. Отсюда возьмем выборку 180, 175, 168, 175, 174. Посчитаем дисперсию с учетом деления на n-1 и получим, что дисперсия по выборке стала больше, чем дисперсия по генеральной совокупности.
Ну скажем так, обычно меньше, или, если еще точнее, то при многократных выборках выборочная дисперсия будет стремиться к значению, меньшему, чем значение дисперсии ген. совокупности. Например мы можем взять выборку 180, 175, 168, 174, и у нее дисперсия будет больше без всякого деления на n-1, но в среднем при многократных выборках она будет стремиться к меньшему значению. Тут суть в том, что дисперсия это сумма квадратов разностей между каждым элементом выборки и выборочным средним (деленная на кол-во элементов), и так получается, что если вместо выборочного среднего подставить любое другое значение (в том числе и среднее генеральной совокупности), то итоговое выражение уже будет больше. А значит при многократных выборках среднее будет стремиться к истинному среднему, а вот дисперсия будет несколько занижена по сравнению с истинной.