Кирилл, Вы гений!! Это прям очень доступно! Ну очень! От такой базы уже можно плясать дальше, это вот что-то на уровне Бояршинова может быть даже выше!!
Кирилл, если бы мой препод по статистике был такой как Вы, я бы сейчас не мучался при необходимости оценки статистических данных. А наш препод был нудный и скучный. Спасибо Вам. Лайк и подписка. Однозначно.
Если у вас не получается такое же число, как у автора ролика при подсчёте стандартного отклонения, то значит вы, как и я, не знаете разницу между стандартным отклонением по выборке и по генеральной совокупности. Отклонение по генеральной совокупности более точный показатель. Чтобы получить значение вам надо делить сумму отклонений не на n, где n - объём выборки, а на n-1.
Добрый день, спасибо за Ваше видео! Я смогла понять, как высчитывать и интерпретировать критерий для расчетов в диссертации При этом я лингвист) Очень доступно и понятно)
Очень хорошо снято и разборчиво, хотелось бы увидеть видео о других критериях. И если есть возможность, добавлять примеры работая в программе Statistica
1) Каждое значение в таблице с исходными данными уже является средним по огромной выборке. Таким образом, правильное значение p отличается от полученного на несколько порядков (!) 2) Довольно ожидаемо, что вектор данных за 1914 год сильно скоррелирован с вектором данных за 2014 год (коэффициент корреляции Пирсона = 0.394), а значит до требуемой независимости групп тут очень далеко. В таких случаях лучше посчитать разности (Russia2014 - Russia1914; Germany2014 - Germany1914; и т.д.) и посмотреть на их распределение 3) Отсутствие проверки равенства дисперсий, формулировка гипотез в терминах выборочных значений и оговорка 0.005 = 0.005%, о чём уже писали в комментариях, на этом фоне не выглядят ошибками
Есть люди которые могут читать письма теней . Есть люди которым нужно сделать что-либо , чтобы увидеть , не говоря уже о том, что нужно сделать чтобы разобраться в увиденном. Есть люди которым непроизвольно приходится наблюдать этот феномен. Он им понятен и доступен для понимания . Привет:)
Кирилл Отличное объяснение, мне очень понравилась, помоги мне обработать климатические данные это - атмосферные осадки, температура воздуха и относительная влажность воздуха по декадам в многолетнем разрезе. с уважением Эрмек Сабырович!
Кто экспериментировал интересно, хочется знать, что я не одна такая любознательная в подобных вопросах:)) Много лишних вопросов отнимают время, А хотелось бы чтобы все во время.
А как мы находим значение р, если обычно по нему в таблицах определяют t-критерий? Или мы смотрим наиболее приближённое значение с соответствующим числом степеней свободы? Но тогда становится непонятно, почему мы таким неявным способом ищем вероятность ошибки...
Среднеарифметическое значение для первого столбика равно 154,64. Остальные расчёты правильные. В конце идёт неправильная формулировка, а именно, p=0,05 - это и есть 5%. А вот полученное значение p=0,005 - это 0,5%.
Много собак "зарыто" по распределению Стьюдента и как мне подсказывает опыт - для 100% уяснения материала нужно откопать все, начиная с самых важных. А самая важная это суть, поэтому считаю необходимым объяснить заинтересованной публике - что же это за условности такие при использовании t-критерия - нормальность выборки и прочие без которых нельзя юзать критерий... Какая связь с нормальным распределением и зачем она нужна? Откуда взялась эта чудесная таблица с вероятностями? И как вообще Сэр Госсет додумался сравнивать несравнимое по ничтожно малым выборкам ЗЫ: Видосы зачетные :)
Без нормального знания мат. анализа в докапывание до сути лезть не стоит. Примерный уровень: трёхсеместровый курс нормального физфака или примата. Примерный ориентир навыков: умение работать с несобственными интегралами и интегралами с параметрами (включая многомерные случаи), способность воспроизвести строгие доказательства локальной и интегральной теорем Муавра-Лапласа.
У Вас в тексте: " Итак, t=3,78, степень свободы равна 8. Переходим в табличное значение и получаем р вероятность - вероятность равна 0,005. То есть вероятность того, что мы ошибаемся при констатации факта различия роста ранее и сейчас, крайне мала - это 0,005 %, не 5 %, а 0,005 %. То есть мы можем говорить с высокой долей достоверности того, что наш рост сейчас в XXI веке и 100 лет назад отличаются". Но критическое значение t (при p=0,05 для f=8) равно 2,306. Наш подсчитанный t=3,778. Так как рассчитанное значение критерия больше критического, делаем вывод о том, что наблюдаемые различия статистически значимы (уровень значимости р
Что делать, если данные не соответствуют нормальному распределению? У меня есть массив (локальные количественные оценки качества изображения) из нескольких сотен тысяч значений, которые не соответствуют нормальному распространению. Хочу провести их анализ
Хорошее видео, но разве на 8-й минуте про вероятность, там вероятность ошибки не 0,5%? И для T критерия вроде как нужно не нормальное распределение СВ, а нормальное рапределение средних выборок из ГС.
Как Вы вычисляли знаменатель в t? (Корень из суммы квадратов). Корень из 1,37^2 +1,56^2= Корень из 1,8769 + 2,4336= Корень из 4,3105 = 2,076, разве нет?
А вот это "вычесть двойку" это неизменяемая цифра ? У меня в двух выборках +4000 тысячи данных. Дначит складываем (4+4) - 2 делать ? и что получается цифра огромная ,и что у тебя за формула последня P(t и тд) и что в конце делать то ( ( (( (
Привет! Спасибо за видео. Не понял почему 0,005. В таблице напротив степени свободы 8 значение 2.306. И 3,78 как тогда к 0,005 применить... хм. Т.е. 3,78 - это вероятность того, что похожи две выборки (из максимума 100)? и это достоверно, с точностью 0,005?
2,306 это критическое значение t для 8 степеней свободы и alpha = 0.05 (two-tail). И если t_наблюдаемое (3,78) > t_крит(2,306), то отвергаем нулевую гипотезу. Соответственно 3,78 это не вероятность, а значение t-статистики, для которого при 8 степенях свободы p-value приблизительно равно 0,005. Можно вычислить в экселе =СТЬЮДЕНТ.РАСП.2Х(3,78;8), что даст 0.005388149 (если считать в долях) или 0.5388149% (если считать в процентах)
3 января, все жители страны в пьяном угаре. я в ужасе читаю "Наглядную мед.статистику" А.Петри, случайно наткнулся на ваше видео. спасибо! это просто , наглядно и легко!!!!!!!!!..пойду дальше буха...... праздновать
Здравствуйте, Кирилл! Спасибо за видео! Хорошо об'ясняете и смотритесь в кадре) Проконсультируйте, пожалуйста: 1. Могут ли быть разные уровни значимости (р
Прошу прощения, может быть я глупый, но мне неочевидно, что такое "табличные значения". Нельзя ли упомянуть, как называется волшебная таблица со значениями? И еще стоит поработать над презентацией, рассказываешь о формулах, сам загораживаешь их, говоришь "корень из суммы ошибок", а у самого написан корень из суммы КВАДРАТОВ ошибок, делишь на корень из размера выборки, а сам говоришь, что в знаменателе размер выборки... P.S. Если кто-то не понял что за таблицы, как и я то: "Таблица критических значений t-критерия стьюдента"
Объяснил хорошо, доходчиво. Было бы интереснее знать возраст людей и было бы интереснее результаты отдельно по мужчинам и женщинам . А то какие то лилипуты в 1914 году жили, да и в 2014 году что то ростом маловаты.
Кирилл, спасибо за доходчивое объяснение. Подскажите пожалуйста, какой метод статистической обработки можно применить для изучения организационно-штатной структуры? Спасибо.
В видео как-то криво рассказано. В таблице стьюдента указаны лишь критические значения. И проще было бы сказать, что если t_наблюдаемое = 3,78 оказалось больше t_крит = 2,306 (two-tail 0.05, df = 8), то мы отклоняем нулевую гипотезу. По таблице статистика t=3,78 при 8 степенях свободы находится между 0.01 (знач t=3.355) и 0.002 (знач t=4.501) (по крайней мере по таблице, которую я смотрел), из чего мы можем грубо предположить, что p-value для 3.78 находится где-то между 0.01 и 0.002 (что меньше alpha = 0.05) и отвергнуть нулевую гипотезу. Если хочется найти точное p-value для t_наблюдаемого, необходимо воспользоваться статистическими пакетами (или в том же экселе =T.DIST.2T(3.78,8) или СТЬЮДЕНТ.РАСП.2Х(3,78;8) на русском, что даст p-value 0.005388149)
Во- первых, при формулировании статистических гипотез нужно использовать параметры генеральной совокупности, а не конкретной выборки - о ней мы все знаем. Во вторых, не было сказано , что обозначает этот параметр t, а это расстояние между средними двух популяций, выраженное в сигма.
За час просмотра твоих роликов узнала больше, чем за семестр в универе. Спасибо. К экзамену готова😂
Когда хотела найти информацию для диплома, а нашла еще и горячего парня.
Повсюду извращенцы. То BDSM, то сапиосексуалы 😉
Вот согласна. Будто еще в душу каждый раз смотрит, даже кушать перед компьютером неловко становится. И на каком кадре не останови, везде идеально
ну вы поженились хоть?
@@КазимБерловский нет, даже не познакомились
@@psy_jam надо это исправить!
Предельно ясно, доходчиво и понятно. Огромное спасибо, Кирилл.
Видео нагляднее и информативнее, чем многие платные курсы. Спасибо!
Мне 31 год, с универа не занимался статистикой, вышматом, посмотрел видео (искал ответ на свой вопрос) -- такое удовольствие получил
Кирилл, Вы гений!! Это прям очень доступно! Ну очень!
От такой базы уже можно плясать дальше, это вот что-то на уровне Бояршинова может быть даже выше!!
Учусь в вузе на направлении "Статистика" и только благодаря вашему видео понял Т-критерий. Спасибо
Кирилл, если бы мой препод по статистике был такой как Вы, я бы сейчас не мучался при необходимости оценки статистических данных. А наш препод был нудный и скучный. Спасибо Вам. Лайк и подписка. Однозначно.
Кирилл, огромное спасибо. Вы мне очень помогли. Душанбе.
Благодарю Вас от всей Души!!! Вы педагог от Бога💜💜💜
Божечки, такой красивый и такой умный! Вот это сочетание! Кирилл, спасибо большое, Ты очень понятно объясняешь!
Как вам позвонить?
@@АлександраКогут-и4д мне позвони :3
Выбор критерия для исследования - очень жду! Спасибо!
Спасибо из солнечного Ташкента, Кирилл!
какой же класный, я полюбила слушать эти уроки. Такой класный человек.
Если у вас не получается такое же число, как у автора ролика при подсчёте стандартного отклонения, то значит вы, как и я, не знаете разницу между стандартным отклонением по выборке и по генеральной совокупности. Отклонение по генеральной совокупности более точный показатель. Чтобы получить значение вам надо делить сумму отклонений не на n, где n - объём выборки, а на n-1.
А ведь верно! Для выборки n -1 всегда считаем)
Спасибо большое за ваши видео. Все очень подробно, а самое главное просто рассказано про статистику!!!!
Я не знаю, посещает ли автор свой канал, но спасибо ему за хорошее объяснение.
Четко на 100%. И речь понятно. Вот еще бы Excel добавить.. и золото!
Спасибо Вам огромное, Кирилл!!! Очень помогли разобраться! Всё доходчиво и понятно!:)
Добрый день, спасибо за Ваше видео!
Я смогла понять, как высчитывать и интерпретировать критерий для расчетов в диссертации
При этом я лингвист)
Очень доступно и понятно)
я хоть и 9классник , но это мне очень нужно, спасибо тебе, дядя Кирилл!
а зачем это вам в 9ом классе?
@@mitchellherrington6039 чтобы за сборную казахстана писать IBO)
Спасибо, всё очень понятно и были даны ответы на все мои вопросы!!
Очень хорошо снято и разборчиво, хотелось бы увидеть видео о других критериях. И если есть возможность, добавлять примеры работая в программе Statistica
Спасибо большое, прекрасное и понятное видео. Нечасто такое встречаю, однозначно лайк и подписка
Классный мужик. Помог чуть увереннее себя чувствовать с t-распределением Стьюдента
Спасибо!
Очень понятное объяснение материала.
8:38 подскажите, это не оговорка? 0,005 ПРОЦЕНТОВ или 0,005 ЕДИНИЦ и это абсолютная величина и таким образом равна 0,5%?
Ух ваш канал находка, спасибо!
Искал информацию по p-value, а не по теме видео, но благодаря объяснению понял и это.
1) Каждое значение в таблице с исходными данными уже является средним по огромной выборке. Таким образом, правильное значение p отличается от полученного на несколько порядков (!)
2) Довольно ожидаемо, что вектор данных за 1914 год сильно скоррелирован с вектором данных за 2014 год (коэффициент корреляции Пирсона = 0.394), а значит до требуемой независимости групп тут очень далеко.
В таких случаях лучше посчитать разности (Russia2014 - Russia1914; Germany2014 - Germany1914; и т.д.) и посмотреть на их распределение
3) Отсутствие проверки равенства дисперсий, формулировка гипотез в терминах выборочных значений и оговорка 0.005 = 0.005%, о чём уже писали в комментариях, на этом фоне не выглядят ошибками
Ты такой молодец)Мне гуманитарию стало это понятно))Спасибо)
Так все подробно, про Error bar не знал, спасибо)
хороший ролик, многовато оговорок, но видно что это оговорки, а не фундаментальные ошибки, так что в целом материал понятен, спасибо!
Просто оставлю тут своё СПАСИБО)
Спасибо большое, очень помог, просто и понятно, палец вверх!
Благодарю, очень всё доступно и понятно.
Спасибо большое! все очень понятно и кажется просто))
огромное спасибо!
Есть люди которые могут читать письма теней . Есть люди которым нужно сделать что-либо , чтобы увидеть , не говоря уже о том, что нужно сделать чтобы разобраться в увиденном.
Есть люди которым непроизвольно приходится наблюдать этот феномен.
Он им понятен и доступен для понимания .
Привет:)
Кирилл Отличное объяснение, мне очень понравилась, помоги мне обработать климатические данные это - атмосферные осадки, температура воздуха и относительная влажность воздуха по декадам в многолетнем разрезе. с уважением Эрмек Сабырович!
Кто экспериментировал интересно, хочется знать, что я не одна такая любознательная в подобных вопросах:))
Много лишних вопросов отнимают время,
А
хотелось бы чтобы все во время.
А как мы находим значение р, если обычно по нему в таблицах определяют t-критерий? Или мы смотрим наиболее приближённое значение с соответствующим числом степеней свободы? Но тогда становится непонятно, почему мы таким неявным способом ищем вероятность ошибки...
Среднеарифметическое значение для первого столбика равно 154,64. Остальные расчёты правильные. В конце идёт неправильная формулировка, а именно, p=0,05 - это и есть 5%. А вот полученное значение p=0,005 - это 0,5%.
Отличное видео!
Много собак "зарыто" по распределению Стьюдента и как мне подсказывает опыт - для 100% уяснения материала нужно откопать все, начиная с самых важных. А самая важная это суть, поэтому считаю необходимым объяснить заинтересованной публике - что же это за условности такие при использовании t-критерия - нормальность выборки и прочие без которых нельзя юзать критерий... Какая связь с нормальным распределением и зачем она нужна? Откуда взялась эта чудесная таблица с вероятностями? И как вообще Сэр Госсет додумался сравнивать несравнимое по ничтожно малым выборкам
ЗЫ: Видосы зачетные :)
Без нормального знания мат. анализа в докапывание до сути лезть не стоит. Примерный уровень: трёхсеместровый курс нормального физфака или примата. Примерный ориентир навыков: умение работать с несобственными интегралами и интегралами с параметрами (включая многомерные случаи), способность воспроизвести строгие доказательства локальной и интегральной теорем Муавра-Лапласа.
Спасибо) доступно и интересно. А главное не нудно
4:30 вот только с чего мы взяли, что группы независимы? Ведь речь идет об одних и тех же странах
Отличное изложение, спасибо большое!
Спасибо вам за ценную информацию
я хоть и гуманитарий, но все понял :) спасибо за видео!
Очень полезное и информативное видео
Очень наглядно! Спасибо!
Спасибо !
Супер!
Спасибо большое за понятные объяснения. Единственное, за вами плохо видно записи на доске, некоторые совсем не попадают в кадр.
Спасибо, Валерия! В следующем выпуске сделаю визуализацию нагляднее!
У Вас в тексте: " Итак, t=3,78, степень свободы равна 8. Переходим в табличное значение и получаем р вероятность - вероятность равна 0,005. То есть вероятность того, что мы ошибаемся при констатации факта различия роста ранее и сейчас, крайне мала - это 0,005 %, не 5 %, а 0,005 %. То есть мы можем говорить с высокой долей достоверности того, что наш рост сейчас в XXI веке и 100 лет назад отличаются".
Но критическое значение t (при p=0,05 для f=8) равно 2,306. Наш подсчитанный t=3,778. Так как рассчитанное значение критерия больше критического, делаем вывод о том, что наблюдаемые различия статистически значимы (уровень значимости р
Аллах благословит вас
Что делать, если данные не соответствуют нормальному распределению?
У меня есть массив (локальные количественные оценки качества изображения) из нескольких сотен тысяч значений, которые не соответствуют нормальному распространению. Хочу провести их анализ
Круто.Спасибо большое
Немного не понятен момент, когда объясняется p значение. Оно должно быть равно 0.005, что равно 0.5%, а не 0.005%, как сказано в видео.
Дайте мне формулу Т-критерия Стьюдента для зависимых выборок, пожалуйста. В каком печатном издании она содержится?
Спасибо большое!
Спасибо, спасибо, спасибо!!!!
Спасибо, наконец-то нормально объяснили
Хорошее видео, но разве на 8-й минуте про вероятность, там вероятность ошибки не 0,5%? И для T критерия вроде как нужно не нормальное распределение СВ, а нормальное рапределение средних выборок из ГС.
как можно сделать оценку достоверности прогнозной части временного ряда? на сколько% прогноз достоверен по лагам
Как Вы вычисляли знаменатель в t? (Корень из суммы квадратов). Корень из 1,37^2 +1,56^2= Корень из 1,8769 + 2,4336= Корень из 4,3105 = 2,076, разве нет?
Кирилл привет, такой вопрос - в расчете t =3.78, но затем в error bar chart при подсчете t*Mr, t=2. Или это разные t ?
на 2.20 минуте оговорка "о возрасте". Вы имели ввиду "рост"?
спасибо большое.
оба SD посчитаны не правильно. На глаз видно, что около 2, а не 3. И дальше не правильно
А что делать, если мы хотим сделать ttest и найти p-value для зависимых групп, к примеру оценить влияние на одних и тех же людях какого-то препарата?
Привет! Спасибо, что смотрите для этого есть отдельный тест Стьюдента для связанных групп
Молодец 👏🏼
А что если пересекаются прямые в графике эрреб бар чарт немного
"Пять тысячных" (т.е. полпроцента) или, как вы говорите, "пять тысячных процента" (т.е. если считать от единицы 0,00005)?
корелляцию объясните пожалуйста
А вот это "вычесть двойку" это неизменяемая цифра ? У меня в двух выборках +4000 тысячи данных. Дначит складываем (4+4) - 2 делать ? и что получается цифра огромная ,и что у тебя за формула последня P(t и тд) и что в конце делать то ( ( (( (
8:25 Мы же проверяем H0: X1 = X2, почему тогда полученое p трактуем, как имеющее отношение к H1: X1 =/= X2 ? Не совсем понял данный переход.
0 гипотеза, наоборот, должна противоречить основной гипотезе. Мы пытаемся доказать 1 гипотезу.
Привет! Перелейте, пожалуйста, видео на рутуб.
То есть по сути достаточно построить Box-plot?)
Привет! Спасибо за видео. Не понял почему 0,005. В таблице напротив степени свободы 8 значение 2.306. И 3,78 как тогда к 0,005 применить... хм.
Т.е. 3,78 - это вероятность того, что похожи две выборки (из максимума 100)? и это достоверно, с точностью 0,005?
Мне тоже не понятно. Он наверное проскакивал
2,306 это критическое значение t для 8 степеней свободы и alpha = 0.05 (two-tail). И если t_наблюдаемое (3,78) > t_крит(2,306), то отвергаем нулевую гипотезу.
Соответственно 3,78 это не вероятность, а значение t-статистики, для которого при 8 степенях свободы p-value приблизительно равно 0,005. Можно вычислить в экселе =СТЬЮДЕНТ.РАСП.2Х(3,78;8), что даст 0.005388149 (если считать в долях)
или 0.5388149% (если считать в процентах)
3 января, все жители страны в пьяном угаре. я в ужасе читаю "Наглядную мед.статистику" А.Петри, случайно наткнулся на ваше видео. спасибо! это просто , наглядно и легко!!!!!!!!!..пойду дальше буха...... праздновать
вообще то: m = Sd / корень из (n-1) , тк n
"Переходим в табличное значение и получаем р вероятность - вероятность равна 0,005. " где эти таблици, как мы к ним переходим, деление не помогает
Здравствуйте, Кирилл! Спасибо за видео! Хорошо об'ясняете и смотритесь в кадре)
Проконсультируйте, пожалуйста:
1. Могут ли быть разные уровни значимости (р
Спасибо) На твоих видео готовлюсь к пересдаче по методологии. Была бы моя воля, я б женился на тебе
Супер!!!!
Без твоих видео, мне была бы жопа, со всей этой статистикой. )
Прошу прощения, может быть я глупый, но мне неочевидно, что такое "табличные значения". Нельзя ли упомянуть, как называется волшебная таблица со значениями? И еще стоит поработать над презентацией, рассказываешь о формулах, сам загораживаешь их, говоришь "корень из суммы ошибок", а у самого написан корень из суммы КВАДРАТОВ ошибок, делишь на корень из размера выборки, а сам говоришь, что в знаменателе размер выборки...
P.S. Если кто-то не понял что за таблицы, как и я то:
"Таблица критических значений t-критерия стьюдента"
как Вы нашли значение "p"?
Хороший ролик. Я так понял T-критерий для двух, а для большего числа используют дисперсионный анализ?
Объяснил хорошо, доходчиво. Было бы интереснее знать возраст людей и было бы интереснее результаты отдельно по мужчинам и женщинам . А то какие то лилипуты в 1914 году жили, да и в 2014 году что то ростом маловаты.
Кирилл, что будет если выборки частично пересекаются?
спасибо за ваши видео, супер понятные, одно но, не выношу звука фломастеров на бумаге (((, брррррррррррррррр
спасибо!
а как понять нормальное ли распределение в группе?
Кирилл, спасибо за доходчивое объяснение. Подскажите пожалуйста, какой метод статистической обработки можно применить для изучения организационно-штатной структуры? Спасибо.
В таблице стьюдента нет значения 0,005! При степени свободы 8 и 5% показывает на 2,306… я чего то не понимаю? Объясните прошу
В видео как-то криво рассказано. В таблице стьюдента указаны лишь критические значения. И проще было бы сказать, что если t_наблюдаемое = 3,78 оказалось больше t_крит = 2,306 (two-tail 0.05, df = 8), то мы отклоняем нулевую гипотезу.
По таблице статистика t=3,78 при 8 степенях свободы находится между 0.01 (знач t=3.355) и 0.002 (знач t=4.501) (по крайней мере по таблице, которую я смотрел), из чего мы можем грубо предположить, что p-value для 3.78 находится где-то между 0.01 и 0.002 (что меньше alpha = 0.05) и отвергнуть нулевую гипотезу.
Если хочется найти точное p-value для t_наблюдаемого, необходимо воспользоваться статистическими пакетами (или в том же экселе =T.DIST.2T(3.78,8) или СТЬЮДЕНТ.РАСП.2Х(3,78;8) на русском, что даст p-value 0.005388149)
ПОЧЕМУ в универах так не объясняют?? Все бы все знали и прекрасно делали! Нет, надо делать умные щи и какие-то пыльные книжки советовать.
Во- первых, при формулировании статистических гипотез нужно использовать параметры генеральной совокупности, а не конкретной выборки - о ней мы все знаем. Во вторых, не было сказано , что обозначает этот параметр t, а это расстояние между средними двух популяций, выраженное в сигма.
Спасибо. Дикция хорошая, артикуляция есть. Какие упражнения используете? ) (Интересует для работы)