Что такое значение p? /Простая статистика/

Простая Статистика

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 2 січ 2025

КОМЕНТАРІ • 57

@vladaslukenskas 4 роки тому ⁺¹⁶
Хоспаде, спасибо тебе, добрый человек! Наконец-то я понял.
@Gamezz-y9d 3 роки тому
Крутое видео!
Посмотри лучших канал с понятным объяснением сложных задач🤓❤️ ua-cam.com/video/MlxMJRZs3zg/v-deo.html
@nickchern392 4 роки тому ⁺¹⁴
Единственный канал, который смог за 6 минут навести порядок у меня в голове. Огромное тебе спасибо)
@Gamezz-y9d 3 роки тому
Крутое видео!
Посмотри лучших канал с понятным объяснением сложных задач🤓❤️ ua-cam.com/video/MlxMJRZs3zg/v-deo.html
@leonazg82 3 роки тому ⁺²
Большое спасибо! Это видео - уже пятый источник, из которого я пытался понять, что такое p-value. И понятнее всего оказалось ваше определение: "p-value - это вероятность совершить ошибку первого рода".
@ПростаяСтатистика 3 роки тому ⁺⁴
Если честно, то это не вполне корректное определение. Оно позволяет "в целом" понять, как происходит статистическая проверка гипотез, но содержит неточности, которые Вам помешают при дальнейшем погружении в предмет.
Я в скором времени проведу работу над ошибками и перезапишу данный ролик. А пока постараюсь объяснить "на пальцах".
На самом деле p-value - это вероятность получить результаты эксперимента в ситуации, когда в реальности нулевая гипотеза верна. Если мы ищем различия между группами, то р-value будет равняться вероятности получить такие различия, как мы получили в эксперименте, или более выраженные, набирая случайные выборки из популяции в которой на самом деле такие различия отсутствуют.
@Бутадиенчик 23 дні тому ⁺¹
Срочно! преподаватель по информатике спросил: оценить уровень статистической значимости вероятности что конкретно я из всей группы сдам коллоквиум на отлично, а остальные провалят и наоборот - я провалю, а остальные напишут на отлично
@ЮлияРублева-л6в 7 місяців тому
Спасибо за простой и краткий ответ. Для психолога в самый раз. О сложном простыми словами!
@Symon_Musician 2 місяці тому
Спасибо! Реально полезно и без воды.
@ЮлияРублева-л6в 7 місяців тому
Пожалуйста, расскажите для чего применяется угловое преобразование Фишера, сравнение средних значений U-критерия Маана Уитни, корреляции Спирмена, критерий Колмогорова Смирнова.
@ОльгаВойнова-щ8щ Місяць тому
Спасибо! Очень круто
@ОвечкинДенисВячеславович 2 роки тому
Большое спасибо!! Все реально понятно и доступно рассказано!
@shahnozatursunzoda6261 3 роки тому
Все очень понятно рассказали. Спасибо!
@zarysan Рік тому
Лучшее видео по теме
@Terrayko 3 роки тому
Спасибо, отлично объясняете материал!
@МаксимПанков-о1я 2 роки тому
Спасибо за классное объяснение!)
@tinakaro4345 7 років тому ⁺⁵
Очень доступные для понимания видео, спасибо Вам огромное! Не могли бы Вы снять видео о критерие Стьюдента, мне бы очень помогло ) спасибо
@Gamezz-y9d 3 роки тому
Крутое видео!
Посмотри лучших канал с понятным объяснением сложных задач🤓❤️ ua-cam.com/video/MlxMJRZs3zg/v-deo.html
@НаталияКарпова-ъ8щ 5 років тому
Спасибо! Чётко, понятно и с хорошими примерами
@ВасилийПупкин-у7р5э 3 роки тому ⁺¹
Спасибо за видео!
@dmitryzabavin319 6 років тому ⁺²
Алексей, огромное спасибо за столь подробные объяснения! Но мне так и не ответили удается найти ответ на несколько принципиально важных вопросов. Буду очень вам признателен, если вы дадите на них ответ.
1) Правильно ли я понимаю, что все гипотезы могут быть классифицированы. И для каждого класса гипотез существует особый метод вычисления статистической значимости?
2) Что такое статистический критерий? Это просто функция, применяемая к выборке? Одно ли значение для определенной выборки возвращает эта функция или она порождает какое-то новое распределение на основе данных выборки? Или формулы статистических критериев - это и есть формулы для вычисления p-value. То есть, каков алгоритм вычисления p-value: мы сначала применяем к выборке какую-то функцию, а потом, по ее результатам ищем p-value, или на первом же шаге вычисляем p-value, используя правильную функцию?
3) Существует миллион презентаций и видео о том, как отвергаются гипотезы (отсекаются "хвосты" с маловероятными значениями), но ни в одном из них не надписана вертикальная ось. Что на ней откладывается: вероятность значения в рамках выборки или значение какой-то функции, примененной к значениям выборки, или, вообще, некое идеальное распределение, которому, как мы предполагаем, подчиняются данные в генеральной совокупности? Почему, вообще, мы отсекаем именно маловероятные значения? Где здесь логика? Нигде не нашел объяснения.
4) Откуда взялись формулы этих функций (статистических критериев)? Какой логикой руководствовались их авторы? Это особенно важный вопрос - нигде не смог найти внятных объяснений. Например, для нас вполне прозрачна логика Евклида или Пифагора, а происхождерие формул для статистических критериев совершенно неизвестно.
5) Каким образом может быть оценена вероятность ошибки первого рода? Ведь, чтобы оценить ее, насколько мне представляется, нужно обладать объективной оценкой генеральной совокупности. Или при оценке мы исходим из того, что данные "должны" быть распределены определенным образом? Откуда тогда у нас может взяться уверенность, что данные нам что-то "должны"?
6) К какому типу гипотез относится, например, классический А/Б тест на каком-нибудь сайте? Мы показываем скольким-то пользователям кнопку "Купить" зеленого цвета, а остальным - синего. И смотрим, на какую из них чаще нажимают. Как при этом учитывается, что наши пользователи обладают еще огромным количеством дополнительных параметров: возраст, пол, город проживания, область интересов - и т.д. (допустим, что эти данные нам известны)? Было бы бесценно рассмотреть такой пример! Особенно, если редположить, что полученные нами различия в частоте нажатия на зеленую и синюю кнопку оказались, количественно, очень несущественными: например, на зеленую кнопку нажали 43% увидевших ее пользователей, а на синюю - 42%. Как оценить, можем ли мы утверждать, что зеленая кнопка, действительно, более привлекательна для посетителей сайта?
Буду очень признателен за любой ответ! Может, вы просто укажете, какие именно материалы стоит по этим вопросам почитать. Еще раз, огромное спасибо!
@ПростаяСтатистика 6 років тому ⁺⁴
Добрый день!
Попробую коротко ответить на Ваши вопросы.
1. Если упрощать, то да. Только каждый критерий относится не к «классу гипотез», а к конкретной гипотезе.
2. По сути, да, это функция, применяемая к выборке. Все расчёты p-value с использованием критериев выполняются в несколько действий. Некоторые критерии рассчитывают выборочные средние значения и стандартные отклонения и используют их в дальнейших расчетах, расчёты по другим критериям могут требовать перевода значений выборки в ранги и т.д. По поводу «расчёта p-value за один шаг» вопрос не совсем корректный. Любой алгоритм можно написать одной сложной функцией, выполняемой за один шаг.
3-5. Чаще всего по оси Y откладывают вероятность или плотность вероятности. По сути, это можно трактовать так: по оси Y приведена вероятность встречи элемента со значением Х в анализируемой совокупности.
На оставшуюся часть вопросов 3-5 я отвечу «скопом». Логика расчета значения p с помощью критерия Стьюдента также «прозрачна», как и теорема Пифагора, просто требует чуть больше понимания теории вероятностей. Для каждого критерия можно найти первоисточник, в котором приведено обоснование алгоритма расчёта. Но если попробовать объяснить максимально просто, то в основном прогнозы делаются на основании центральной предельной теоремы, которая гласит о том, что любая сумма большого количества случайных независимых между собой величин будет иметь распределение, близкое к нормальному.
6. На самом деле существует несколько способов проверки гипотез, можно воспользоваться критериальной статистикой и рассчитать p-value, можно просто рассчитать доверительный интервал, можно проводить моделирование и т.д. В общем здесь можно усложнять до бесконечности.
По поводу литературы: я в основном занимаюсь анализом медико-биологических данных, поэтому источники у меня все из этой области. На мой взгляд, самый простой для понимания учебник - это Стентон-Гланц «Медико-биологическая статистика».
@dmitryzabavin319 6 років тому
@@ПростаяСтатистика Алексей, огромное спасибо! Кое-что стало понятнее. Буду разбираться дальше. Если не возражаете, временами буду утомлять наивными вопросами )
@ИванИванов-н9т9ъ 6 років тому ⁺⁴
Похоже, что автор перепутал ошибку первого рода (false positive) с ошибкой второго рода (false negative). Соответственно, напутал, к чему относится уровень значимости - веровероятность случайного возникновения исследуемых показателей.
@ПростаяСтатистика 6 років тому ⁺⁵
Добрый день!
Спасибо за внимательность, еще раз проверил видео.
Нет, я ничего не перепутал =) По поводу false positive и false negative мы с Вами оба правы.
Возможно я смутил Вас знаками "+" и "-". В моем примере они относятся к нулевой гипотезе. Нулевая гипотеза - это, как правило, гипотеза об отсутствии различий между изучаемыми совокупностями. Если нулевая гипотеза "не верна", это я обозначил знаком "-". Если она верна, я отметил это знаком "+".
В проверке статистических гипотез ошибка первого рода - это ошибочное отклонение нулевой гипотезы.
В моем примере это так и есть: автор отклоняет нулевую гипотезу "-", но в действительности она верна "+".
А вот с тем, что уровень значимости - это вероятность случайного возникновения исследуемых показателей, я категорически не согласен. Повторюсь, уровень значимости (p-value, статистическая значимость) в проверке статистической гипотезы - это вероятность ошибочно отвергнуть нулевую гипотезу. Это определение достаточно строгое.
@ИванИванов-н9т9ъ 6 років тому ⁺³
@@ПростаяСтатистика Добрый день!
Вы пишите, что, как правило, нулевая гипотеза - это гипотеза об отсутствии различий между изучаемыми совокупностями. Далее Вы пишите, что ошибка первого рода - это ошибочное отклонение нулевой гипотезы. И в том, и в другом я полностью с Вами согласен. Нулевая гипотеза - обычно подразумевается гипотеза "нуль различий", поэтому она нулевая. Ошибка первого рода (ложное срабатывание) - false positive - когда в реальности различий нет (-), а статистика ошибочно говорит, что они есть (+). Другими словами, случайно возникли исследуемые показатели, указывающие, на различия и подтверждающие выдвинутую НЕнулевую гипотезу.
А в этом материале, как я его понял, под уровнем значимости понимается ошибка второго рода - пропуска цели - когда выдвинутая гипотеза о наличии статистических различий в реальности верна, но мы случайным образом принимаем верным нулевую гипотезу.
@ПростаяСтатистика 6 років тому ⁺⁴
@@ИванИванов-н9т9ъ , спасибо за замечание!
Если из слайда складывается впечатление, "что под уровнем значимости понимается ошибка второго рода - пропуска цели - когда выдвинутая гипотеза о наличии статистических различий в реальности верна, но мы случайным образом принимаем верным нулевую гипотезу", то я сделал его не совсем понятным.
Я планирую сделать еще один ролик, посвященный тому, как интерпретировать статистическую значимость и в нем еще раз обращу на это внимание. Спасибо!
@ИванИванов-н9т9ъ 6 років тому ⁺²
@@ПростаяСтатистика И Вам спасибо, что ответственно относитесь к тому, что делаете, и что в споре реально стремитесь найти истину.
@МадиТемирболат 3 роки тому
Здраствуйте, пытаюсь интерпретировать ваше обьснение к тесту Шапиро-Уилка о нормальности распределения. Там нулевая гипотиза всегда звучит как что данные нормально распределены и доказывается обратное и соответственно принимается p>0,05. Я проводил тесты в R.
Это значит что не всегда формулируют нулевую гипотезу от обратного?
@ПростаяСтатистика 3 роки тому
Здравствуйте! В ролике дана несколько упрощённая интерпретация значения р, которая подходит для сравнения групп, но не вполне корректна в общем случае. Я в скором времени вместо этого запишу новый ролик, где так же просто постараюсь объяснить суть значения р, но без подобных неточностей.
Если коротко, то значение р - это вероятность наблюдать полученные в эксперименте или более выраженные отклонения от нулевой гипотезы при условии, что она верна.
Для критерия Шапиро-Уилка нулевая гипотеза формулируется как "случайная величина распределена нормально". Если мы получаем р > 0,05, мы просто не можем отвергнуть нулевую гипотезу и "по умолчанию" принимаем её, продолжая считать, что наше распределение нормально. Это, на самом деле, достаточно тонкий момент, поэтому многие статистики рекомендуют проводить проверку нормальности распределения не только с помощью статистических критериев, но и с помощью построения гистограмм или квантильных диаграмм (QQ-plot).
@ZhuldyzBahramkyzy 7 років тому
Хотелось бы задать вам вопрос! На занятии у нас стал вопрос о разнице между значением Р-0,05 и тот же Р при стандартном значении Фишера. Заранее спасибо!
@alexrex4272 4 роки тому ⁺³
Низера не понял, но очень интересно
@romanroman5520 2 роки тому
Добрый день! как найти квартиль Q25,Q75 в excel ?
@alexeyglazkov6377 2 роки тому
Здравствуйте! Для этого в Excel есть функции =КВАРТИЛЬ.ВКЛ() и =КВАРТИЛЬ.ИСКЛ().
Подробнее о работе этих функций можно почитать тут: support.microsoft.com/ru-ru/office/%D0%BA%D0%B2%D0%B0%D1%80%D1%82%D0%B8%D0%BB%D1%8C-%D0%B2%D0%BA%D0%BB-%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F-%D0%BA%D0%B2%D0%B0%D1%80%D1%82%D0%B8%D0%BB%D1%8C-%D0%B2%D0%BA%D0%BB-1bbacc80-5075-42f1-aed6-47d735c4819d
@romanroman5520 2 роки тому
@@alexeyglazkov6377 Спасибо, но ничё не понятно. Видеоразбор бы найти
@ПтицаСчастья-г6п 4 роки тому
Здравствуйте, как найти р? Подскажите пожалуйста
@cyrilltarnopolsky957 4 роки тому
Немного запутался, если нулевая гипотеза формулируется от противного, то ошибка альфа- это фактически не ошибка?
@Gamezz-y9d 3 роки тому
Крутое видео!
Посмотри лучших канал с понятным объяснением сложных задач🤓❤️ ua-cam.com/video/MlxMJRZs3zg/v-deo.html
@sevdaquliyeva7410 4 роки тому
Что такое ±mp и как его вычислить в Эксель?
@Gamezz-y9d 3 роки тому
Крутое видео!
Посмотри лучших канал с понятным объяснением сложных задач🤓❤️ ua-cam.com/video/MlxMJRZs3zg/v-deo.html
@Daniilnew Рік тому ⁺¹
Все идеально, но картавите пипец и в моих наушниках почти больно слушать)
Могу сделать лучше звук бесплатно, если вдруг Вам надо.
Все остальное хорошо весьма.
@user-oy7vn6mk1t Рік тому
Поч на канале одни и теже видео по 10 раз залиты?
@Эксперимент.Изучениенемецкогоя 3 роки тому
В начале видео обсуждалась стратифицированная выборка ?
www.scribbr.com/methodology/sampling-methods/
@antongerasimov2298 2 роки тому ⁺¹
Что за ерунда? Зачем запутывать и без того бедных врачей? p-значение и вероятность ошибки первого рода - не одно и то же. Вероятность неверно отклонить нулевую гипотезу (ошибка первого рода) обозначается буквой альфа. И если p-значение меньше альфа - тогда и отклоняется нулевая гипотеза.
@alexeyglazkov6377 2 роки тому
Антон, Вы абсолютно правы. В ролике допущена достаточно грубая неточность. В ближайшее время будет проделана работа над ошибками!
@АлександрАмяльев-ц7з 3 роки тому
Спасибо! Очень помог. А то американы мозг крутят зазря
@alinacalm 5 років тому
Спасибо!
@janaschulz635 7 місяців тому
Объяснение очень хорошее, но музыка очень мешает и отвлекает. Хотя бы потише была… 🙏🏻
@daryaafonina9237 6 років тому ⁺¹
спасибо
@Эксперимент.Изучениенемецкогоя 3 роки тому
в конце видео задаются вопросы:
дизайн исследования:
- какие группы ты сравниваешь ?
- на каких этапах ?
Что это значит ??
@Gamezz-y9d 3 роки тому
Крутое видео!
Посмотри лучших канал с понятным объяснением сложных задач🤓❤️ ua-cam.com/video/MlxMJRZs3zg/v-deo.html
@saturniface13 2 роки тому
pushin p
@СветланаПотапова-ш3у 4 роки тому ⁺³
Просьба говорить громче и четче, а то какое то неразборчивое невыразительное мурлыканье
@RedBLUE-t7n 5 місяців тому
А мне нравится
@valamovalamo8386 Рік тому
Голос просто жесть. Содержание, может, и хорошее. Но так нечетко, как будто рот закрыт рукой.
@Ldyudmilkavideo 8 років тому ⁺¹
Кто хочет стать миллионером! АААААА
@vovandrossshows 3 роки тому ⁺²
за микрофоном слон?

Наступне

Автоматичне відтворення

Как выбрать статистический критерий? Часть 1 - Виды данных /Простая статистика/