Теория вероятностей #17: критерий хи квадрат (Пирсона)
Вставка
- Опубліковано 9 лют 2025
- Критерий согласия Хи-квадрат (Пирсона) для проверки корректности выдвинутой гипотезы. В данном занятии - это проверка корректности аппроксимации теоретической кривой экспериментальных данных (гистограммы).
Я даже не знаю, может я не там искал, но пока что это лучшее обьяснение этого критерия вообще. Спасибо
Зашел сюда после лекцией Анатолия Карпова на Степике. Этот материал офигенно дополняет предельно простое объяснение Анатолия.
А я ищу про Хи - квадрат, т.к. у Анатолия ни слова про этот критерий не увидел. Не подскажете, в каком курсе он говорит про него?
@@CommieDog1917, у него во второй части основ статистики в первом же блоке "Анализ номинативных данных" есть про Хи квадрат и про расстояние Пирсона.
@@nikitun85 Спасибо. Я пока только первую часть заканчиваю. Боялся, что как - то прослушал про Пирсона.
Дружище , видос отличный!
Второй раз пересматриваю это и буду пересматривать следующее видео. Объясняете хорошо, но иногда стоит пояснять некоторые термины, хотя бы в двух словах) аппроксимация, например (только щас узнал, что там 2 буквы "п"
весьма доходчиво!
Огромное спасибо за видео!
Большое спасибо, очень доходчиво
Почему на графике 4:05 используется n, которое до этого означало объем выборки? Вы говорите про k, а на графике n. Вводит ненужную дополнительную путаницу в эту итак запутаную тему.
Если я правильно понял, то вы ошиблись в объяснении в моменте 2:40.
Вы говорите, что диапазону с меньшей вероятностью попадания туда значений из экспериментов должен соответствовать меньший вес. Но по формуле в итоге всё наоборот: меньшему участку больший вес придаётся, что логично для выравнивания значимости диапазонов.
Да, ошибочка, вес, конечно, должен быть выше, все верно, спасибо.
1. Симулировать или скопировать из любого репозитория две группы данных, содержащие не менее 100 значений каждая. Лучше копировать из репозиториев, т.к. в них содержатся описания данных, что пригодится для дальнейшего анализа.
1.1. Методом Пирсона определить характер распределения.
1.2. Проверить методом Вилкоксона однородность распределений.
2. Скопировать из любого репозитория две группы данных, содержащие качественные признаки. Рассчитать коэффициенты ранговой корреляции по Спирмену и Кендаллу. Проверить гипотезы о значимости коэффициента ранговой корреляции по Спирмену и Кендаллу.
3. Симулировать или скопировать группу значений, распределенных по нормальному закону.
3.1. Сравнить исправленную выборочную дисперсию с гипотетической генеральной дисперсией нормальной совокупности.
3.2. Сравнить выборочную среднюю с гипотетической генеральной средней.
Мне вот такое задание дали, а я по Мат. статистике чайник. Знаю только мат. ожидание, дисперсию и среднее квадратическое.
Может посоветуете чего? ролики? или мне уже не дано, экзамен 13.06
Интересно, но сложно. Пока были уроки с задачами, где можно было прочувствовать смысл термина или алгоритм - я справлялся. Последние несколько лекций вообще только в общем виде осознаю.
Хорошо объяснили, спасибо! Не понял только (2:40) если Pi достаточно мала тогда и вес такого слагаемого следует взять меньше чем у разряда с большей Pi , но при n=const чем больше Pi тем меньше вес Ci = n/Pi
А какие критерии можно применять для небольших выборок (50
Спасибо за видео. Можете подробнее рассказать про степени свободы. Что в формуле r = k - s означает s? Какие конкретные слагаемые - зависимые в вашем примере?
Спасибо, подскажите, пожалуйста, что делать, если:
1. Есть графики зависимости, но данных катастрофически мало (3 кривые для выведения функции регрессии) как проверить правильность выбора при столь малых числа данных
Это все известно. А вот, 1) если знаем только частости, то есть общее число наблюдений неизвестно? 2) Что если интервалы неодинаковые?
Добрый день!
Подскажите пожалуйста, откуда следуют ограничения на применение критерия Пирсона? Там где про не менее 50 наблюдений.
Это общеизвестное значение из статистики (теории вероятностей), если хотим получить статистически более-менее значимое значение, то число экспериментов лучше брать от 100 и более.
как определить ожидаемую вероятность, если у меня случайная величина которая генерирует числа
если распределение равномерное, то все значения равновероятны
как узнать вероятность ошибки первого рода?
мы ее сами выбираем (задаем) - это элемент творчества при решении подобных задач
просто берешь вероятность в предположении, что верна альтернативная гипотеза, но ввполнилось условие, что принимаем основную гипотезу, считаешь, все просто
это физика?
это рисование!
Гипотеза не может быть верна, она может быть принята или отвергнута.