Основы статистики. Анатолий Карпов. Институт биоинформатики. Часть 1
Вставка
- Опубліковано 8 лют 2025
- 1. Введение
1.1 Общая информация о курсе
1.2 Генеральная совокупность и выборка
1.3 Типы переменных. Количественные и номинативные переменные
1.4 Меры центральной тенденции
1.5 Меры изменчивости
1.6 Квартили распределения и график box-plot
1.7 Нормальное распределение
1.8 Центральная предельная теорема
1.9 Доверительные интервалы для среднего
1.10 Идея статистического вывода, p-уровень значимости
stepic.org/cou...
Основы статистики. Часть 1 • Основы статистики. Ана...
Основы статистики. Часть 2 • Основы статистики. Ана...
Основы статистики. Часть 3 • Основы статистики. Ана...
________________________
Анатолий Карпов - выпускник факультета психологии СПбГУ, научный сотрудник, аспирант кафедры общей психологии СПбГУ. Занимается экспериментальными исследованиями в области когнитивной психологии. Преподает курс математической статистики для биологов в Институте биоинформатики.
Курс вводный и рассчитан на слушателей, не обладающих специализированными знаниями в области математики. Он подойдет как тем, кто только начинают познавать тонкости математической статистики, так и тем, у кого уже есть некоторый опыт обработки и анализа данных.
В рамках курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения.
Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
Курс подготовлен на базе программы Института биоинформатики.
Я очень тупой, смотрю в 11й раз, начинаю понимать. Думаю на 20 освою полностью. Курс отличный, советую все записывать. И книжку статистика и котики.
тоже удивляют эти псевдозадры кто с первого раза понимает это. на костер их
У каждого свои опыт, наработанные ранее знания, навыки, связи в мозгу. Тут как в физических тренировках - у каждого свой уровень подготовленности и генетическое наследство, но при этом любой может повысить свои показатели при условии, что уделяет достаточно внимания и времени.
Терпи, ты же мужчина!
Нужно работать с вниманием! Куча техник имеется.
Получилось освоить?
0:01 1. Введение
0:05 1.1 Общая информация о курсе
1:32 1.2 Генеральная совокупность и выборка
6:23 1.3 Типы переменных. Количественные и номинативные переменные
12:24 1.4 Меры центральной тенденции
20:07 1.5 Меры изменчивости
29:08 1.6 Квартили распределения и график box-plot
33:20 1.7 Нормальное распределение
40:08 1.8 Центральная предельная теорема
45:43 1.9 Доверительные интервалы для среднего
53:54 1.10 Идея статистического вывода, p-уровень значимости
Спасибо! Офигенная лекция. Все намного понятнее, чем было в наших лекциях в институте.
Шикардосный курс на Stepik. Прелесть в том, что там и задачи есть!
Молоток парень! Спасибо за курс!
Анатолий, спасибо за курс. Вы просто огромный молодец. Разложили все по полочкам, что не возникло ни одного вопроса. Спасибо вам и огромных успехов!
Спасибо! Отличная лекция, а главное все разъяснено и разложено по полочкам. Стало многое ясно, что пытался понять из учебников.
Всё хорошо понятно, разложено по полочкам и интересно слушать, смотреть, записывать. Спасибо!
Освежил для себя некоторые теоретические моменты. Прекрасное изложение. Спасибо.
Спасибо за видео, после просмотра я начал любить статистику!
Когда полжизни не знаешь, как понять это СКО, а потом так просто это объясняют, такооой восторг возникает!) Спасибо автору!
Да сейчас Анатолий развернулся на статистике. Молодец! Успехов
Анатолий Карпов ты крут!
Правда прекрасный курс -- очень благодарен создателям! Пишу комментарий для лучшего продвижения ролика, в соответствии с алгоритмами ютуба))
Супер объяснение!) Даже я понимаю)))
Спасибо Вам большое! Вы чудо!
Как хорошо объясняет...все чётко
ДЯКУЮ!
Минуте на 30 начал теряться. Но без конспекта оно и не удивительно. Очень хорошо объясняет.
Спасибо Шелдон)
Блестяще! Понятно, качественно, на примерах.
Потрясающая лекция!
Супер!! Спасибо огромнейшее за весь курс!!!
спасибо, благодаря такому подробному и иллюстрированному объяснению многое проясняется
Отличное объяснение! Молодец!
Вот ты вообще крутой, прям всё по полочкам разложил. Красава!
Роскошный курс
Очень информативно, спасибо
Молодец, все очень доступно!
Крутейшая лекция, спасибо
Центральн. предельн. теорема - с 40:00
Спасибо огромное!
Вери гуд! Но хорошо бы добавить таймкоды!
Прикольно на молодого карпова посмотреть. Сейчас он в 100 раз понятнее объясняет. Недавно его видео смотрел про "почему в квадрате а не по модулю и почему эн минус один а не просто эн в знаменателе)
супер) спасибо. пошел дальше изучать
супер! спасибо,большое!
21:34 дисперсия(мера изменчивости) и откуда берется квадрат
Прям вот сразу плюсанула
это надо смотреть несколько раз, но это охеренно
Спасибо!
Лайк, чтобы не забыть
достойно!
Просто супер!!!
Блестящее объяснение
Добрый день. Отличное видео. Все понятно и доступно. Единственное не совсем понял откуда в задаче(46-47 минута) мю = 1,96se. Как мы вычислили 1,96? Буду признателен за ответ.
По идее по таблице распределения Стьюдента t(1-0,05) при df=n-1=63
t=1,998.
При объеме выборки более 30 закон распределения Стьюдента близок нормальному закону. Поэтому, если посмотреть в таблице нормального распределения значение площади под кривой плотности, равной 0.975 (или 0,475), как раз будет 1.96 для 95% ДИ.
Spasibo horoşï çelovek
Спасибо
на 32:21 у вас появляется график Box Plot c точками. По оси "y" они расположены в соответствии со значениями роста. А что влияет на их расположение на этом графике по оси "x"? У вас ведь они расположены на разных значениях по оси "x". Закономерности в этом не нашел... Объясните пожалуйста, не понимаю! В остальном спасибо огромное!
Спасибо.
Интересно, я одна тут, помимо восхищения простотой и доступностью объяснений думаю: «какой же он симпатичный!😍»? 🤣🙈
Походу. Потому что честно говоря вообще мало внимания на это обратила. 😂🤦🏻♀️
Я правильно понимаю, что цпт работает только если в генеральной совокупности нормальное распределение. А если распределение негауссово, то нужно использовать другие предельные теоремы? То есть перед проверкой гипотезы, нужно сначала узнать подчинена ли генеральная совокупность нормальному распределению?
Dx*c=Dx*c^2 (на 28:50) это точно так? Мб вы имели ввиду Dx*c=SDx*c^2 ?
Спасибо, очередной раз убедился что я тупой🤣
Это потомок Фейнмана! Талант не пропей, Анатолий!
Спасибо за видео. Подскажите, пожалуйста, как найти дисперсию признака, если доля мужчин составила 0.55?
Сергей, чем вы там рисовали на рисунках ? стилусом?
Отлично, а есть ссылки на еще части?
Часть 1, Часть n, и прочая информация...
Может где неувидел
Более свежее поищите на сайте stepic.org/course/Основы-статистики-76/
А здесь только три части первого курса найдёте.
Анатолий, на 57й минуте Вы используете Distribution Caclculator, не смогла найти этот ресурс. Подскажите, пожалуйста, как на него выйти (если это не Ваш код в R).
Очень сильно мешает восприятию разница в обозначениях и названиях. Учусь в МГУ, используются другие названия переменных. + тут слишком мало временни дается на сам практический пример и хотелось бы ещё порешать примеры самостоятельно и свериться с ответом
На 55:55 непонятно как происходят вычисления, так как вроде Среднеквадратическое отклонение и есть стандартное отклонение
А зачем отнимать 1 от n в подсчете дисперсии выборки так и не объяснили толком(
Касательно среднеквадратичного отклонения, не понял зачем нам считать его, а не посчитать просто среднее отклонение? Вместо того, чтобы возводить разность значения признака и среднего в квадрат, а потом пытаться вернуть всё через квадратный корень (теряя точность и получая ответ на не совсем понятный вопрос). Мы можем просто использовать МОДУЛЬ разности значения признака и среднего значения. А далее точно так же разделив сумму всего ряда на количество его членов, получим точный ответ на вопрос - на сколько в среднем отклоняются все значения от их среднего значения = ∑ |xᵢ - ẍ| / n. Ни больше ни меньше) Что я упускаю?
Здравствуйте.
Объсните, пожалуйста, кто знает, в чем смысл выполнения операции извлечения из корня среднего арифметического квадратов отклонений при нахождении среднего квадратичного отклонения? Зачем так много операций? Чем они обусловлены? Можно ведь также возвести отклонения в третюю степень, а потом извлекать корень кубический из среднего арифметического? Где об этом можно почитать подробнее и доступным простым языком?
Спасибо.
там же объяснили, что мы возвели в квадрат для того, чтобы избавиться от отрицательных значений. если б мы не возводили в квадрат разность между фактическим и средним во время вычисления дисперсии, то у нас бы не показывался разброс, так как бы некоторые "разности" получались бы отрицательные и при сложении всех этих разниц у нас бы.... эмм.. получалось не то, что нам нужно :D не знаю как сказать.
Ну то есть, дисперсия, судя по формуле, это по сути СРЕДНЯЯ РАЗНИЦА МЕЖДУ СРЕДНИМ ЗНАЧЕНИЕМ ПРИЗНАКА И ФАКТИЧЕСКИМ. (капсом, потому что надо вникнуть :D).
однако после того как мы придумали, как обозначить эту среднюю разницу, у нас появилась проблема, что эта разница выражена не в оригинальных единицах, а в квадратичных, поэтому мы берем и возвдим под корень.
А почему есть такое понятие как дисперсия, если можно сразу использовать sd, то это просто потому, что в некоторых случаях при математических операциях проще использовать именно дисперсию. а в некоторых - sd
для вычисления отклонения нужна метрика - такая функция которой даешь две сущности из множества, а она возвращает одно число (и еще некоторые свойства).
в геометрии, в декартовой системе координат "метрического пространства" хорошей, природной, такой функцией является расстояние, которое вычисляется как корень квадратный из суммы квадратов разниц координат. для одномерных сущнстей можно обойтись модулем который и равен sqrt(x^2).
Вопрос: может ли медиана на Box plot быть не по середине, а смещенной кверху или книзу? И если да, то в каких случаях?
Я по моему такие данные случайно получала. Вслепую. И меня мой профессор мучил такими вопросами, Варум? А я Дарум. Крч патамушта патамушта был ответ мой. 🤦🏻♀️
23:32 а нафига в квадрат возводить, если можно просто по модулю взять? Это даже легче считать
Можно использовать модуль, тогда результат будет называться "абсолютным отклонением"
Однако распростронение получило возведение в квадрат, т.е дисперсия и стандартное отклонение. Почему? Потому что тогда у отцов-математиков мат.статистика бы не получилась:)
Когда в квадрат возводишь, становится доступно больше операций, напр, дифференцирование
@@DMITRHIUS Лично для меня даже за неформальное доказательство не зайдет. Видел подобную формулировеу и мне не нравится, поскольку звучит она аля «Иначе бы не вышло». Я ведь знать хотел почему не вышло бы иначе, а не сам имеющийся факт. Неужели важнее подогнать функцию под необходимые нам свойства, нежели иметь наибольшую её точность и репрезентабильность? В прочем, вопрос был написал 10мес назад и я бы хотел пообщаться с кем-то на эту тему достаточно много. Позвольте спросить ваш контакт?
В этом случае можно и по модулю. Но дело не в конкретном примере. Эта формула здесь как универсальная. Она исходит из более сложных задач и там же и используется. Тут из пушки по воробьям. Это всё равно что с помощью интеграла площадь под графиком искать. Не для этого же интеграл придумали .
Как найти таблицу 39:18?
Средний рост астронавтов, посетивших Луну, просто так подсчитать не получится -- в знаменателе придётся писать ноль.
имхо лучший кур по статистике и тервер
Без привязки к размеру ген совокупности ничего нельзя говорить об экстраполяции признака выборки на ген совокупность. Если совокупность 64 чел и выборка 64 чел ---- 100% если 2 млрд к 64 чел = это ничего. Ничего нельзя говорить по этой выборке :) Эти все 64 значения могут быть за 3мя сигмами.
ну можно попытаться разбить все 2 млрд на равные группы, и уже там смотреть
Где можно достать полную версию видео?
Это полная. Смотрите также часть 2 и часть 3
@@СергейТюленев подскажите пожалуйста, а курс на сайте сильно отличается от данного видео?
41:40
по Box Plot косяк
очень интересно но нужно читать немного медленее
Установите скорость 0.75 (там где шестеренка изображена(в нижнем правом углу видео)) И будет вам счастье)))
Господи как сложно то. Зачем так. Можно же с реальными примерами
Яхочусистеы
Кто пишет все супер и просто вы кто, я вообще не понимаю что происходит
Анатолий Карпов ещё и в матеше шарит, не знал
Блин наверное хитрый как лис
вы для кого читаете?если для новичков, то ваша скорость чтения не воспринимается. нужно читать немного медленее!!!
Установите скорость 0.75 (там где шестеренка изображена(в нижнем правом углу видео)) И будет вам счастье)))
+++
как-то слишком просто, где-то подвох
убейте меея
Какая же невежественная чепуха от этого карплова.