Основы статистики. Анатолий Карпов. Институт биоинформатики. Часть 1

Сергей Тюленев

3 600

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 8 лют 2025
1. Введение
1.1 Общая информация о курсе
1.2 Генеральная совокупность и выборка
1.3 Типы переменных. Количественные и номинативные переменные
1.4 Меры центральной тенденции
1.5 Меры изменчивости
1.6 Квартили распределения и график box-plot
1.7 Нормальное распределение
1.8 Центральная предельная теорема
1.9 Доверительные интервалы для среднего
1.10 Идея статистического вывода, p-уровень значимости
stepic.org/cou...
Основы статистики. Часть 1 • Основы статистики. Ана...
Основы статистики. Часть 2 • Основы статистики. Ана...
Основы статистики. Часть 3 • Основы статистики. Ана...
________________________
Анатолий Карпов - выпускник факультета психологии СПбГУ, научный сотрудник, аспирант кафедры общей психологии СПбГУ. Занимается экспериментальными исследованиями в области когнитивной психологии. Преподает курс математической статистики для биологов в Институте биоинформатики.
Курс вводный и рассчитан на слушателей, не обладающих специализированными знаниями в области математики. Он подойдет как тем, кто только начинают познавать тонкости математической статистики, так и тем, у кого уже есть некоторый опыт обработки и анализа данных.
В рамках курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения.
Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
Курс подготовлен на базе программы Института биоинформатики.

КОМЕНТАРІ • 108

@alekse7433 4 роки тому ⁺⁷⁹
Я очень тупой, смотрю в 11й раз, начинаю понимать. Думаю на 20 освою полностью. Курс отличный, советую все записывать. И книжку статистика и котики.
@Anonymous_starrrr 2 роки тому ⁺¹¹
тоже удивляют эти псевдозадры кто с первого раза понимает это. на костер их
@ЛенаБондаренко-с7ф 2 роки тому ⁺³
У каждого свои опыт, наработанные ранее знания, навыки, связи в мозгу. Тут как в физических тренировках - у каждого свой уровень подготовленности и генетическое наследство, но при этом любой может повысить свои показатели при условии, что уделяет достаточно внимания и времени.
@captainobvious2928 2 роки тому ⁺¹
Терпи, ты же мужчина!
@LotaGasa Рік тому
Нужно работать с вниманием! Куча техник имеется.
@ivantereschenko9051 Рік тому
Получилось освоить?
@kirilldemichev7986 2 роки тому ⁺¹⁶
0:01 1. Введение
0:05 1.1 Общая информация о курсе
1:32 1.2 Генеральная совокупность и выборка
6:23 1.3 Типы переменных. Количественные и номинативные переменные
12:24 1.4 Меры центральной тенденции
20:07 1.5 Меры изменчивости
29:08 1.6 Квартили распределения и график box-plot
33:20 1.7 Нормальное распределение
40:08 1.8 Центральная предельная теорема
45:43 1.9 Доверительные интервалы для среднего
53:54 1.10 Идея статистического вывода, p-уровень значимости
@Simpei93 Рік тому ⁺¹
Спасибо! Офигенная лекция. Все намного понятнее, чем было в наших лекциях в институте.
@ilyin_sergey 5 років тому ⁺⁷
Шикардосный курс на Stepik. Прелесть в том, что там и задачи есть!
@hochzeitsagenturalexshow1619 7 років тому ⁺⁴³
Молоток парень! Спасибо за курс!
@snezhanasaimagambetova7761 4 роки тому ⁺⁷
Анатолий, спасибо за курс. Вы просто огромный молодец. Разложили все по полочкам, что не возникло ни одного вопроса. Спасибо вам и огромных успехов!
@Ann-b9w 8 років тому ⁺¹²
Спасибо! Отличная лекция, а главное все разъяснено и разложено по полочкам. Стало многое ясно, что пытался понять из учебников.
@venorubick 8 років тому ⁺⁶
Всё хорошо понятно, разложено по полочкам и интересно слушать, смотреть, записывать. Спасибо!
@lozserg1 7 років тому ⁺³
Освежил для себя некоторые теоретические моменты. Прекрасное изложение. Спасибо.
@alexeyisakov 6 років тому ⁺¹¹
Спасибо за видео, после просмотра я начал любить статистику!
@starchemistery 7 років тому ⁺²
Когда полжизни не знаешь, как понять это СКО, а потом так просто это объясняют, такооой восторг возникает!) Спасибо автору!
@aneelkam3443 3 роки тому
Да сейчас Анатолий развернулся на статистике. Молодец! Успехов
@railotrailot521 7 років тому ⁺¹⁵
Анатолий Карпов ты крут!
@Просторазвлечения 2 роки тому
Правда прекрасный курс -- очень благодарен создателям! Пишу комментарий для лучшего продвижения ролика, в соответствии с алгоритмами ютуба))
@hannavirginia272 9 років тому ⁺¹⁸
Супер объяснение!) Даже я понимаю)))
@susannakhurshudyan1156 4 роки тому ⁺⁴
Спасибо Вам большое! Вы чудо!
@kad1720 2 роки тому ⁺¹
Как хорошо объясняет...все чётко
@tetianatrush 3 роки тому
ДЯКУЮ!
@bannakok 9 місяців тому
Минуте на 30 начал теряться. Но без конспекта оно и не удивительно. Очень хорошо объясняет.
@ИванГрозный-ъ9ц Рік тому ⁺²
Спасибо Шелдон)
@lumenone1698 6 років тому ⁺¹
Блестяще! Понятно, качественно, на примерах.
@elenafridman7294 8 років тому ⁺³
Потрясающая лекция!
@ОвечкинДенисВячеславович 3 роки тому
Супер!! Спасибо огромнейшее за весь курс!!!
@najahajazera 9 років тому
спасибо, благодаря такому подробному и иллюстрированному объяснению многое проясняется
@Александр-л8з3э 7 років тому ⁺²
Отличное объяснение! Молодец!
@wayer5204 4 роки тому
Вот ты вообще крутой, прям всё по полочкам разложил. Красава!
@MrSnuppys 7 років тому ⁺⁵
Роскошный курс
@Андрей-л7щ8в 8 років тому ⁺¹
Очень информативно, спасибо
@Katrina86 4 роки тому
Молодец, все очень доступно!
@DL-gl2wb 4 роки тому
Крутейшая лекция, спасибо
@Doroshin123 8 років тому ⁺⁵
Центральн. предельн. теорема - с 40:00
@DennisTurbay 6 років тому ⁺¹
Спасибо огромное!
@Booogieman 4 роки тому ⁺⁴
Вери гуд! Но хорошо бы добавить таймкоды!
@user-wk9tu7rt2t 4 місяці тому
Прикольно на молодого карпова посмотреть. Сейчас он в 100 раз понятнее объясняет. Недавно его видео смотрел про "почему в квадрате а не по модулю и почему эн минус один а не просто эн в знаменателе)
@Cosmicforon 5 років тому
супер) спасибо. пошел дальше изучать
@dr_madinasalimova 5 років тому ⁺¹
супер! спасибо,большое!
@kl45gp 4 роки тому ⁺¹
21:34 дисперсия(мера изменчивости) и откуда берется квадрат
@Laborantka 6 років тому
Прям вот сразу плюсанула
@kl45gp 5 років тому
это надо смотреть несколько раз, но это охеренно
@alexandrbaranezky3029 7 років тому ⁺²
Спасибо!
@Fishing_Yuga 2 роки тому
Лайк, чтобы не забыть
@spacetoxicology123 9 років тому ⁺⁸
достойно!
@gennadyfedorow5392 7 років тому
Просто супер!!!
@АлександрДергилёв-п8х 8 років тому ⁺⁹
Блестящее объяснение
@9BaroN6 8 років тому ⁺⁵
Добрый день. Отличное видео. Все понятно и доступно. Единственное не совсем понял откуда в задаче(46-47 минута) мю = 1,96se. Как мы вычислили 1,96? Буду признателен за ответ.
@makszym 8 років тому
По идее по таблице распределения Стьюдента t(1-0,05) при df=n-1=63
t=1,998.
@Mar-by2lq 7 років тому ⁺¹
При объеме выборки более 30 закон распределения Стьюдента близок нормальному закону. Поэтому, если посмотреть в таблице нормального распределения значение площади под кривой плотности, равной 0.975 (или 0,475), как раз будет 1.96 для 95% ДИ.
@renkinjutsu4664 4 роки тому
Spasibo horoşï çelovek
@АленаВзорова 4 роки тому
Спасибо
@ЕвгенийЦарев-р3г 5 років тому ⁺¹
на 32:21 у вас появляется график Box Plot c точками. По оси "y" они расположены в соответствии со значениями роста. А что влияет на их расположение на этом графике по оси "x"? У вас ведь они расположены на разных значениях по оси "x". Закономерности в этом не нашел... Объясните пожалуйста, не понимаю! В остальном спасибо огромное!
@VakaramGolang 3 роки тому
Спасибо.
@Moons-Flower 3 роки тому ⁺¹
Интересно, я одна тут, помимо восхищения простотой и доступностью объяснений думаю: «какой же он симпатичный!😍»? 🤣🙈
@aidaberdaliyeva160 3 роки тому
Походу. Потому что честно говоря вообще мало внимания на это обратила. 😂🤦🏻‍♀️
@thepoisonoflegend 4 роки тому
Я правильно понимаю, что цпт работает только если в генеральной совокупности нормальное распределение. А если распределение негауссово, то нужно использовать другие предельные теоремы? То есть перед проверкой гипотезы, нужно сначала узнать подчинена ли генеральная совокупность нормальному распределению?
@КамильГаббасов-ш3к 5 років тому
Dx*c=Dx*c^2 (на 28:50) это точно так? Мб вы имели ввиду Dx*c=SDx*c^2 ?
@AlisherZhanybekov 7 місяців тому
Спасибо, очередной раз убедился что я тупой🤣
@АлексейЗайцев-ы4г 7 років тому
Это потомок Фейнмана! Талант не пропей, Анатолий!
@sabinazzz8874 4 роки тому
Спасибо за видео. Подскажите, пожалуйста, как найти дисперсию признака, если доля мужчин составила 0.55?
@wolfich4684 4 роки тому
Сергей, чем вы там рисовали на рисунках ? стилусом?
@ДмитрийТроицкий-к5ы 8 років тому
Отлично, а есть ссылки на еще части?
Часть 1, Часть n, и прочая информация...
Может где неувидел
@Советскиерадиоспектакли 8 років тому ⁺¹
Более свежее поищите на сайте stepic.org/course/Основы-статистики-76/
@Советскиерадиоспектакли 8 років тому
А здесь только три части первого курса найдёте.
@Mar-by2lq 7 років тому
Анатолий, на 57й минуте Вы используете Distribution Caclculator, не смогла найти этот ресурс. Подскажите, пожалуйста, как на него выйти (если это не Ваш код в R).
@Dimayu5 5 років тому
Очень сильно мешает восприятию разница в обозначениях и названиях. Учусь в МГУ, используются другие названия переменных. + тут слишком мало временни дается на сам практический пример и хотелось бы ещё порешать примеры самостоятельно и свериться с ответом
@Dimayu5 5 років тому
На 55:55 непонятно как происходят вычисления, так как вроде Среднеквадратическое отклонение и есть стандартное отклонение
@NikaSpring 2 роки тому
А зачем отнимать 1 от n в подсчете дисперсии выборки так и не объяснили толком(
@Terrayko 3 роки тому
Касательно среднеквадратичного отклонения, не понял зачем нам считать его, а не посчитать просто среднее отклонение? Вместо того, чтобы возводить разность значения признака и среднего в квадрат, а потом пытаться вернуть всё через квадратный корень (теряя точность и получая ответ на не совсем понятный вопрос). Мы можем просто использовать МОДУЛЬ разности значения признака и среднего значения. А далее точно так же разделив сумму всего ряда на количество его членов, получим точный ответ на вопрос - на сколько в среднем отклоняются все значения от их среднего значения = ∑ |xᵢ - ẍ| / n. Ни больше ни меньше) Что я упускаю?
@paulv4282 8 років тому
Здравствуйте.
Объсните, пожалуйста, кто знает, в чем смысл выполнения операции извлечения из корня среднего арифметического квадратов отклонений при нахождении среднего квадратичного отклонения? Зачем так много операций? Чем они обусловлены? Можно ведь также возвести отклонения в третюю степень, а потом извлекать корень кубический из среднего арифметического? Где об этом можно почитать подробнее и доступным простым языком?
Спасибо.
@Filipp0kk 8 років тому ⁺⁶
там же объяснили, что мы возвели в квадрат для того, чтобы избавиться от отрицательных значений. если б мы не возводили в квадрат разность между фактическим и средним во время вычисления дисперсии, то у нас бы не показывался разброс, так как бы некоторые "разности" получались бы отрицательные и при сложении всех этих разниц у нас бы.... эмм.. получалось не то, что нам нужно :D не знаю как сказать.
Ну то есть, дисперсия, судя по формуле, это по сути СРЕДНЯЯ РАЗНИЦА МЕЖДУ СРЕДНИМ ЗНАЧЕНИЕМ ПРИЗНАКА И ФАКТИЧЕСКИМ. (капсом, потому что надо вникнуть :D).
однако после того как мы придумали, как обозначить эту среднюю разницу, у нас появилась проблема, что эта разница выражена не в оригинальных единицах, а в квадратичных, поэтому мы берем и возвдим под корень.
А почему есть такое понятие как дисперсия, если можно сразу использовать sd, то это просто потому, что в некоторых случаях при математических операциях проще использовать именно дисперсию. а в некоторых - sd
@olegmakarikhin 4 роки тому ⁺¹
для вычисления отклонения нужна метрика - такая функция которой даешь две сущности из множества, а она возвращает одно число (и еще некоторые свойства).
в геометрии, в декартовой системе координат "метрического пространства" хорошей, природной, такой функцией является расстояние, которое вычисляется как корень квадратный из суммы квадратов разниц координат. для одномерных сущнстей можно обойтись модулем который и равен sqrt(x^2).
@ВладимирКормушкин-з2л 5 років тому
Вопрос: может ли медиана на Box plot быть не по середине, а смещенной кверху или книзу? И если да, то в каких случаях?
@aidaberdaliyeva160 3 роки тому
Я по моему такие данные случайно получала. Вслепую. И меня мой профессор мучил такими вопросами, Варум? А я Дарум. Крч патамушта патамушта был ответ мой. 🤦🏻‍♀️
@FndfnnFnefnfn Рік тому
23:32 а нафига в квадрат возводить, если можно просто по модулю взять? Это даже легче считать
@DMITRHIUS 6 місяців тому
Можно использовать модуль, тогда результат будет называться "абсолютным отклонением"
Однако распростронение получило возведение в квадрат, т.е дисперсия и стандартное отклонение. Почему? Потому что тогда у отцов-математиков мат.статистика бы не получилась:)
Когда в квадрат возводишь, становится доступно больше операций, напр, дифференцирование
@FndfnnFnefnfn 6 місяців тому
@@DMITRHIUS Лично для меня даже за неформальное доказательство не зайдет. Видел подобную формулировеу и мне не нравится, поскольку звучит она аля «Иначе бы не вышло». Я ведь знать хотел почему не вышло бы иначе, а не сам имеющийся факт. Неужели важнее подогнать функцию под необходимые нам свойства, нежели иметь наибольшую её точность и репрезентабильность? В прочем, вопрос был написал 10мес назад и я бы хотел пообщаться с кем-то на эту тему достаточно много. Позвольте спросить ваш контакт?
@user-wk9tu7rt2t 4 місяці тому
В этом случае можно и по модулю. Но дело не в конкретном примере. Эта формула здесь как универсальная. Она исходит из более сложных задач и там же и используется. Тут из пушки по воробьям. Это всё равно что с помощью интеграла площадь под графиком искать. Не для этого же интеграл придумали .
@tayamyschka6476 4 роки тому
Как найти таблицу 39:18?
@xander-on-the-earth 4 роки тому ⁺¹
Средний рост астронавтов, посетивших Луну, просто так подсчитать не получится -- в знаменателе придётся писать ноль.
@alexeygrom1834 7 років тому
имхо лучший кур по статистике и тервер
@igorchingilidi869 2 роки тому
Без привязки к размеру ген совокупности ничего нельзя говорить об экстраполяции признака выборки на ген совокупность. Если совокупность 64 чел и выборка 64 чел ---- 100% если 2 млрд к 64 чел = это ничего. Ничего нельзя говорить по этой выборке :) Эти все 64 значения могут быть за 3мя сигмами.
@prinimaushaya_storona 11 місяців тому
ну можно попытаться разбить все 2 млрд на равные группы, и уже там смотреть
@МихаилБойченко-в4н 8 років тому
Где можно достать полную версию видео?
@СергейТюленев 8 років тому
Это полная. Смотрите также часть 2 и часть 3
@mashikc3no 5 років тому
@@СергейТюленев подскажите пожалуйста, а курс на сайте сильно отличается от данного видео?
@tokkimia 2 роки тому
41:40
@NighttimeSerenity 5 років тому
по Box Plot косяк
@ОлександрПоспєлов-к8ы 7 років тому ⁺¹
очень интересно но нужно читать немного медленее
@Dimon0014 7 років тому
Установите скорость 0.75 (там где шестеренка изображена(в нижнем правом углу видео)) И будет вам счастье)))
@N000tme 2 роки тому
Господи как сложно то. Зачем так. Можно же с реальными примерами
@mishabelyanin3703 8 років тому
Яхочусистеы
@kanatnurgalievich 9 місяців тому
Кто пишет все супер и просто вы кто, я вообще не понимаю что происходит
@lunarcat6664 4 роки тому
Анатолий Карпов ещё и в матеше шарит, не знал
@ahkmedurdiev2123 2 роки тому ⁺¹
Блин наверное хитрый как лис
@светланаВ-е3ь 7 років тому
вы для кого читаете?если для новичков, то ваша скорость чтения не воспринимается. нужно читать немного медленее!!!
@Dimon0014 7 років тому ⁺¹
Установите скорость 0.75 (там где шестеренка изображена(в нижнем правом углу видео)) И будет вам счастье)))
@5elll960 4 роки тому
+++
@CanalNew1 11 місяців тому
как-то слишком просто, где-то подвох
@СарданаСтаростина-б4щ Рік тому ⁺¹
убейте меея
@НиколайСидоров-ф5п 4 місяці тому
Какая же невежественная чепуха от этого карплова.

Наступне

Автоматичне відтворення

Основы статистики. Анатолий Карпов. Институт биоинформатики. Часть 2