Основы статистики. Анатолий Карпов. Институт биоинформатики. Часть 1
ฝัง
- เผยแพร่เมื่อ 17 มี.ค. 2015
- 1. Введение
1.1 Общая информация о курсе
1.2 Генеральная совокупность и выборка
1.3 Типы переменных. Количественные и номинативные переменные
1.4 Меры центральной тенденции
1.5 Меры изменчивости
1.6 Квартили распределения и график box-plot
1.7 Нормальное распределение
1.8 Центральная предельная теорема
1.9 Доверительные интервалы для среднего
1.10 Идея статистического вывода, p-уровень значимости
stepic.org/course/Основы-стат...
Основы статистики. Часть 1 • Основы статистики. Ана...
Основы статистики. Часть 2 • Основы статистики. Ана...
Основы статистики. Часть 3 • Основы статистики. Ана...
________________________
Анатолий Карпов - выпускник факультета психологии СПбГУ, научный сотрудник, аспирант кафедры общей психологии СПбГУ. Занимается экспериментальными исследованиями в области когнитивной психологии. Преподает курс математической статистики для биологов в Институте биоинформатики.
Курс вводный и рассчитан на слушателей, не обладающих специализированными знаниями в области математики. Он подойдет как тем, кто только начинают познавать тонкости математической статистики, так и тем, у кого уже есть некоторый опыт обработки и анализа данных.
В рамках курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения.
Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
Курс подготовлен на базе программы Института биоинформатики.
Я очень тупой, смотрю в 11й раз, начинаю понимать. Думаю на 20 освою полностью. Курс отличный, советую все записывать. И книжку статистика и котики.
тоже удивляют эти псевдозадры кто с первого раза понимает это. на костер их
У каждого свои опыт, наработанные ранее знания, навыки, связи в мозгу. Тут как в физических тренировках - у каждого свой уровень подготовленности и генетическое наследство, но при этом любой может повысить свои показатели при условии, что уделяет достаточно внимания и времени.
Терпи, ты же мужчина!
Нужно работать с вниманием! Куча техник имеется.
Получилось освоить?
Молоток парень! Спасибо за курс!
Шикардосный курс на Stepik. Прелесть в том, что там и задачи есть!
Освежил для себя некоторые теоретические моменты. Прекрасное изложение. Спасибо.
Всё хорошо понятно, разложено по полочкам и интересно слушать, смотреть, записывать. Спасибо!
Спасибо! Офигенная лекция. Все намного понятнее, чем было в наших лекциях в институте.
Спасибо за видео, после просмотра я начал любить статистику!
Спасибо! Отличная лекция, а главное все разъяснено и разложено по полочкам. Стало многое ясно, что пытался понять из учебников.
Блестяще! Понятно, качественно, на примерах.
спасибо, благодаря такому подробному и иллюстрированному объяснению многое проясняется
Потрясающая лекция!
Супер объяснение!) Даже я понимаю)))
0:01 1. Введение
0:05 1.1 Общая информация о курсе
1:32 1.2 Генеральная совокупность и выборка
6:23 1.3 Типы переменных. Количественные и номинативные переменные
12:24 1.4 Меры центральной тенденции
20:07 1.5 Меры изменчивости
29:08 1.6 Квартили распределения и график box-plot
33:20 1.7 Нормальное распределение
40:08 1.8 Центральная предельная теорема
45:43 1.9 Доверительные интервалы для среднего
53:54 1.10 Идея статистического вывода, p-уровень значимости
Спасибо Вам большое! Вы чудо!
Когда полжизни не знаешь, как понять это СКО, а потом так просто это объясняют, такооой восторг возникает!) Спасибо автору!
Анатолий Карпов ты крут!
Отличное объяснение! Молодец!
Анатолий, спасибо за курс. Вы просто огромный молодец. Разложили все по полочкам, что не возникло ни одного вопроса. Спасибо вам и огромных успехов!
Супер!! Спасибо огромнейшее за весь курс!!!
Да сейчас Анатолий развернулся на статистике. Молодец! Успехов
Очень информативно, спасибо
Правда прекрасный курс -- очень благодарен создателям! Пишу комментарий для лучшего продвижения ролика, в соответствии с алгоритмами ютуба))
Спасибо огромное!
Минуте на 30 начал теряться. Но без конспекта оно и не удивительно. Очень хорошо объясняет.
супер) спасибо. пошел дальше изучать
Как хорошо объясняет...все чётко
Просто супер!!!
Молодец, все очень доступно!
Вот ты вообще крутой, прям всё по полочкам разложил. Красава!
Крутейшая лекция, спасибо
Спасибо!
супер! спасибо,большое!
Роскошный курс
ДЯКУЮ!
Прям вот сразу плюсанула
Спасибо
это надо смотреть несколько раз, но это охеренно
Спасибо.
достойно!
Центральн. предельн. теорема - с 40:00
Вери гуд! Но хорошо бы добавить таймкоды!
Блестящее объяснение
Спасибо Шелдон)
Лайк, чтобы не забыть
Spasibo horoşï çelovek
21:34 дисперсия(мера изменчивости) и откуда берется квадрат
Интересно, я одна тут, помимо восхищения простотой и доступностью объяснений думаю: «какой же он симпатичный!😍»? 🤣🙈
Походу. Потому что честно говоря вообще мало внимания на это обратила. 😂🤦🏻♀️
Спасибо, очередной раз убедился что я тупой🤣
Это потомок Фейнмана! Талант не пропей, Анатолий!
Анатолий, на 57й минуте Вы используете Distribution Caclculator, не смогла найти этот ресурс. Подскажите, пожалуйста, как на него выйти (если это не Ваш код в R).
Добрый день. Отличное видео. Все понятно и доступно. Единственное не совсем понял откуда в задаче(46-47 минута) мю = 1,96se. Как мы вычислили 1,96? Буду признателен за ответ.
По идее по таблице распределения Стьюдента t(1-0,05) при df=n-1=63
t=1,998.
При объеме выборки более 30 закон распределения Стьюдента близок нормальному закону. Поэтому, если посмотреть в таблице нормального распределения значение площади под кривой плотности, равной 0.975 (или 0,475), как раз будет 1.96 для 95% ДИ.
Спасибо за видео. Подскажите, пожалуйста, как найти дисперсию признака, если доля мужчин составила 0.55?
на 32:21 у вас появляется график Box Plot c точками. По оси "y" они расположены в соответствии со значениями роста. А что влияет на их расположение на этом графике по оси "x"? У вас ведь они расположены на разных значениях по оси "x". Закономерности в этом не нашел... Объясните пожалуйста, не понимаю! В остальном спасибо огромное!
Я правильно понимаю, что цпт работает только если в генеральной совокупности нормальное распределение. А если распределение негауссово, то нужно использовать другие предельные теоремы? То есть перед проверкой гипотезы, нужно сначала узнать подчинена ли генеральная совокупность нормальному распределению?
Сергей, чем вы там рисовали на рисунках ? стилусом?
Отлично, а есть ссылки на еще части?
Часть 1, Часть n, и прочая информация...
Может где неувидел
Более свежее поищите на сайте stepic.org/course/Основы-статистики-76/
А здесь только три части первого курса найдёте.
Dx*c=Dx*c^2 (на 28:50) это точно так? Мб вы имели ввиду Dx*c=SDx*c^2 ?
Как найти таблицу 39:18?
Вопрос: может ли медиана на Box plot быть не по середине, а смещенной кверху или книзу? И если да, то в каких случаях?
Я по моему такие данные случайно получала. Вслепую. И меня мой профессор мучил такими вопросами, Варум? А я Дарум. Крч патамушта патамушта был ответ мой. 🤦🏻♀️
Средний рост астронавтов, посетивших Луну, просто так подсчитать не получится -- в знаменателе придётся писать ноль.
имхо лучший кур по статистике и тервер
Здравствуйте.
Объсните, пожалуйста, кто знает, в чем смысл выполнения операции извлечения из корня среднего арифметического квадратов отклонений при нахождении среднего квадратичного отклонения? Зачем так много операций? Чем они обусловлены? Можно ведь также возвести отклонения в третюю степень, а потом извлекать корень кубический из среднего арифметического? Где об этом можно почитать подробнее и доступным простым языком?
Спасибо.
там же объяснили, что мы возвели в квадрат для того, чтобы избавиться от отрицательных значений. если б мы не возводили в квадрат разность между фактическим и средним во время вычисления дисперсии, то у нас бы не показывался разброс, так как бы некоторые "разности" получались бы отрицательные и при сложении всех этих разниц у нас бы.... эмм.. получалось не то, что нам нужно :D не знаю как сказать.
Ну то есть, дисперсия, судя по формуле, это по сути СРЕДНЯЯ РАЗНИЦА МЕЖДУ СРЕДНИМ ЗНАЧЕНИЕМ ПРИЗНАКА И ФАКТИЧЕСКИМ. (капсом, потому что надо вникнуть :D).
однако после того как мы придумали, как обозначить эту среднюю разницу, у нас появилась проблема, что эта разница выражена не в оригинальных единицах, а в квадратичных, поэтому мы берем и возвдим под корень.
А почему есть такое понятие как дисперсия, если можно сразу использовать sd, то это просто потому, что в некоторых случаях при математических операциях проще использовать именно дисперсию. а в некоторых - sd
для вычисления отклонения нужна метрика - такая функция которой даешь две сущности из множества, а она возвращает одно число (и еще некоторые свойства).
в геометрии, в декартовой системе координат "метрического пространства" хорошей, природной, такой функцией является расстояние, которое вычисляется как корень квадратный из суммы квадратов разниц координат. для одномерных сущнстей можно обойтись модулем который и равен sqrt(x^2).
41:40
Где можно достать полную версию видео?
Это полная. Смотрите также часть 2 и часть 3
@@user-ol6vb7dj2k подскажите пожалуйста, а курс на сайте сильно отличается от данного видео?
23:32 а нафига в квадрат возводить, если можно просто по модулю взять? Это даже легче считать
Очень сильно мешает восприятию разница в обозначениях и названиях. Учусь в МГУ, используются другие названия переменных. + тут слишком мало временни дается на сам практический пример и хотелось бы ещё порешать примеры самостоятельно и свериться с ответом
На 55:55 непонятно как происходят вычисления, так как вроде Среднеквадратическое отклонение и есть стандартное отклонение
по Box Plot косяк
Касательно среднеквадратичного отклонения, не понял зачем нам считать его, а не посчитать просто среднее отклонение? Вместо того, чтобы возводить разность значения признака и среднего в квадрат, а потом пытаться вернуть всё через квадратный корень (теряя точность и получая ответ на не совсем понятный вопрос). Мы можем просто использовать МОДУЛЬ разности значения признака и среднего значения. А далее точно так же разделив сумму всего ряда на количество его членов, получим точный ответ на вопрос - на сколько в среднем отклоняются все значения от их среднего значения = ∑ |xᵢ - ẍ| / n. Ни больше ни меньше) Что я упускаю?
А зачем отнимать 1 от n в подсчете дисперсии выборки так и не объяснили толком(
Яхочусистеы
+++
Без привязки к размеру ген совокупности ничего нельзя говорить об экстраполяции признака выборки на ген совокупность. Если совокупность 64 чел и выборка 64 чел ---- 100% если 2 млрд к 64 чел = это ничего. Ничего нельзя говорить по этой выборке :) Эти все 64 значения могут быть за 3мя сигмами.
ну можно попытаться разбить все 2 млрд на равные группы, и уже там смотреть
Блин наверное хитрый как лис
Анатолий Карпов ещё и в матеше шарит, не знал
Кто пишет все супер и просто вы кто, я вообще не понимаю что происходит
очень интересно но нужно читать немного медленее
Установите скорость 0.75 (там где шестеренка изображена(в нижнем правом углу видео)) И будет вам счастье)))
Господи как сложно то. Зачем так. Можно же с реальными примерами
как-то слишком просто, где-то подвох
вы для кого читаете?если для новичков, то ваша скорость чтения не воспринимается. нужно читать немного медленее!!!
Установите скорость 0.75 (там где шестеренка изображена(в нижнем правом углу видео)) И будет вам счастье)))
убейте меея