Разбор СТАТИСТИКИ в Python для Data Science / EASY level
ฝัง
- เผยแพร่เมื่อ 15 พ.ย. 2024
- Рассматриваем основные темы из теоретического урока по статистике, учимся применять и понимать различные определения и критерии на практике, какие функции задействованы, почему важно визуально отображать ваши основные статистики, и почему вы иногда встречаете в EDA тот или иной график.
Группа в ВКонтакте pymagic
Telegram t.me/pymagic
#DataScience #Статистика
Очень понравился такой формат видео. Было бы здорово увидеть больше видео подобного плана, гле именно практические примеры, так значительно проще и понятнее сразу все становится
@miracl6, контент - потрясающий, спасибо! Можно такого и почаще!))
На мой взгляд есть неточности:
1. Почему распределение бимодальное, если на гистограммах видим явно выраженную одну моду, т. е. распределение унимодальное получается?))
2. р-значение намного меньше приведенного alpha=0.05, 1.52e-24 - это 1.52 * 10**(-24) и в соответствии с этим отклоняем H0 и принимаем H1.
Спасибо, нравится смотреть ваши уроки и просто рассуждения обо всём.
очень давно искал такое объяснение,
спасибо вам огромное за ваш труд)))))
Делал лабу по корреляционному анализу с этим датасетом, только на R. Было интересно послушать как вы подходите к анализу, ваши размышления и тд. Спасибо
Именно то, чего не хватало сейчас для решения задачи, спасибо)))
Спосибо тебе огромное)))))
спасибо, узнал много нового, как раз пишу диссертацию на пандасе)
Классное видео. Хотелось бы добавить, чисто для себя, смысл проверки тех или иных гипотез. Возможно это видео предназначалось больше для того, чтобы посмотреть как считать статистики с помощью фреймворков Python, но после каждой гипотезы так и напрашивался вопрос "ИЧО??". А в целом 10 слоновых котиков из 10
@@miracl6 Меня немного сбила проверка второй гипотезы на двух подвыборках, но потом я услышал, что это было сделано просто показать как работает функция t Сьюдента
Лучшее, что увидел за неделю
Настя, спасибо за видео! Вы молодец ) вопрос появился такой: нужно ли для регрессии распределение из биномиального генерировать в нормальное?
Спасибо вам
Значение 1.5e-24 намного больше 0,05? Оговорка?
все такие небольшая неясность присутствует. хотел бы для себя уяснить правильно ли я понял, что: альфа (а) - это (пороговый) уровень значимости (задаём по таблице), p в данном примере - это p-value из критерия Шапиро-Уилка (stat - статистика этого критерия).
в итоге мы получили, что p < a (=0,05), значит отвергается нулевая гипотеза, так как с вероятностью 1 - а = 0,95 (95%) распределение не является нормальным.
P. S. За видео однозначно лайк, вы, Анастасия, и ваш канал замечательные, буду ждать с нетерпением ещё контента по теме DS!
Очень полезно и доступно, спасибо)
Если р < 0.05 - отклоняем 0-гипотезу, если p > 0.05 то у нас нет оснований для отклонения 0 -гипотезы. Можно и так объяснить эти дилеммы.
Настя,здравствуйте. Спасибо за видео, было интересно. Скажите, Вы можете написать методы pandas которыми чаще всего пользуетесь? Заранее спасибо
@@miracl6 огонь) спасибо большое за труд
вот каким на самом деле должен быть канал Like Nastya ))
Спасибо!!!
Ждём сложный уровень !)
Super!!!
6:55 а почему не F-распределение?
14:16 А я часто встречал, что для ген совокупности это среднеквадратичное отклонение, а для выборки - стандартное отклонение. Так как на самом-то деле?)
Спасибо за видео!
@@miracl6 вам спасибо за то, что занимаетесь подобными роликами. Было бы так же интересно увидеть от вас например серию роликов, полноценного проекта. Полностью все стадии поэтапно: предобработка, feature engineering, обучение и подбор гиперпараметров с самыми популярными моделями мо и т. д.
Было бы очень круто! Ну это так) Пожелание подписчика)
Лайкую!
Классный канал, респект!
откуда автор знала, что я пришёл сюда вспоминать свой курс института
Ребят, приветствую. Есть вопрос по процессу обучения на эту специальность. Как мне лучше Учить матешу, начиная подряд со школьного уровня, или учить области математики конкретно из DS при необходимости спускаясь до школы?
Вопрос возможно глупый, но у меня вызывает сомнения. Как минимум этот вопрос напрямую имеет отношение к временным затратам. Буду благодарен, если опишите ваш процесс обучения. Учусь самостоятельно, в университете, параллельно, получаю специальность из Computer Science.
Спасибо, очень познавательное видео, но разве у нас не наоборот ситуация обстоит? Когда p-value < 0.05, то мы принимаем нулевую гипотезу. Или я что-то напутал?
P-value - вероятность ошибиться насчёт того, что обнаруженная закономерность есть в ГС. То есть, чем больше это значение, тем больше будет наша ошибка в том, чтобы отвергнуть нулевую гипотезу. Значит, если вероятность меньше 5% - скорее всего, есть какая-то закономерность, потому что вероятность ошибиться очень маленькая))
очень классно, спасибо тебе! зашерь пожалуйста блокнотик нам, будем очень признательны, в тренды ютуба тебя выведем за это, чесслово =)
А на каком уровне нужно знать питон, чтобы работать Data scientist?
Спасибо! Классные видео на канале !
У меня возник вопрос по коррелиции. Я видела информацию о том, что если корреляция малекнька(0.0..) c таргетом и эта feature не имеет нормального распределения , то нам стоит нормализовать данные этой feature . А в случае если корреляция высокая не стоит ничего делать даже если feature не имеет нормального распределения. Так ли это ? Если да, то как нормализация помогает в первом случае ? и почему не имеет значения в втором?
Спасибо за ответ !
Мода, медиана и среднее будут не совпадать и у унимодального распределения, если оно скошено. Бимодальность не обязательна.
Вот бы ещё блокнот)
когда некст левел будет ?
Начал изучать статистику, начал путаться в опнятиях/определениях: ест описательнАЯ статистикА и описательнЫЕ статистикИ. Не могу до конца понять разницу
описательная статистика - раздел науки (погугли), а статистики - это свойства конкретные, характеристики чего-либо
+++