Евгений, конечно же, гений, но смущает прямо-таки коллекция типичных заблуждений в одном слайде: 1. "уровень значимости (α, p)": на самом деле уровень статистической значимости - это только α, априорно выбираемое пороговое значение вероятности. p, или p-значение (p-value) - вероятность, которая, в отличие от α, вычисляется, причём уже после получения данных; [p < 0.05] - сокращённая запись [p < α при α = 0.05]; 2. "1 шанс из 20, что мы получили этот результат случайно": на самом деле мы здесь ничего не можем утверждать про вероятность ни ЭТОГО ПОЛУЧЕННОГО результата, ни его случайности; 3. "некоторая достоверность": на самом деле в теории вероятностей достоверность не бывает больше или меньше. Событие либо достоверно (p = 1), либо нет. 4. У Р. Фишера нет ни понятия, ни термина "уровень значимости" - его ввёл Е. Нейман. Фишер был категорически против такого подхода и яростно критиковал Неймана в течение всей жизни. Фишер оперирует понятием "критерий значимости" (significance testing), которое у Неймана превращается в"статистический критерий (тест)". Понятия "критерий достоверности" нет ни у того, ни у другого, ни даже в их теоретически бессмысленной компиляции - NHST. 5. Фишер описал критерии значимости и в качестве ПРИМЕРА статистически значимого результата привёл p-значение 0.05 не в The design of experiments, а десятью годами раньше в другой книге, Statistical Methods for Research Workers (1925), когда "дедушке" было 35 лет. 6. Согласно современным рекомендациям, уровень статистической значимости лучше вообще не поминать, т.к. термин легко вводит в заблуждение, а если уж говорить о нём, то только вкупе с мощностью критерия. 7. Проблемы исследований с малым N связаны не с α = 0.05, а с трудностью контроля смешения. 8. Кризис воспроизводимости возник не из-за α = 0.05, а из-за ошибок в планировании исследований и массового неверного использования и понимания статистических методов, в т.ч. p-значения. 9. require() - весьма специфическая команда R, использовать её в общем случае - порочная практика. Надёжнее и безопаснее пользоваться library().
@@Alexander_Favorite Спасибо, я подумаю ) А Евгений и вправду большой молодец: его видеокурс - возможно, лучший из того, что мы сейчас имеем на русском.
@@Alexander_FavoriteНайдёте лучше - дайте ссылку ;) Лучший ведь не значит безупречный, просто остальные хуже. Кроме того, исторически так сложилось, что конкретно эта тема проверки гипотез крайне неудачно изложена в большинстве учебников, в т.ч. на английском.
С пунктами 1-6 в целом согласен, но подробно это всё объясняется в следующей теме 7, хотя и там есть мелкие неточности. В этом слайде была задача пропедевтически ввести понятие уровня значимости, но, возможно, это была не лучшая идея. По 7, 8 - я бы поспорил и уточнил, но, опять же, если это обсуждать подробно, то нужно посвятить примерно час каждому из этих вопросов. Не стоит забывать, что это вводный курс рассчитанный на наших студентов, некоторые из которых впервые слышат слово "стандартное отклонение" и думают, что это что-то из клинической психологии. Отмечу, что, по сравнению со студентами-психологами в других странах, которые не знают знака суммы и не знают операций с дробями, это ещё довольно высокий уровень. Но, это, безусловно, не уровень магистратуры в ситуации, где есть а) бакалавриат по психологии как пререквизит для поступления в магистратуру и б) нормальное преподавание матметодов в этом бакалавриате.
Евгений, конечно же, гений, но смущает прямо-таки коллекция типичных заблуждений в одном слайде:
1. "уровень значимости (α, p)": на самом деле уровень статистической значимости - это только α, априорно выбираемое пороговое значение вероятности. p, или p-значение (p-value) - вероятность, которая, в отличие от α, вычисляется, причём уже после получения данных; [p < 0.05] - сокращённая запись [p < α при α = 0.05];
2. "1 шанс из 20, что мы получили этот результат случайно": на самом деле мы здесь ничего не можем утверждать про вероятность ни ЭТОГО ПОЛУЧЕННОГО результата, ни его случайности;
3. "некоторая достоверность": на самом деле в теории вероятностей достоверность не бывает больше или меньше. Событие либо достоверно (p = 1), либо нет.
4. У Р. Фишера нет ни понятия, ни термина "уровень значимости" - его ввёл Е. Нейман. Фишер был категорически против такого подхода и яростно критиковал Неймана в течение всей жизни. Фишер оперирует понятием "критерий значимости" (significance testing), которое у Неймана превращается в"статистический критерий (тест)". Понятия "критерий достоверности" нет ни у того, ни у другого, ни даже в их теоретически бессмысленной компиляции - NHST.
5. Фишер описал критерии значимости и в качестве ПРИМЕРА статистически значимого результата привёл p-значение 0.05 не в The design of experiments, а десятью годами раньше в другой книге, Statistical Methods for Research Workers (1925), когда "дедушке" было 35 лет.
6. Согласно современным рекомендациям, уровень статистической значимости лучше вообще не поминать, т.к. термин легко вводит в заблуждение, а если уж говорить о нём, то только вкупе с мощностью критерия.
7. Проблемы исследований с малым N связаны не с α = 0.05, а с трудностью контроля смешения.
8. Кризис воспроизводимости возник не из-за α = 0.05, а из-за ошибок в планировании исследований и массового неверного использования и понимания статистических методов, в т.ч. p-значения.
9. require() - весьма специфическая команда R, использовать её в общем случае - порочная практика. Надёжнее и безопаснее пользоваться library().
@@Alexander_Favorite Спасибо, я подумаю ) А Евгений и вправду большой молодец: его видеокурс - возможно, лучший из того, что мы сейчас имеем на русском.
@@Alexander_FavoriteНайдёте лучше - дайте ссылку ;) Лучший ведь не значит безупречный, просто остальные хуже. Кроме того, исторически так сложилось, что конкретно эта тема проверки гипотез крайне неудачно изложена в большинстве учебников, в т.ч. на английском.
С пунктами 1-6 в целом согласен, но подробно это всё объясняется в следующей теме 7, хотя и там есть мелкие неточности. В этом слайде была задача пропедевтически ввести понятие уровня значимости, но, возможно, это была не лучшая идея. По 7, 8 - я бы поспорил и уточнил, но, опять же, если это обсуждать подробно, то нужно посвятить примерно час каждому из этих вопросов. Не стоит забывать, что это вводный курс рассчитанный на наших студентов, некоторые из которых впервые слышат слово "стандартное отклонение" и думают, что это что-то из клинической психологии. Отмечу, что, по сравнению со студентами-психологами в других странах, которые не знают знака суммы и не знают операций с дробями, это ещё довольно высокий уровень. Но, это, безусловно, не уровень магистратуры в ситуации, где есть а) бакалавриат по психологии как пререквизит для поступления в магистратуру и б) нормальное преподавание матметодов в этом бакалавриате.
Можешь ли ты что-то посоветовать начинающему? Интересные «придирки». Вдуг шариш
тебя мало кто посмотрел, но знай ты гений) во многих других видео порядок и насыщенность информацией хуже, умеешь доносить