Разве квадратичная функция потерь, это не (y-a)^2, где "y"- известное значение, а "a" - предсказанное моделью? Почему тогда в формулах (a-y)^2? Или это просто случайная формула? В случае с MSE это не влияет на ответ - всё равно квадрат, а вот для производной важно - будет отличаться знак.
Спасибо за лекцию. Есть вопрос: о чем идет речь на графике сравнения ошибок от итерации бустинга? Как "бустинг подгоняется под ответы тестовой выборки"? Вроде бы на то она и тестовая, что мы не знаем ее таргета. Или вы тут называете "тестовой" "валидационную" выборку, которая составлена из исходных данных и не показывалась для обучения? Заранее спасибо))
Таргет тестовой выборки мы конечно знаем, иначе какая она тестовая ?) т. е. мы же в принципе не можем тестировать результаты, не зная истинного таргета. Таргет неизвестен тогда, когда мы применяем готовую (заранее обученную и протестированную) модель на новых данных, которые не входили ни в какую выборку.
Спасибо за видео! Юрий, пожалуйста, постарайтесь во время лекции больше объяснять простыми словами суть написанных на экране формул, а не озвучивать их. Так лекция будет информативнее
Отличный лектор, спасибо!
Потрясающе! Спасибо за видео, Юрий, у Вас талант учить людей.
Отличная лекция, простыми словами - не самую простую логику!
Очень грамотная речь, слушать одно удовольствие!
Спасибо за такой объёмный курс в открытом доступе.
Супер-лектор
Не торопись!)))
? Где ссыль про bias variance?
Разве квадратичная функция потерь, это не (y-a)^2,
где "y"- известное значение, а "a" - предсказанное моделью?
Почему тогда в формулах (a-y)^2? Или это просто случайная формула?
В случае с MSE это не влияет на ответ - всё равно квадрат, а вот для производной важно - будет отличаться знак.
нет, производная одна и та же, d(y-a)^2/da = d(a-y)^2/da = 2(a - y)
А можно ссылки на упомянутые статьи, пожалуйста?
Спасибо за лекцию. Есть вопрос: о чем идет речь на графике сравнения ошибок от итерации бустинга? Как "бустинг подгоняется под ответы тестовой выборки"? Вроде бы на то она и тестовая, что мы не знаем ее таргета. Или вы тут называете "тестовой" "валидационную" выборку, которая составлена из исходных данных и не показывалась для обучения?
Заранее спасибо))
Не нашёл точную цитату, можете таймкод поставить?
@@yuryyarovikov3323 Полагаю, речь о 22й минуте и графиках ошибки от времени - ошибки на обучающей и тестовой выборках.
Полагаю, речь о валидационной выборке, иначе никак)
В прошлых лекциях говорили, что если не называют отдельной выборки для валидации, то под тестовой и понимают валидационную
Таргет тестовой выборки мы конечно знаем, иначе какая она тестовая ?) т. е. мы же в принципе не можем тестировать результаты, не зная истинного таргета. Таргет неизвестен тогда, когда мы применяем готовую (заранее обученную и протестированную) модель на новых данных, которые не входили ни в какую выборку.
Спасибо за видео! Юрий, пожалуйста, постарайтесь во время лекции больше объяснять простыми словами суть написанных на экране формул, а не озвучивать их. Так лекция будет информативнее
24:40 неудачный дубль остался
Остался. Видимо, теперь это уже фича этой лекции. Но спасибо:)
@@DeepLearningSchool это уже впринципе ваша фича, на 2 лекции тоже что-то такое было))
ребята сделали содержание лекции линейно зависимым, чтобы мы успешно переобучились