StandardScaler| MinMaxScaler | МАСШТАБИРОВАНИЕ ДАННЫХ | МАШИННОЕ ОБУЧЕНИЕ

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 ม.ค. 2025

ความคิดเห็น • 42

  • @greenfield284
    @greenfield284 วันที่ผ่านมา

    Хорошо объясняете, спасибо огромное за вашу работу!!!

  • @aboba98159
    @aboba98159 2 ปีที่แล้ว +12

    балдеж чистой воды. огромное спасибо

  • @НикитаКуцепалов-и2д
    @НикитаКуцепалов-и2д 2 ปีที่แล้ว +11

    Оч круто! Этой темы и в этом формате мне долго не хватало!

  • @TheKaramba321
    @TheKaramba321 2 ปีที่แล้ว +8

    ушки как большие признаки - все внимание забрали...
    пс. объясняете здорово, спасибо огромное

    • @GoodGuy-b3d
      @GoodGuy-b3d 2 หลายเดือนก่อน

      скорее рррр и кривая челюсть, которая выпирает)

  • @baubekmynbaev666
    @baubekmynbaev666 2 ปีที่แล้ว +5

    Отличное обучающее видео с примерами. Все по полочкам разложила. Спасибо 👍. Хотелось бы в дальнейшем видео о том какие модели чаще используются и в каких случаях. Заранее благодарю!

  • @polmaksim
    @polmaksim ปีที่แล้ว +1

    Очень просто и доступно. Спасибо тебе, лучезарная!

  • @АртемЕрохин-б7с
    @АртемЕрохин-б7с ปีที่แล้ว +2

    Отличное объяснение! Спасибо!

  • @parvi5172
    @parvi5172 2 ปีที่แล้ว +3

    Прекрасное объяснение! Лайк и подписка обеспечены. Даёшь больше крутого контента)

  • @ТимурГараев-й7л
    @ТимурГараев-й7л 6 หลายเดือนก่อน

    Как же это все понятно! Спасибо)

  • @Sergey_Yrevich
    @Sergey_Yrevich ปีที่แล้ว +1

    Все по полкам, спасибо!

  • @olegtinkov6553
    @olegtinkov6553 ปีที่แล้ว +1

    Отличное видео!!!

  • @datorikai9911
    @datorikai9911 2 ปีที่แล้ว +2

    Спасибо, Юля

  • @Олег-л5ю2п
    @Олег-л5ю2п ปีที่แล้ว +1

    Какой балдëж и каеф🥰

  • @МаксимМакаров-р7ь
    @МаксимМакаров-р7ь ปีที่แล้ว

    Спасибо, очень полезный видеоурок!

  • @vyacheslavgadzhiev7803
    @vyacheslavgadzhiev7803 2 ปีที่แล้ว +1

    Отличный урок

  • @alexnatalchenko4471
    @alexnatalchenko4471 ปีที่แล้ว

    Видос суперский!

  • @vukavuka7519
    @vukavuka7519 2 ปีที่แล้ว +1

    Лучшая!

  • @MsGleaming
    @MsGleaming 2 ปีที่แล้ว +1

    спасибо❤❤❤

  • @АлексейАндреев-м9щ
    @АлексейАндреев-м9щ 8 หลายเดือนก่อน

    спасибо!

  • @sergeymarkevich6406
    @sergeymarkevich6406 2 ปีที่แล้ว

    спасибо тебе

  • @skbalinez
    @skbalinez 2 ปีที่แล้ว +4

    Спасибо за такую подачу доступным языком.
    А после обучения модели на продакшене ей на вход надо тоже смасштабированные признаки подавать и получать в итоге смасштабированный таргет? И что с ним потом делать? Как "размасштабировать"?

    • @machine_learrrning
      @machine_learrrning  2 ปีที่แล้ว +2

      И вам спасибо за приятные слова!
      В продакшене тоже нужно признаки масштабировать, но целевое значение в целом лучше не масштабировать (что на обучении, что на тесте), а оставлять его в исходном виде.
      А если уже масштабировали, то через классы в sklearn это можно сделать: есть метод inverse_transform (scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html#sklearn.preprocessing.StandardScaler.inverse_transform), который и позволяет сделать обратное масштабирование

  • @RR-hq4cv
    @RR-hq4cv 2 ปีที่แล้ว +1

    Спасибо за очень понятное видео! В который раз всё объяснено максимально подробно и с хорошими примерами! Оформил light+ подписку.
    Есть вопрос по видео: почему мы сначала делим выборку на train и test, а только потом делаем нормализацию/стандартизацию? Можем ли мы сначала весь датасет промасштабировать, а уже потом разделять его на train и test? Спасибо.

    • @machine_learrrning
      @machine_learrrning  2 ปีที่แล้ว

      Большое спасибо за приятные слова и за подписку! 😸
      Сначала нужно разбить данные, а затем делать масштабирование данных, т.к. к выборке test относимся, как к настоящим, реальным данным, которые прислал заказчик, а он может прислать очень странные данные, дабы проверить нашу модель, поэтому мы должны быть готовы к этим странностям
      А можем подготовиться путем подсчета всех нужных нам показателей на выборке train, а затем только применять к test

    • @RR-hq4cv
      @RR-hq4cv 2 ปีที่แล้ว

      @@machine_learrrning Я вас понял. К части test на этапе подготовки модели относимся как к реальным данным. Спасибо!

  • @deadmorose4741
    @deadmorose4741 10 หลายเดือนก่อน

    Что если у нас задача сложной регрессии и в разряде числа, которое подаем на вход модели, имеется важная информация?
    К примеру мы подаем номер квартир и хотим чтобы модель научилась узнавать номер этажа, на котором находится эта квартира.
    Те 220 квартира находится на 2-ом этаже.
    Если мы нормализуем такие значения то модель будет не состоянии уловить вот эту вот "логику", что разряд и есть ответ, тк мы удалим из входного значения нужное значение.

  • @1dalgo
    @1dalgo ปีที่แล้ว

    А как действовать если на этапе обучения и тестирования, мы всё нормализовали, но в проде приходит значение которое не попадает в шкалу, и при transform(x), мы получаем значение >1?

    • @machine_learrrning
      @machine_learrrning  ปีที่แล้ว

      Ничего страшного, что такое произойдет несколько раз, если это будет постоянно, тогда нужно будет собрать выборку с новыми значениями масштабируемого признака и снова обучить модель

  • @wordofworld6874
    @wordofworld6874 2 ปีที่แล้ว

    Какой это плейлист?

  • @КаналСупермастерА
    @КаналСупермастерА ปีที่แล้ว

    Юля как всегда патащила!!!

  • @ВладимирО-с9с
    @ВладимирО-с9с 2 ปีที่แล้ว

    Главный вопрос после нормализации и стандартизации , когда обучим модель и будем делать на ней предсказание, нам в эту модель нужно подавать нормализованные или стандартизованные данные или в обычном формате? И если мы будем подавать в обученную модель нормализованные и стандартизованные данные, то как их переводить в прежний вид? Вот про это не было сказано.

    • @machine_learrrning
      @machine_learrrning  2 ปีที่แล้ว

      В обученную модель на масштабированных данных нужно подавать точно такие же масштабированные данные, только они будут новыми
      Перевести в обычный вид масштабированные данные можно применив к ним обратные преобразования, к примеру, для стандартизации нужно умножить на std и прибавив среднее арифметическое

  • @denis_alpino
    @denis_alpino 6 หลายเดือนก่อน

    Блин, уже месяца 2 ищу курсор как у тебя, не могу найти. Не подскажешь где качала и как устанавливала? Буду оооооочень признателен :3

  • @wordofworld6874
    @wordofworld6874 2 ปีที่แล้ว

    Вы используете R2 для задачи классификации?

    • @machine_learrrning
      @machine_learrrning  2 ปีที่แล้ว

      Предсказываем стоимость недвижимости - а это задача регрессии, так что можем использовать R2_score

  • @Trading-Neural
    @Trading-Neural ปีที่แล้ว

    Здравствуйте! Как можно с Вами связаться?

  • @alexandershim6205
    @alexandershim6205 2 ปีที่แล้ว

    Скажите, пожалуйста, должны ли мы приводить данные к нормальному распределению, когда подразумевается использование различных статистик (тот же Ф-тест Фишера) для проверки гипотез? Или мы просто подразумеваем, что данные распределены нормально? Если можно, дайте, пожалуйста, развернутый ответ. Надеялся, что будет раскрыта эта тема, касательно стандартизации.

    • @machine_learrrning
      @machine_learrrning  2 ปีที่แล้ว

      Нужно убедиться, что признаки имеют нормальное распределение, чтобы пользоваться такого рода статистическими критериями
      Если признак распределен не нормально, то нужно пользоваться другими стат. критериями

  • @gobals8925
    @gobals8925 2 ปีที่แล้ว

    Спасибо за ролик. Очень тихий звук (

  • @alexanderyablokov5881
    @alexanderyablokov5881 2 ปีที่แล้ว

    Спасибо. Лайк. Но зря мышку модифицировала, реально внимание отвлекает, тяжело смотреть.