Airflow и MLFlow автоматизаций пайплайнов Machine Learning / MLOps

แชร์
ฝัง
  • เผยแพร่เมื่อ 3 พ.ค. 2021
  • Разверните облачный сервер для Data Science в Selectel: slc.tl/JSss5, получите 1000 бонусных рублей по промокоду miracl6
    Новая группа про Data Science ВКонтакте pymagic
    Курс Data Science для начинающих PyMagic
    Подробная информация о курсе, программа обучения по ссылке - pymagic.ru
    Репозиторий с кодом из видео:
    github.com/miracl1e6/auto-pip...
    Доументация Airflow airflow.apache.org
    Инфа на русском ru.bmstu.wiki/Apache_Airflow
    Доументация MLFlow www.mlflow.org/docs/latest/in...
    Группа в ВКонтакте pymagic
    Telegram t.me/pymagic
    #datascience #mlops #mlflow #airflow
  • วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 57

  • @user-tm7eu1su1n
    @user-tm7eu1su1n 3 ปีที่แล้ว +26

    Люблю такие видео длительностью по часу, где все по болтикам разбирается. Но соблазн отложить просмотр таких видео на потом гораздо выше, чем у простых десятиминутных:)
    Спасибо, было полезно!

  • @user-pl5mm8hs9z
    @user-pl5mm8hs9z 3 ปีที่แล้ว +4

    Очень интересно, с нетерпением жду следующее видео про чистый код!

  • @nelinvitaliy5932
    @nelinvitaliy5932 3 ปีที่แล้ว +2

    Огромное спасибо за ваш труд!! Ваш код лаконичен и гениален!!! )))

  • @kirill_shaldybin
    @kirill_shaldybin 15 วันที่ผ่านมา

    Очень мощно! Большое спасибо!

  • @smartpax17
    @smartpax17 2 ปีที่แล้ว +1

    Наконец дорос до пайплайнов)

  • @besp7540
    @besp7540 2 ปีที่แล้ว

    Настя, большое спасибо за видео!

  • @datasciencesolutions2361
    @datasciencesolutions2361 ปีที่แล้ว +1

    я сказал это профессиональной. молодец с mlflow и MLOps видео!

  • @anggman
    @anggman 3 ปีที่แล้ว +1

    Очень ждём!

  • @AndersonSilva-dg4mg
    @AndersonSilva-dg4mg 3 ปีที่แล้ว +1

    Спасибо Анастасия!

  • @TIENTI0000
    @TIENTI0000 2 ปีที่แล้ว +2

    нравится как произносишь scheduler как шидулер

  • @GeigersBazaar
    @GeigersBazaar ปีที่แล้ว

    3 дня как вкатываюсь в тестирование в области Mlops, пока что ничего не понятно но очень интересно)

  • @TIENTI0000
    @TIENTI0000 2 ปีที่แล้ว +1

    спасибо за видео

  • @user-xl1zq2ic5f
    @user-xl1zq2ic5f 3 ปีที่แล้ว

    Годнота)

  • @kogram
    @kogram 3 ปีที่แล้ว

    Интересные видео, спасибо!
    numpy дважды импортирован, это не влечёт за собой ошибку? только начал питона душить, ещё не пробовал так делать...
    dry and wet ...

  • @lemzarl5181
    @lemzarl5181 3 ปีที่แล้ว

    Очень познавательно

  • @datascience4907
    @datascience4907 3 ปีที่แล้ว +1

    Полезные инструменты)

  • @maximzotov1847
    @maximzotov1847 3 ปีที่แล้ว

    Добрый день.
    А на Линуксе удобно программировать? Нет ли специального ПО только под винду?

  • @nikolaiandrianov1856
    @nikolaiandrianov1856 3 ปีที่แล้ว

    Спасибо!

  • @Paulinio91
    @Paulinio91 3 ปีที่แล้ว

    42:40 чтобы не ждать, можно прописать команду airflow db init

  • @IgorMokrushin
    @IgorMokrushin 3 ปีที่แล้ว +2

    Ничего не понятно, но очень интересно :)

  • @dmitrykhomyakov8451
    @dmitrykhomyakov8451 4 หลายเดือนก่อน

    Добрый день. Правильно ли я понимаю что AirFlow это инструмент для автоматизации запуска задач? Чем он отличается от широко известного Jenkins? Хуже или лучше?

  • @sergeyandron2764
    @sergeyandron2764 2 ปีที่แล้ว +2

    Очень полезное видео. Всё от и до, с живыми примерами и без воды. +1 на карму ))
    Особенно понравилась организация рабочего пространства и качество-понятность кода. Я лично так не пишу, поэтому тут плюсик.
    а вот про сами инструменты выглядит просто как дань моде "сейчас все используют и я буду", имхо разумеется.
    Про mlflow - выглядит как реальное усложнение процесса. ну вот сколько моделей вы обычно тестируете? 1,2,3 максимум. Если больше - возможно вы не знаете, что вам нужно? про параметры - Бог дал вам GridSearch - стабильно, удобно, практично. Зачем еще куча софта и лишнего кода с повышением вероятности косякнуть - не понятно.
    про airflow - игрушка конечно прикольная и модная, но всё же она больше для дата инженеров, перегонка данных из дохрена источников, отказоустойчивость и прочее. Для дата сатаниста, что бы запускать модельки по расписанию можно заюзать обычный крон, а не мудохаться с установкой самого софта и настройками ДАГов.
    в общем мой посыл в чем? Видео крутое, но не нужно усложнять там, где не нужно. Лучше сконцентрируйтесь на качестве самих алгоритмов. А то инструменты сейчас знают все, а качественный продукт выпускают единицы. Желаю Вам успехов :)

    • @qwerty-wt5dr
      @qwerty-wt5dr 2 ปีที่แล้ว

      Это обучающее видео, в том и суть чтобы о чем-то рассказать, не? Мне вот интересно про всю эту лабуду было послушать, тем более не от прыщавого индуса на ломаном английском.

  • @user-lt1ul9cn5c
    @user-lt1ul9cn5c 10 หลายเดือนก่อน

    Анастасия, а куда записываются результаты прогноза модели на проде, это какой-то ексель, csv-файл? В уроке это test.csv в папке data, правильно понимаю?)

  • @bekhzodortikov421
    @bekhzodortikov421 9 หลายเดือนก่อน +2

    Ваше репо уже недоступно?

  • @avatarcybertronics2584
    @avatarcybertronics2584 3 ปีที่แล้ว

    Я пропиарил ваше видео у себя в телеграм чате)

  • @donfedor007
    @donfedor007 2 ปีที่แล้ว +1

    Добрый день! Как сделать, что-бы в одном даге таски выполнялись с разными параметрами в зависимости от дня недели. Мы можем передать словарь params={"full": True} (в настройках дага), но чтоб этот параметр например в субботу становился False?

    • @donfedor007
      @donfedor007 2 ปีที่แล้ว +1

      @@miracl6 спасибо, я так и сделал!

  • @pavelbrudanov6701
    @pavelbrudanov6701 3 ปีที่แล้ว

    крутое видео о работе дата саинс

  • @gordonfreeman6804
    @gordonfreeman6804 ปีที่แล้ว

    Кстати, как например Neptune в сравнении с Airflow. Работая c Airflow выявил недостатки интерфейса. Например вывод только в txt файлы, что неудобно. А Neptune при простоте установки довольно хорошую визуализацию предоставляет. Правда нет такой репликации процессов, как в Airflow. Хотя может ошибаюсь.

  • @sgen_yt1439
    @sgen_yt1439 2 ปีที่แล้ว

    Почему трейн каждую минуту а предикт каждые 2? разве так в процессе результат одной из трейн не будет потерено? заранее спасибо

  • @gordonfreeman6804
    @gordonfreeman6804 ปีที่แล้ว

    Cubeflow, AWS Sagemaker работают с ноутбуками. Отличный туториал, забыл добавить.

    • @gordonfreeman6804
      @gordonfreeman6804 ปีที่แล้ว

      @@miracl6 кстати сумел сделать cron shedule в виде branching и short circuit внутри дага. Всё работало.

  • @user-mh1dz6xv5z
    @user-mh1dz6xv5z 3 ปีที่แล้ว

    Спасибо, как то мельком слышал названия этих инструментов, но для чего конкретно они нужны только сейчас узнал))
    А что если я хочу на ночь позапускать одну и ту же модельку, но с разными параметрами и на утро получить некий документ с результатами этих параметров? аирфлоу это позволяет сделать?
    Или скажем сравнить датасет А и Б, обучить сетку по каждому датасету(желательно несколько раз) с одинаковыми параметрами и в конце выдать результаты по лучшей метрике? Было бы удобно если этот инструмент позволял это сделать. Заранее спасибо))
    P.S. Конечно же ждем видео по чистоте своего кода, было бы интересно.

    • @user-mh1dz6xv5z
      @user-mh1dz6xv5z 3 ปีที่แล้ว

      @@miracl6 Понял, принял, спасибо)

  • @nikitaustinov1164
    @nikitaustinov1164 2 ปีที่แล้ว

    Где видио по чистому коду?)

  • @ms_Mar
    @ms_Mar หลายเดือนก่อน

    Хорошо, конечно, но лучше было показать установку на практике

  • @user-eg1vy8pk1v
    @user-eg1vy8pk1v 3 ปีที่แล้ว

    Красотка, подскажи на какую камеру снимаешь видео?)

    • @user-eg1vy8pk1v
      @user-eg1vy8pk1v 3 ปีที่แล้ว

      @@miracl6 несмотря на это картинка все равно качественная

    • @user-eg1vy8pk1v
      @user-eg1vy8pk1v 3 ปีที่แล้ว

      @@miracl6 само собой)

  • @melnikovjnr
    @melnikovjnr 2 ปีที่แล้ว

    автор алгебра алгоритм анализ аналитик аналитика анастасия английский база бесплатный!
    (очень крутое и полезное видео)

  • @oleksandrasaskia
    @oleksandrasaskia 3 ปีที่แล้ว +1

    можешь выложить этот проект на гитхаб?)

    • @user-nw9dx4fj9s
      @user-nw9dx4fj9s 3 ปีที่แล้ว +1

      А я тебя узнал, когда свой канал запустишь?)

  • @pavelbrudanov6701
    @pavelbrudanov6701 3 ปีที่แล้ว

    а проблем с сохранением артефактов не возникало? ))

    • @pavelbrudanov6701
      @pavelbrudanov6701 3 ปีที่แล้ว

      @@miracl6 может это с виндой проблемы?
      Вроде дописываю и в командной строке при запуске и в artifact_path

    • @pavelbrudanov6701
      @pavelbrudanov6701 3 ปีที่แล้ว

      @@miracl6 Он (mlflow) правда в трассировщик ошибок дописывает какую то несуществующую директорию к той, которую указываю в командной строке

    • @pavelbrudanov6701
      @pavelbrudanov6701 3 ปีที่แล้ว

      @@miracl6 а команды что бы поменять директорию артефактов из jupyter notebok я не нашел )))

    • @pavelbrudanov6701
      @pavelbrudanov6701 3 ปีที่แล้ว

      @@miracl6 ну сет трэкинг у меня локалхост, а венв я не ставил - у меня все в одной куче.

    • @pavelbrudanov6701
      @pavelbrudanov6701 3 ปีที่แล้ว

      @@miracl6 не, все пробовал.
      Нашел такую же ошибку, но там не предложили решения на сколько я вижу.
      Попробую сегодня hdfs установить на локальную машину, что бы грузить артефакты туда.

  • @petyap7600
    @petyap7600 2 ปีที่แล้ว

    По комментариям в коде не согласен. Их не нужно пихать везде, если очевидно, что он делает. Тем более, правильное именование переменных берет на себя эту функцию.

    • @petyap7600
      @petyap7600 2 ปีที่แล้ว

      И непонятно, почему log_metric/metrics не используется. Разве его не было?

  • @letsgo9788
    @letsgo9788 ปีที่แล้ว

    Куку