Как использовать JupyterHub на 100% на примере ML-школы DataGym и Lamoda, П. Ермаков. PyDaCon meetup

แชร์
ฝัง
  • เผยแพร่เมื่อ 6 ต.ค. 2024
  • 22 июня Mail.ru Group прошел совместный митап с организаторами конференции PyCon Russia.
    Вас ждут 2 секции: доклады по Python, состав которого был сформирован на основе общего списка докладов к PyCon Russia и PyData-трек от PyData Moscow meetup.
    «Как использовать JupyterHub на 100% на примере ML-школы DataGym и компании Lamoda»
    Петр Ермаков, Senior Data Scientist в Lamoda и Data Coach в DataGym
    Больше 2х лет назад я рассказывал о использовании jupyter на 100%.
    Но что, если вы не один? Как ужиться на одной машине 20 студентам, изучающим ML, или RND команде из 15? Готовые рецепты, рекомендации и собранные грабли.
    Программа мероприятия:
    Keynote:
    - «Как использовать JupyterHub на 100% на примере ML-школы DataGym и компании Lamoda»
    Петр Ермаков, Senior Data Scientist в Lamoda и Data Coach в DataGym
    Больше 2х лет назад я рассказывал о использовании jupyter на 100%.
    Но что, если вы не один? Как ужиться на одной машине 20 студентам, изучающим ML, или RND команде из 15? Готовые рецепты, рекомендации и собранные грабли.
    Python-трек:
    - «SQL-боттлнеки: поиск и устранение узких мест при масштабировании»
    Михаил Новиков, ведущий разработчик, Fasttrack (fstrk.io)
    Вы начинаете новый проект. Устанавливаете веб-фреймворк, ORM-фреймворк, пишете модели, делаете запросы к БД. Всё идет хорошо. Потом к вам приходит 100 000 пользователей - и проект падает под нагрузкой. Ваши действия?
    Такая ситуация была у нас полгода назад. Я расскажу, как мы нашли из нее выход, покажу наши подходы к поиску узких мест, сервисы, которые в этом помогают. И поясню, почему ванильный ORM - это зло.
    - «Сравнение технологий aiopg & asyncpg»
    Алексей Фирсов, ведущий разработчик aio-libs/aiopg
    Разберем, как работают две совершенно разные технологии aiopg & asyncpg - посмотрим, как они устроены. Что важно, мы не будем сравнивать скорость.
    PyData-трек:
    - «Оформление пайплайна в NLP проекте​»
    Виталий Радченко, Data Scientist, YouScan
    Сейчас многие компании решают разные NLP-задачи (классификация, чат-боты, кластеризация, вопросное-ответные системы и др.) и с накоплением опыта стали вырабатываться наиболее эффективные пайплайны.
    В докладе мы будем ориентироваться на лучшие мировые практики (AllenNLP) и свой собственный опыт. Расскажем, как нужно структурировать ваш пайплайн и особенности каждой его составляющей: как правильно оформлять входящие данные, итераторы по датасету, каким должен быть словарь, подготовка данных и др. Будут приведены примеры с реальных задач и показано, как это помогает в воспроизводимости и легкости дальнейшего использования.
    - «Локализация контента и элементов интерфейса»
    Алина Красавина, Ведущий разработчик MAPS.ME, Mail.ru Group
    Рассказ о том, как устроена локализация на сервер-сайде MAPS.ME. Небольшая трогательная история о боли контент-менеджеров и преодолении разработчиков бэка на Django.
    - «Стекаем и Блендим. Разбор популярных библиотек Python»
    Дмитрий Буслов, Старший архитектор бизнес-решений, SAP CIS
    В докладе мы расскажем про наиболее популярные библиотеки для формирования ансамблей. Начнем с простых ensemble в Sklearn-e, далее вручную соберем простейший стекинг в пару строчек кода, а после рассмотрим наиболее популярные библиотеки: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.
    ПРОДОЛЖЕНИЕ - В ПЕРВОМ КОММЕНТАРИИ.
    ___
    ТЕХНОСТРИМ - образовательный канал для IT специалистов.
    ___
    ПОДПИСЫВАЙСЯ, ЕСЛИ ТЕБЕ ИНТЕРЕСНО УЗНАТЬ:
    ✔ как наши преподаватели - топовые специалисты Mail.Ru Group руководят разработкой в таких проектах, как Почта, ВКонтакте, Облако, Maps.me, Одноклассники, и решают сложные задачи каждый день
    ✔ реальные примеры из практики с анализом их достоинств и недостатков
    ✔ современные технологии, которые применяются в проектах-лидера Рунета
    ✔ о митапах, мастер-классах, вебинарах и других мероприятиях, которые проводятся на базе вузов и Mail.Ru Group.
    Нажмите здесь для подписки ‣ www.youtube.com...
    Все наши лекции проходят в ведущих вузах страны: МГУ, МГТУ, МФТИ, МИФИ, СПбПУ.
    ___
    ТЫ СТУДЕНТ?
    Вступай в наши образовательные проекты и участвуй в чемпионатах. Лучшие студенты получают возможность стажировки в Mail.Ru Group. Отбор - каждые полгода!
    Технопарк при МГТУ им. Баумана ‣ park.mail.ru
    Техносфера при МГУ им. Ломоносова ‣ sphere.mail.ru
    Технотрек при МФТИ ‣ track.mail.ru
    Техноатом при МИФИ ‣ technoatom.mai...
    Технополис при СПбПУ ‣ polis.mail.ru
    Чемпионаты для программистов ‣ cups.mail.ru/
    Mail.Ru Group для образования ‣ mrgforedu

ความคิดเห็น • 1

  • @vkteamchannel
    @vkteamchannel  5 ปีที่แล้ว +1

    - «PyMC3 - Bayesian Statistical Modelling in Python»
    Максим Кочуров, PyMC Dev / Samsung AI / Skoltech
    Байесовская статистика в последнее время стала обсуждаться в контексте глубокого обучения. К сожалению, это скрывает главное ее преимущество по сравнению со стандартными подходами машинного обучения. В отличие от black-box моделей, байесовский подход к моделированию white-box. White-box - это и хорошо, и плохо.
    От аналитика требуется полное понимание природы задачи, только тогда байесовский подход используется на полную мощность. Он позволяет учесть не только то, что «говорят нам данные», но и то, что «говорит нам здравый смысл». В докладе пойдет речь о том, зачем и когда все это нужно и как проводить и интерпретировать такой анализ в питоне.
    - «"Кис-кис, вдыхай меня через кес" или о чем говорят любители рэпа: Python для тематического моделирования комментариев ВКонтакте»
    Дмитрий Сергеев, Aalto University / DataGym
    Мы покажем, как собрать 10 миллионов комментариев, используя API ВКонтакте и TH-cam, посмотрим, о чем говорят пользователи, слушающие разные жанры музыки, и дадим ответы на такие важные вопросы как:
    - Может ли тематическое моделирование помочь с кластеризацией жанров?
    - Есть ли что-то общее у слушателей шансона и джаза?
    - Как измерить близость Киркорова к Антохе МС?