Собеседование Data Science Junior: Вопросы и задания | Эльбрус Буткемп
ฝัง
- เผยแพร่เมื่อ 21 ต.ค. 2024
- Записаться на день открытых дверей по направлению JavaScript 👉🏻
Бесплатный тренажёр по JavaScript для начинающих 👉🏻
В этом видео преподаватель Антон Ефимов проведёт техническое собеседование с нашей выпускницей Аней на позицию junior data scientist. Запись проводилась в августе 2023 года, сразу после выпуска, давайте посмотрим, насколько успешно Аня пройдёт собеседование 🤓
Кто мы такие❓
Эльбрус Буткемп - это первая и самая крупная в России школа программирования в формате интенсивного обучения. Студенты 12 недель оффлайн или 15 недель онлайн практикуются на реальных проектах и кодят с утра до вечера. Обучение проходит по направлениям JavaScript и Data Science.
В буткемпе студенты решают задачи от реальных работодателей, что особенно важно в постоянно развивающейся сфере IT. 3 месяца оффлайн / 4 месяца онлайн обучения с 9:00 до 19:00 5 дней в неделю, ежедневная работа с кодом, плюс два проекта, командный и персональный, которые студенты защищают на второй и третьей, заключительной, фазе обучения - и вот на выходе уже есть полноценное портфолио, которое можно показать при устройстве на работу.
По окончании обучения всех ждет карьерная неделя, где карьерный коуч помогает подготовиться к собеседованию, подтянуть софт-скиллы и собрать резюме, с которыми 93% студентов находят работу в течение трех месяцев после окончания буткемпа. Также после завершения Эльбрус Буткемп есть возможность получить диплом ДПО.
Приходите на день открытых дверей онлайн и познакомьтесь с форматом буткемп. Это лучший способ научиться программировать, сменить работу и увеличить свой доход.
VK - elbrusb...
FB - / elbrusbootcamp
Insta - / elbrus.bootcamp
TikTok - www.tiktok.com...
Сайт школы - elbrusboot.camp
Напишите или позвоните нам, чтобы узнать, как поступить в ближайшую группу:
☎️ +7 (499) 938-68-24
💬 Чат в WhatsApp api.whatsapp.c....
💬 Чат в Телеграм t.me/elbrusboo...
✉️ info@elbrusboot.camp
#datascienceinterview #datascience #собеседование
ну хз, {k: v for k, v in some_list} не знать, про mde не говорили ...
Как мы построим с тобой интервью?
А как вообще понять, хорошо ли наш алгоритм справляется с задачей?
Какую бы ты выбрала метрику?
Вот по поводу precision поговорим, да? Раз метрики - это всё равно некая агрегация этой информации, у нас вот есть вот эта матрица, вот precision, recall - это вообще управляемая история или неуправляемая уже при условии, что модель обучена?
Давай знаешь к ROC AUC, любую можешь выбрать, вкратце проговори, вообще как понимаешь, что это такое?
А случайный алгоритм, если бы я просто случайно бы расставлял "мошенническая", "не мошенническая", сколько бы у меня ROC AUC был?
Вот какие бы ты модели попробовала? Выбери буквально три какие-нибудь, четыре назови.
Вот давай тогда поговорим с тобой: есть boosting модель, есть там логистическая регрессия как линейная модель. Плюсы-минусы каждого?
А за счёт чего вообще достигается, если уж речь пошла о boosting, да? Почему он долгий?
Как в таком случае вообще ведут себя модели при дисбалансе классов? И что бы ты предложила, если тебя поведение модели не устраивает?
Какие основные гиперпараметры ты бы подчеркнула boosting модели, предположим, которые действительно влияют на результат?
А как нам вообще подходить к подбору некоего оптимума, да, под нашу задачу вот таких гиперпараметров?
А если говорить про линейную модель, вот например логистическую регрессию возьмём, у неё какие гиперпараметры?
Из вот этого множества решающих деревьев какую-то среднюю такую вот взвешенную модель получаем?
А на каких данных она учится? У нас же один только датасет?
Как бы ты поступила, если у нас какой-то абстрактный текст?
А например, возьмём embedding, как получаются embedding, что это вообще такое?
Как как бы подойти к этому моменту, лучше мы стали или не лучше?
Какой вывод мы сделаем с точки зрения гипотез, с точки зрения уже нашего решения?
Скажи, пожалуйста, вот тебе знакома такая O символика или оценка сложности алгоритма? Что ты можешь по этому поводу сказать?
А можешь оценить сложность твоего алгоритма?