Junior Data Scientist | Собеседование | karpov.courses

karpov.courses

มุมมอง 177 236

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 21 ต.ค. 2024

ความคิดเห็น • 243

@stasgafarov 2 ปีที่แล้ว ⁺¹¹⁰
Друзья всем привет, хотелось бы еще раз поблагодарить Дмитрия за участие, это очень хороший опыт.
В некоторых ответах есть неточности и ошибки, спишите это нам на то, что мы проводили собес поздно вечером после тяжелого рабочего дня, поэтому немного заговаривались.
В следующий раз я постараюсь сделать чуть более структурированные вопросы и дать ответы на них. Не стоит рассматривать этот вариант собеседования как "единственный правильный", а лучше смотрите на это как на один из множества различных. Будьте внимательны у вас могут спросить очень много различных других тем на той или иной секции.
Удачи!
@JOHNucsmCENA 2 ปีที่แล้ว ⁺²
Привет! Спасибо большое за видео. А можно попросить расшарить видео по деревьям и градиент бустингу которое упоминалось в конце видел?
@ШамильНуркаев-щ3ъ 2 ปีที่แล้ว
Спасибо за видео, нужно больше такого качественного контента!
Не смог найти запись с Игорем про бустинги :(. Было бы здорово прикрепить ссылку под видео.
@stasgafarov 2 ปีที่แล้ว ⁺⁶
Вот лекция Игоря про бустинги th-cam.com/video/wnTlsXaVj-s/w-d-xo.html
@Extremesarova 2 ปีที่แล้ว ⁺²
По поводу очистки памяти мне кажется, что немного напутали. В Python отдельно есть счетчик ссылок и сборщик мусора. То, что вы описали больше похоже на счетчик ссылок, а вот сборщик мусора (garbage collector) позволяет отслеживать ситуации с кольцевыми зависимостями - он отслеживает объекты-контейнеры, которые содержат в себе ссылки на другие объекты и смотрит доступны ли они или нет, если нет, то удаляет и работает он не постоянно - использует определенные эвристики, чтобы определить, когда нужно запуститься.
@stasgafarov 2 ปีที่แล้ว ⁺³
@@Extremesarova так и есть, я ниже в комментариях ответил про ref counting gc и ggc. В целом для джуна достаточным было бы понимание про подсчет ссылок, что есть "нечто" которое работает с ссылками друг на друга, или кольцевыми зависимостями, такой ответ бы принял, частности зачастую спрашивают на уровне выше. Там же и вопросы про GIL
@Olga-c2t 2 ปีที่แล้ว ⁺³⁶
В любом случае делайте пожалуйста почаще такие собеседования. Пусть розовые очки трещат. Зато хоть что то рядом приближенное к реальности.
@mwave3388 2 ปีที่แล้ว ⁺⁴⁸
Спасибо за видео, очень полезно. Кандидат ещё слабо готов, нужно заниматься. Но вот по поводу отклика, не понятно.
Нужно знать декораторы, итераторы, все метрики, все cross-val стратегии, все функции потерь, уметь делать GD, SGD, бутстрепинг вручную, знать оконные функции в SQL, всю статистику... дальше можно не продолжать.
При том что в видео с Валерой Бабушкиным Лид Сеньоры не могут рассказать какие фичи будут полезные для предсказания рекламы. Покажите мне хотя бы одно интервью с человеком, которого всё это спросили и который ВСЁ это знает. Единороги только в сказке живут.
@ilnurismagilov6340 ปีที่แล้ว ⁺²
Согласен, странный подход.
Хорошо бы приоритезировать подготовку к собеседованию.
Силу фич, так сказать, указать. Где фичи - навыки программиста, а сила - повышение шанса получить работу
@bbudikkb3244 ปีที่แล้ว
Так о чём речь? У джуна нет опыта. Значит должны быть знания)))
@aleksgor1408 2 ปีที่แล้ว ⁺³⁹
Крутой собес. Только из за Дмитрия и посмотрел. Т к вместе в Хакатоне участвовали в одной команде. Дима хорошо практически подкован. И молодец, что прокачивает себя в собесах, думаю успех неизбежен в скором времени. Я думаю junior на то и junior, что есть где то пробелы. Невозможно все запомнить, как меня поддержали и сказали на одном собесе. Переодически что то забывается из за большого пласта ds, особенно когда активно много учишь.
Я бы на такой собес не решился бы на Ютуб ).
@ДмитрийСорока-е1й 2 ปีที่แล้ว ⁺⁵⁴
Мне хочется сказать.
Мои отношения с питоном я бы оценил как «примерно такие же как с русским языком», т.е. я довольно сносно могу на нем разговаривать, писать тексты и пользоваться его гибкостью, при этом если попросить меня сейчас сделать коротенький доклад на тему родного языка или поспрашать, в формате этого интервью, я практически ничего не смогу рассказать…, я не знаю (уже не помню) что такое причастие, деепричастные обороты, подлежащее и сказуемое (при желании смогу быстро восстановить эти знания)…. Примерно такая же история и с питоном…, я не испытываю сложностей с написанием кода и реализацией задач/решений (+ достаточное количество источников, в которых всегда можно что-то уточнить и допонять), при этом часто отдаю себе отчет что гибкость питона позволяет сделать мой код «более оптимальным». Есть опыт, но нет академических знаний и я работаю над этим.
Все мои знания получены из онлайн источников и литературы…. и ничего страшного в этом, нет до тех пор пока ты не столкнешься с необходимостью разговаривать на эти темы, вот тут начинается весело!!!...., получив вопрос/задачу, понимая что ты имеешь необходимые знания для ответа или решения, нередко бывает так, что начинаешь нести какую-то лютую дичь и когда несешь ее даже отдаешь себе в этом отчет, при том что я, например, имею хороший опыт публичных выступлений и у меня нет страха на эту тему…. Я вижу проблему в бедности профильного разговорного опыта, я очень мало разговаривал на эти темы живым языком с живым собеседником (речь даже не про интервью), я/мы_такие_же даже создали чат в telegram, где регулярно устраиваем друг другу собесы (джун джуну), перерастающие в обсуждения…ой, я даже скажу: команда из этого чата поучаствовала в одном из хакатонов и попала в ТОП-10, это опять/еще_раз был опыт общения, работы над задачей и питчем, в том числе.
К сожалению нигде (я не встречал) не освещается вопрос психологии интервью, это важно для всех особенно для джуна (совет типа «главное не волнуйся» - почему-то не работают).
@ДмитрийСорока-е1й 2 ปีที่แล้ว ⁺³⁸
Перед тем как согласится/податься на это интервью я просмотрел несколько подобных…. И конечно же (видимо как многие) я сидел с чашкой чая, глядя в монитор рассуждал о том что, уж если «такие», с «такими» знаниями выходят на рынок, то меня будут просто с руками отрывать, как только я резюме выложу…, в режиме просмотра подобного интервью, ты конечно же пропускаешь через себя все вопросы, которые задают интервьюируемому, конечно имеешь на них ответы и удивляешься тому, как таких простых вещей можно не знать, плавать в них и вообще на что-то претендовать в этой индустрии….
«Диванным генералам» я желаю иметь силы подписаться на что-то подобное!
Кроме того нужно понимать что в жизни все гораздо жестче и то, что вы видите сейчас на видео все-таки некий продукт, приближенный к реальности.
После интервью меня колотило как «в холодную ночевку на четырех тысячах», утром я проснулся другим человеком и написал Стасу: «Стас, жизнь разделилась на "до и после"...Спасибо огромное !!!». Мне есть чем заняться. Спасибо КС, спасибо Стас!!!
@ShouseD 2 ปีที่แล้ว ⁺²
а можно в вашу группу джунов вступить?
@nikita9311 ปีที่แล้ว ⁺²
Как попасть в чат?
@li.nikolas ปีที่แล้ว ⁺¹
Как успехи в специальности ? Работаете ? подтянули темы ?
@ЭдуардПольников 2 ปีที่แล้ว ⁺⁸⁷
Очень интересно, если посмотреть такое же интервью с middle и senior уровнями.
@vadimvadim1662 2 ปีที่แล้ว ⁺¹
такие уже есть на канале Fless
@stasgafarov 2 ปีที่แล้ว ⁺²⁴
Возможно в ближайшее время сделаем с Middle уровнем парнем. Будет жесткий собес
@vadimvadim1662 2 ปีที่แล้ว ⁺³
@@stasgafarov собесы с джунами веселее смотреть, да и количество потенциальных джунов явно больше нежели мидлов
@ЭдуардПольников 2 ปีที่แล้ว ⁺¹
@@stasgafarov это заслуживает лайк!!!)
@han-stroy 2 ปีที่แล้ว ⁺⁴²
Вообще дядька молодец. Но я был не много разочарован тем, что сам интервьюер не дал четкого понятия, почему лес работает лучше деревьев. Ответ то прост, отдельное дерево значительно переобучается, то есть дисперсия большая, смещения нет. А лес из множества независимых деревьев, сохраняет отсутствие смещения плюс еще и уменьшает дисперсию (по-моему на корень из N- независимых деревьев, а для этого уже применяется бэггинг). В итоге получаем модель без смещение и с маленькой дисперсией - профит.
@noname-bi7ve 2 ปีที่แล้ว ⁺²
ответ прост, но он у вас неправильный
@han-stroy 2 ปีที่แล้ว ⁺¹²
@@noname-bi7ve Аргументированно!
@Extremesarova 2 ปีที่แล้ว ⁺⁵
@@han-stroy у вас все +- верно, если вы говорите про глубокие деревья.
- У одного неглубокого дерева небольшая дисперсия и большое смещение (в среднем предсказывает не очень точно, зато стабильно - улавливает только высокоуровневые паттерны).
- У одного глубокого дерева большая дисперсия и небольшое смещение (точно предсказывает на тренировочной выборке, но результат меняется от выборки к выборке - переобучается).
В случайном лесе, по идее, стоит использовать глубокие деревья - за счет этого будем достигать небольшого смещения (высокой точности), а большУю дисперсию будем уменьшать засчет бэггинга (метод случайных подпространств поможет сделать базовые модели (деревья) менее скоррелированными между собой).
Поэтому случайный лес и лучше отдельного дерева - позволяет уменьшить обе компоненты ошибки в bias-variance decomposition.
@han-stroy 2 ปีที่แล้ว
@@Extremesarova Все правильно. Суть леса - сократить дисперсию за счет использования независимых деревьев (конечно грубоких/переобученных) Чем больше независимых деревьев будет, тем больше будет сокращена дисперсия. Не помню сейчас, дисперсия сокращается либо на корень из N независимых деревьев, либо на N деревьев.
@1233-f7h หลายเดือนก่อน
@@han-stroy сокращается на N (где N - кол-во базовых алгоритмов), это можно вывести посчитав дисперсию для ансамбля. Но тут важный момент - уменьшение дисперсии в N раз справедливо только в случае если базовые алгоритмы слабо коррелируют (ну, если строго говорить, то вообще не коррелируют, тогда действительно ровно в N раз) друг с другом, для этого в рандом форесте при построении деревьев в каждом листе используют только часть признаков. Поэтому несмотря на кажущуюся простоту и силу, тот же рандом форест на практике уступает бустингу.
@zokirzokir3201 2 ปีที่แล้ว ⁺²⁹
Отличный формат. Пора мне уже написать нормальное резюме, чтобы меня пригласили на собес, потому что в этом интервью для меня всё очень просто 😅
@ЖенькаЛопотин ปีที่แล้ว ⁺⁴
Ну и как успехи? Нашёл работу? Или хотя бы резюме то написал?)
@zokirzokir3201 ปีที่แล้ว
@@ЖенькаЛопотин не, трусы шью)
@sergeybobkov9354 2 ปีที่แล้ว ⁺⁷
Супер полезный ролик, дает очень четкие представления о том, как выстраивать план обучения
@НикитаИванов-д6с 2 ปีที่แล้ว ⁺¹⁸
Благодарю за это видео! Помогло определить собственные слабые стороны...Надеюсь будут еще в ближайшем будущем!😁
@Extremesarova 2 ปีที่แล้ว ⁺⁷⁷
Было бы идеально, если бы была разметка по темам и вопросам с таймкодами :)
@karpovcourses 2 ปีที่แล้ว ⁺³⁰
Уже работаем над тем, чтобы это было в каждом видео :) Сейчас хотели быстрее выложить.
@nuri3029 ปีที่แล้ว ⁺¹
Подушню: set изменяемый тип. Послышалось на 6 минуте, что его отнесли к неизменяемым. Спасибо! Очень полезно!
@alexandreabramtsev9160 2 ปีที่แล้ว ⁺⁵
15:45 есть еще 1 споcоб. Пропустить через конструктор - те написать b = dict(a)
@ДарьяМозгова-у2ш 2 ปีที่แล้ว ⁺⁸
Спасибо за видео и примерное понимание вопросов! Поняла, что с блоком питона у меня полный замес. Интересно, что АБ руками не трогала, но знания с курса маркетинга вспыли внезапным образом и оказывается все не так плохо )
Подход Станислава - лучшее, что может случиться на первом собеседовании. Скорее всего в реальности все будет не столь бережно и дружелюбно, но жить стало лучше, жить стало веселее :)
@savelygornov1060 2 ปีที่แล้ว ⁺²¹
Круто, но хотелось бы увидеть полноценную часть по питону
@ПавелИванов-э6ы 2 ปีที่แล้ว ⁺¹
+
@dmitriy7474 2 ปีที่แล้ว ⁺⁴⁸
Я из всех слов только стринги знаю
@ivanshelonik3979 2 ปีที่แล้ว ⁺⁵
Cross Validation is usually a very good way to measure an accurate performance. While it does not prevent your model to overfit, it still measures a true performance estimate.
@artyomstepanov7484 2 ปีที่แล้ว ⁺²⁶
Если исходить из предположения, что среднестатистический джун- это студент/свежий выпускник вуза, то спрашивать джунов про A/B-тесты- это жёстко. Кажется, что в A/B-тестах много тонких моментов, которые объективно приходят только с практикой + A/B-тесты в вузах не преподают. Если бы вместо A/B-теста в собесе была просто статистика, было бы ок
@liveworkdie 2 ปีที่แล้ว ⁺²
A/B тест входит в любой платный курс по DS, поэтому абсолютно не лишним спросить про A/B
@artyomstepanov7484 2 ปีที่แล้ว ⁺³²
@@liveworkdie А когда платные курсы успели стать необходимым условием для того, чтобы попасть на первую работу? Если человек меняет профессию, то аргумент с платными курсами роляет, но на профильных специальностях в вузах, как это ни забавно, A/B-тестам не учат
@liveworkdie 2 ปีที่แล้ว ⁺²¹
@@artyomstepanov7484 собственно встречный вопрос - а когда успешное прохождение программы ВУЗа стало критрием успеха для того, чтобы занять позицию джуна DA/DS? Если неизвестно, что такое A/B и неизвестно как применять/дизайнить исследование, то это не позиция джуна, а позиция интерна/стажёра. На работу ищут людей с навыком, не с дипломом. Диплом может стать бенефитом и только.
@artyomstepanov7484 2 ปีที่แล้ว ⁺⁶
@@liveworkdie А я и не говорил, что профильный вузовский диплом является необходимым и/или достаточным условием для получения работы. Мое фи преимущественно связано с тем, что большинство людей в ds- это выпускники профильных направлений, которые не проходили в вузах A/B-тесты, но при этом устроились на джуновскую должность без этих знаний и прекрасно себя сейчас чувствуют. Поэтому и считаю, что с джунов можно и не требовать A/B-тесты
@liveworkdie 2 ปีที่แล้ว ⁺⁵
@@artyomstepanov7484 в индустрии не определились, что такое специалист в области DS. Что касается требований к позиции джун DS - тем более. Мы не видели сферических требований в вакууме к этому джуну. Может там уже подразумевалось A/B? Повторюсь. Не вижу проблемы в том, чтобы спросить про А/B, потому что это стартерпак любого платного курса и это камень в сторону вузовского образования.
@ilyachepelov1744 2 ปีที่แล้ว ⁺¹⁸
За видео Спасибо! Полезное для себя нашёл.
Так проводит собеседование на позицию Junior DS лично Станислав, или так проходит среднее собеседование в большинстве компаний?
Неужели алгоритмическая история яндекса про "напиши с 0 существующую функцию" (groupby) важнее, чем проверка умения пользоваться тем же "groupby", "pivot_table", "merge"?
Год работаю 90% времени с SQL - оконные функции понадобились 1 раз.
Вопросы по ML хорошие.
@stasgafarov 2 ปีที่แล้ว ⁺³
Скорее стоит воспринимать как провожу собеседования я. Честно говоря из опыта оконными функциями я пользуюсь очень часто особенно когда создаем train датасет с данными по сигналу за какой-то временной период
@bogdanns2 2 ปีที่แล้ว ⁺¹
@@stasgafarov а я привык по максимуму все делать в пандасе)
Да, это не очень оптимально с точки зрения ресурсов при обработке данных, особенно если обработка идёт в пандасе на локальной машине (в отличие от сервера БД), но лично мне проще, поэтому и sql меня храмает)
Занимался прогнозами продаж, огромное количество признаков делал в пандасе, недоумеваю, как их в скуле можно делать. Ну а тоже скользящее среднее или лаги реализованы в готовые функции.
А так спасибо за интервью, почерпнул немало ньюансов
@ПавелИванов-э6ы 2 ปีที่แล้ว ⁺⁵
Спасибо большое за интервью. Имею сопоставимый уровень с собеседкемым и просмотр был очень полезен. Не совсем понятно, что значит "data scientist". Будет очень приятно видеть аналогичные интервью , но для junior/intern ml engineer.
@QScientist ปีที่แล้ว
в начале на 16й минуте можно было еще сделать передачу в функцию двух словарей, и в функции написать b['z']=99 и например генератором или map ом копирнуть до вызова самой функции
@teamsonbut5632 ปีที่แล้ว ⁺¹
Машинное обучение с большими данными это всего лишь одно из направлений науки о данных. На самом деле в этой области кит утонет)). А человек и подавно. Просто кто-то хорошо разбирается в алгоритмах, кто-то в данных и их конфигурациях, кто-то умеет быстро печатать текст, а кто-то знает кучу формул и умеет их применять. Почему открылось такое направление в науке? Да потому что каждый способный человек в вычислительном деле может предложить что-то уникальное, но вот это уникальное не каждая машина способна обработать и вот для этого была основана такая наука - чтобы идеи переводить в реализацию. К сожалению в этом направлении произошли все прорывы, которые возможны на нашем уровне конфигураций самого "железа". Так что будем ждать чего-то прорывного, которое сможет дать пищу для мозгов одарённых людей!)
@artemqqq7153 2 ปีที่แล้ว ⁺¹
В первый раз услышал про A/B тесты)
@xandrviking1113 3 หลายเดือนก่อน
Оконные функции на джуна ? Мир реально сошёл с ума !
@guru_Fuff 2 ปีที่แล้ว ⁺⁴
Дмитрий молодец
@petyap7600 2 ปีที่แล้ว ⁺³
На последний вопрос ответы не осознал. Нужна помощь.
"В каких случаях логрег лучше случайного леса?" - когда есть несколько хороших признаков и много шумных?
"Почему" - берутся подвыборки признаков, тем самым размывается влияние сильных признаков и в среднем каждое дерево предсказывает значение хуже случайности?
Честно говоря, всегда думал, что в лесах минус только в скорости.
@ВалентинПрокопец-з9ю 2 ปีที่แล้ว
Насколько я понял, если у тебя очень много шума в твоих данных, то какое-то дерево из твоего случайного леса может взять себе в качестве подмножества ТОЛЬКО шум. Как следствие результат его обучения будет даже хуже 0.5, то есть хуже подбрасывания монетки. Если шума действительно много, то несколько деревьев могут так обучиться и давать очень плохие результаты. А случайный лес эффективен только тогда, когда большая часть деревьев даёт результат больше 0.5. Регрессивный метод просто отсекает лишний шум и работает с настоящими данными, поэтому в таком случае он куда эффективнее.
@nuri3029 ปีที่แล้ว
Было очень круто!! Спасибо
@alevadnaya 2 ปีที่แล้ว ⁺²
Спасибо, очень интересно
@stalkermustang 2 ปีที่แล้ว ⁺⁸
Видел, в комментах спрашивали про видео "Игоря Котенкова про бустинг и деревья". Вот это видео, th-cam.com/video/wnTlsXaVj-s/w-d-xo.html . Правда я не согласен со Стасом, что там говорится про подбор гиперпараметров - так, очень верхнеуровнево, потому что это не было целью лекции.
@stasgafarov 2 ปีที่แล้ว
Ой ладно тебе, ты отлично про гиперпараметры рассказал, остальное можно спокойно нагуглить, руководств чуть больше чем дофига.
@ОлегПетров-ю4п 2 ปีที่แล้ว
Спасибо за видео, очень полезно.
@ИринаГришакова-р2щ 2 ปีที่แล้ว ⁺¹
Спасибо. Было реально полезно
@alexeykazakov3694 2 ปีที่แล้ว
Супер! Хочу еще видосов типа такого)
@ivanshvedov1823 2 ปีที่แล้ว ⁺¹
Во второй задаче можно было пересоздать словарь b = dict(a) без for key value
@elenagavrilova3109 7 หลายเดือนก่อน
Сорри как можно в DS не пользоваться set? Интервью классное, полезное! Спасибо!
@Ybuotue 2 ปีที่แล้ว
Очень круто, спасибо за Джуна.
@МаксимСверидов-п8н 2 ปีที่แล้ว ⁺²
Крутое видео! Можно ли ссылку на хвалёное выступление про решающие деревья?
@traveler-i1z 7 หลายเดือนก่อน
1:02:41 насчет неинициализированной переменной
Ну такие ошибки уж джун должен сам исправлять
@BetForBeer 2 ปีที่แล้ว ⁺⁷
Сеты изменяемый тип данных.
@stasgafarov 2 ปีที่แล้ว ⁺²
Согласен, был уставший напутал.
@ГригорийМитраков 2 ปีที่แล้ว
frozenset - неизменяемый
@lfc9671 2 ปีที่แล้ว
Здравствуйте. Спасибо! В принципе, я понял как демонтировать подлокотник с Мазды 6 GH
@old_bedouin 2 ปีที่แล้ว ⁺⁶
Камон, мы не можем использовать t test на бутсрапированных данных из за нарушения правила независимости
@ТамілаНикитишин 2 ปีที่แล้ว ⁺¹
6:01 set - mutable, frozen set immutable
@romanbush5164 ปีที่แล้ว ⁺²
Похоже мужик больше математик - профессор чем програмист 👍, 2 часть обсолютно не понял, где это изучить. Даже я такие тонкости питона не знал).
@sjdjjsjsjs3991 3 หลายเดือนก่อน
Так в программирование из математики приходят
@СергейЮров-б6е 2 ปีที่แล้ว ⁺¹
Крутой контент. Даже не в плане вопросов, а просто атмосферы. А что, можно говорить про ML без линейной алгебры? Я не докапываюсь, просто недопонял.
@danilmrt2633 2 ปีที่แล้ว ⁺¹
Большое спасибо за видео! Про какую лекцию Игоря о Random Forest в конце идет речь?
@maximstuff4417 2 ปีที่แล้ว
Добрый день, не нашли?
@1233-f7h หลายเดือนก่อน
6:00 сеты это mutable тип данных.
@vinylrave2185 2 ปีที่แล้ว ⁺³
у меня как-то на собесе на джуна нужно было ml в прод запустить
@blackbigdeath ปีที่แล้ว
Хороший собес, только длинный, мне кажется нормального джуна можно задетектить за полчаса. Соискатель имеет знания в области матана, но они резко прореживаются в области понятий машинного обучения. Да и питона можно было накануне подтянуть. В некоторых вопросах сдавался на второй попытке, хотя мог продолжать отвечать. Надо учитывать что со сторны пришедший человек - ему не так легко подхватить контекст, в котором вы варитесь. Джуном он смог бы работать.
@ShouseD 2 ปีที่แล้ว
48:37 "нет это сложно, давай еще раз!"
Я б на его месте начал мычать че-нить нечленораздельное)
@usachevplayer 2 ปีที่แล้ว ⁺²
Мне показалось решение с груп бай сложнее чем должно быть, почему нельзя так сделать просто, с учётом, что размерности одинаковые?
C = {}
for i in range (0,len(A)):
if B[i] in C:
C[B[i]] += A[i]
else:
C[B[i]] = A[i]
@cv462-l4x 2 ปีที่แล้ว ⁺¹
потому что zip сам сделает связку, это наглядно говорит, что элементов в A и B одинаковое количество. И зачем вы делаете условия, когда в ролике показали, что есть просто метод get, позволяющий сделать то же самое более компактно?
@МихаилЕрмолаев-ч3н 2 ปีที่แล้ว
Станиславу бы еще филмьыозвучивать, тембр голоса киношный.
@amirnurken5747 ปีที่แล้ว
Подскажите пожалуйста, полноценная ли оценка возможностей в таком формате, если к примеру претендующий на должность - не обладает теоретическими знаниями, но на практике, способен справиться с любой задачей уровня junior? Заранее спасибо!
@alex.wizard ปีที่แล้ว
Ребят. Просьба перед выкладыванием видео - усиливать звук.
@JohnSmith-fi7ir ปีที่แล้ว
А как там что побутстрэпить что бы сгенерировать там отклонения или что-то?)) Бутстрэпинг это легально?
@spyphyfarnsworth6050 หลายเดือนก่อน
это уровень mini-junior
@gbrs72 ปีที่แล้ว
44:25 смотря что значит пересечение, разве в иннерджойне не может быть до 625 элементов?
@ntiltt 2 ปีที่แล้ว ⁺⁵
А можно пожалуйста ссылку на видео про мл, про которую говориться в обратной связи?
@cv462-l4x 2 ปีที่แล้ว
th-cam.com/video/wnTlsXaVj-s/w-d-xo.html
@Stk770 2 ปีที่แล้ว ⁺⁴
Всем привет! Кто-нибудь, поделитесь, пожалуйста, записью выступления Котенкова, про которое рассказывает Стас
@falsenegative 2 ปีที่แล้ว
тоже не нашел
@cv462-l4x 2 ปีที่แล้ว ⁺³
th-cam.com/video/wnTlsXaVj-s/w-d-xo.html не благодарите )
@dimapugach5586 2 ปีที่แล้ว ⁺¹
Добрый день, спасибо за интересное собеседование. После просмотра остался вопрос о приоритетах разных этапов собеседования. Можно ли за счет хорошо отвеченного например python чуть хуже ответить на работу с данными и получить место?
@cv462-l4x 2 ปีที่แล้ว
нет нельзя ) очевидно, что тогда бы остальное не спрашивали. Если вы знаете питон и не знаете ML, то ищите работу программиста на питоне, а не аналитика в ML
@ГлуховскийСергей 2 ปีที่แล้ว ⁺¹
А что за статьи от exbf, про ненормальность
@partykiev8894 2 ปีที่แล้ว
честный рандом нельзя предположить
@antonkurtis7698 2 ปีที่แล้ว ⁺²
Почему не во всех компаниях такой тех собес? Ответил на 90% вопросов\заданий из видео, но в реальной жизни на работу так и не устроился.
Вопрос еще Интервьюеру : смотрят ли на возраст потенциальных работников? Поздно ли джуном идти в 37 лет?
@stasgafarov 2 ปีที่แล้ว ⁺¹
Готов ли ты попробовать на камеру ответить на вопросы, при условии что они могут быть другими, но тоже уровня Junior?
Отвечая на вопрос, да говорят порой смотрят, но я честно говоря ниразу не сталкивался с этим в живую. Как мне кажется, нет не поздно, но лучше всего попробовать получить какой-то реаьлный опыт и иметь портволию за счет pet-проектов. В ODS есть отдельно чатик pet-projects в котором можно найти либо команду либо проект в портфолио.
@kimfilbi8522 8 หลายเดือนก่อน
Подскажите, о каком именно выступлении Игоря Котенкова шла речь?
@karpovcourses 8 หลายเดือนก่อน
В комментариях подсказывают, что об этом: th-cam.com/video/wnTlsXaVj-s/w-d-xo.htmlfeature=shared
@kimfilbi8522 8 หลายเดือนก่อน
@@karpovcourses спасибо большое
@Антон-ы5р4ф 2 ปีที่แล้ว ⁺¹
Видео крутое, спасибо, но вопрос: заплатить достаточно денег за курс и не знать, что такое валидация - это нормально?)
@stasgafarov 2 ปีที่แล้ว ⁺⁴
Вообще вопрос с валидацией и построением грамотной валидации для проверки вашей модели чуть больше чем сложный. Думаю если вы учавствовали хоть раз в соревнованиях по маш обучению на кегле или хоть раз делали хорошую модель обладающую высокой обобщающей способностью вы были бы чуть более сдержанным. Чтобы не быть голословным и привести пример, лучше всего посмотреть Mercedes-Benz Greener Manufacturing Kaggle Competition и конкретно разбор Даниила Савенкова
@Анастасия-с9с3л 2 ปีที่แล้ว ⁺¹
Очень хочется узнать, всегда нужно вот именно так, в диалоге с интервьюером, писать код или можно сказать: "дайте несколько минут подумать и помолчите пожалуйста"? ))
@karpovcourses 2 ปีที่แล้ว ⁺¹
Будет абсолютно нормально, если вы попросите пару минут в тишине!
@nataliamarkova4506 2 ปีที่แล้ว ⁺¹
Мне как-то один лид сказал, что написать градиентный спуск - это прям базовый уровень. Станислав, что думаете об этом? Тут человека не стали спрашивать, получается, это уже на джун +?
@stasgafarov 2 ปีที่แล้ว ⁺²
Честно говоря мой ответ будет следующим: В случае когда человек не может ответить какие-то простые вещи например линейную регрессию, и как именно линейная регрессия с помощью градиентного спуска обновляет коэфициенты при признаках, могут попросить написать градиентный спуск, чтобы удостовериться что человек действительно понимает что происходит.
@Серьезныйчеловек-о5й ปีที่แล้ว ⁺¹
когда set стал неизменяемым? элементы множества неизменяемы, а вот сам set изменяем
@SmadyarovBerik 3 หลายเดือนก่อน ⁺¹
Кто знает ответ на вопрос со звездочкой ? 1:28:20
@tapah36 2 ปีที่แล้ว ⁺⁶
Выключил на моменте, что tuple и namedtuple неизменяемые, остальные меняемые.
К вашему сведению, числа, строки и булевы значения так же являются неизменяемыми типами данных.
@olegmakarov7877 2 ปีที่แล้ว
вМеняемые
@vilgubaydullin1195 2 ปีที่แล้ว
Не понимаю смысл задачи со звездочкой. Получается так, что одного дерева будет достаточно для разбиения. Или вопрос в том, что лес может быть хуже? То есть эксперта в кричащей толпе никто не услышит.
нельзя ли при переборе параметров для леса поставить n_estimators начиная с 1? Я только учусь, не ругайтесь
@sergeyvladimirovich4560 2 ปีที่แล้ว
В конце упоминаете выступления по деревьям, кажется Игоря Котякова???), скиньте, пожалуйста, ссылку на это видео
@stasgafarov 2 ปีที่แล้ว
в комментариях выше кинули ссылку
@herenickname 2 ปีที่แล้ว
Больше авторов пытался вктатиться в вопрос с group by)
@ioksi4371 2 ปีที่แล้ว ⁺¹
Я конечно не в этой сфере, но вопрос…
Разве глубокие знания питона в этой сфере вообще нужны ?
Я чёт думаю, что там онли готовые абстракции используют и никто не пишет свои костыли бесполезные
Просто надо знать где что применять
@traveler-i1z 7 หลายเดือนก่อน
Вопрос звучит примерно как «а зачем учить программирование если chatgpt скоро сам код будет писать и программисты не нужны»😁
Ну да, эта область(data science) в целом та же разработка, просто с уклоном в математику.
Где то разработка с уклоном в сети, где то в бд и прочее
А тут уклон в математику, но оно не перестает быть разработкой
@voisan1904 2 วันที่ผ่านมา
работа с бд,работа с оптимизацией моделей,а иногда и самому реализовать что нибудь.Никто не просит шарить на уровне многопоточки ,хватит базового понимания ооп,как устроена память и т.п.
@СвятославВерцанов 2 ปีที่แล้ว
Странно немного что небыло вопросов про препроцессинг. А так в целом оч даже.
@РусланЮсупов-у2ж 2 ปีที่แล้ว
Спасибо .
@kislovdmitry4981 2 ปีที่แล้ว
При рассказе интервьювером о gc есть ощущение смешения rcgc (ref counting gc) и ggc (generational gc); gc.collect это про ggc...
@stasgafarov 2 ปีที่แล้ว
да, я несколько упростил, и не расскаазывал про особенности работ rcgc и ggc, в целом эти частности хорошо знать на уровне Middle+/Senior DS (но для разраба это точно стоит знать), и оч хорошо когда человек сталкивался с проблемами в живую
@maggie_mermaid3678 2 ปีที่แล้ว ⁺³
А декораторы прям использует кто-то? Я никогда нигде не видела их, в университете только препод один любил по ним вопросы на экзамене задавать.
Дмитрию спасибо, что не побоялся поучаствовать!)
@taygind 2 ปีที่แล้ว ⁺²
Например, при создании dag в airflow
@maggie_mermaid3678 2 ปีที่แล้ว
@@taygind пошла гуглить) Спасибо)
@nicejke9630 2 ปีที่แล้ว ⁺¹
Декораторы в целом гига полезная и удобная штука, поскольку позволяют с легкостью менять поведение уже написанных функций. А используют их мало потому что многим просто лень разбираться что это за зверь и как работает)
@maggie_mermaid3678 2 ปีที่แล้ว
@@nicejke9630 придется тоже тогда понять) Действительно, нигде не видела их кроме, как на лекциях в университете. Теперь благодаря TaygindK нашла примеры.
@stasgafarov 2 ปีที่แล้ว ⁺²
наверное самое интересное, что большинство вызовов библиотек которые вы используете были написаны с помощью декораторов. Например функция pandas.read_csv() если провалиться в код и посмотреть реализацию можно увидеть декораторы Appender(что на самом деле callable класс) и deprecate_nonkeyword_arguments.
@Igor-sp7tw 2 ปีที่แล้ว
Стас ты говорил про выступление Игоря Котенкова 1:38:12 а можешь ссылку дать
@RNG_name_generator หลายเดือนก่อน
th-cam.com/video/wnTlsXaVj-s/w-d-xo.html
@ifrenzyk 2 ปีที่แล้ว
Дайте пожалуйста ссылку на видео Игоря о котором говорилось в конце
@stasgafarov 2 ปีที่แล้ว
если про бустинги то в комментариях выше ответил. Если про не градиентные методы оптимизации то можно попробовать найти на канале в видео
@maximstuff4417 2 ปีที่แล้ว
О какой лекции Игоря Котикова идет речь?
@cold_heart_i 2 ปีที่แล้ว
Насколько я помню в деревьях решений фичи без возврата берутся
@НикитаРоманов-е3п 2 ปีที่แล้ว
Многие вопросы отвечал за Дмитрия, это не очень круто. В остальном познавательно👍
@nonameanonimous1012 2 ปีที่แล้ว
Не корректные вопросы в начале. По поводу изменяемых и не изменяемых данных. Видно же, что интервьер не понял их смысла. Он отвечал (на мой взгляд от части правильно), что сами данные изменяемые. Имея ввиду их значения. А не само положение в адресном пространстве памяти.
@erlanabdraimov3088 2 ปีที่แล้ว
def checking(a: list, b: list) -> dict:
result = {}
pointer = 0
for item in range(len(B)):
if b[item] not in result:
result[b[item]] = a[pointer]
pointer += 1
else:
if b[item] in result:
result[b[item]] += a[pointer]
pointer += 1
# for item in range(len(A)):
# if b[item] in result:
# result[b[item]] += a[item]
return result
result {'c': 21, 'a': 15, 'b': 18}
@vlad_covers 2 ปีที่แล้ว
def groupbysum(a, b):
dt = defaultdict(int)
for val, i in zip(a, b):
dt[i] += val
return dt
@luckytima2315 2 ปีที่แล้ว ⁺¹
Сразу видно что у человека первый яп это пайтон ))
@mlpython1089 2 ปีที่แล้ว ⁺¹
Спасибо за материал.
Скажите, пожалуста, как сечас обстоят дела с ML. Последние события ведь должны были обнулить релевантную историю данных.
@gorodiskykirill4193 2 ปีที่แล้ว ⁺¹
Можете немного подробнее описать, что за события такие? Data Science ведь сейчас довольно популярное и перспективное направление.
Спасибо.
@liveworkdie 2 ปีที่แล้ว ⁺²
>обнулить релевантную историю данных.
what does it mean?
@liveworkdie 2 ปีที่แล้ว ⁺⁸
Github работает, доки по либам работают, материалы доступны, технологии в основном опенсорс. Про какие события идёт речь понятно, как это должно было повлиять на ML непонятно. Тем более если у нас есть православный catboost.
@aleksandrsvetlichnyy1576 2 ปีที่แล้ว ⁺²
@@liveworkdie и lgbt classifier 😄
@gorodiskykirill4193 2 ปีที่แล้ว ⁺⁴
@Максим В курсе, сам с Украины и видел кадры Мариуполя от друзей, которым посчастливилось выехать.
Думал, может человек имеет ввиду что-то другое, например какой-то технический прорыв в технологиях, что изменяет положение дел в ML. Просто автор не совсем понятно выразился по поводу "релевантной истории данных"
Слава Украине и нашим воинам!🇺🇦
@HOOKAH10 2 ปีที่แล้ว
Того кого собеседовали окончил Каарпов курс ?
@СергейПанин-л6к 2 ปีที่แล้ว ⁺¹
Я конечно понимаю мотивацию интервьюера довести интервьюируеомого до нужного ответа, но если человек не знает что такое указатели и как они работают, он никогда до этого не дойдет. И выглядит это как мучение.
@VitalyKoryakin 2 ปีที่แล้ว ⁺¹
Хм, буду знать, что мок интервью - это бесплатная лекция по азам программирования 🙄
@eduardganzha1385 2 ปีที่แล้ว
Воу, я представлял, что собеседование будет на много сложнее. Но на процентов 80 вопрос я бы ответил точно)
@shamanart456 ปีที่แล้ว
Зачем я это смотрю, не знаю)
@egor3974 2 ปีที่แล้ว
А может кто-то помочь с линкой, которую предлагали в конце видео про деревья? А то чего-то повылазило(
@stasgafarov 2 ปีที่แล้ว
ответил в комментариях выше
@b_o_r-d5d ปีที่แล้ว
отучился в яндекс практикуме 6 месяцев на аналитика данных, и в целом процентов 10-20 смог бы ответить. ещё учится и учится...
@surfcoffe ปีที่แล้ว
🤒
@eu_dz8684 2 หลายเดือนก่อน
cейчас работаете?
@russvetden9342 ปีที่แล้ว ⁺³
2 минуты посмотрел испугался и выключил. И это джуниор. На Сеньёра наверное как на космонавта собеседуют
@TeppopucT ปีที่แล้ว ⁺⁶
Не... На синьора как в боевых искусствах на высоких рангах...
Просто смотрят друг на друга секунд 20 и после этого уже всё всё понимают.
@ЕгорБеззубенко-в1п ปีที่แล้ว ⁺¹
В реале на такой собес даже попасть сложно, а спрашивают шире и глубже, так как конкурсы большие на место, и даже ответив всё отлично, запросто пролетаешь. И так раз 50
@Alex_the_Great_86 4 หลายเดือนก่อน
append - это метод, а не функция
@darkelectro7044 2 ปีที่แล้ว
первый же вопрос меня опрокинул😅
@АртемТит-в5ь 2 ปีที่แล้ว ⁺¹
не думаю что с такими знаниями нужно вообще работу искать
@АртемТит-в5ь 2 ปีที่แล้ว
хоть бы у всех такое интервью было)
@wimp825 2 ปีที่แล้ว ⁺¹
Эх, если бы чел получше отвечал, было бы поинтереснее. Но все равно спасибо
@СарматПересветов หลายเดือนก่อน
Знания собеседуемого ниже плинтуса
@aleksandrfrolov7071 2 ปีที่แล้ว
Очень интересно, но ничего не понятно =)))
@evolution_31 2 ปีที่แล้ว ⁺²
Вы прикалываетесь??? что это за собеседование.... позорище, поразвелось датасайнтистов....

ต่อไป

เล่นอัตโนมัติ

Аналитик данных | Собеседование | karpov.courses