Junior Data Scientist | Собеседование | karpov.courses

แชร์
ฝัง
  • เผยแพร่เมื่อ 21 ต.ค. 2024

ความคิดเห็น • 243

  • @stasgafarov
    @stasgafarov 2 ปีที่แล้ว +110

    Друзья всем привет, хотелось бы еще раз поблагодарить Дмитрия за участие, это очень хороший опыт.
    В некоторых ответах есть неточности и ошибки, спишите это нам на то, что мы проводили собес поздно вечером после тяжелого рабочего дня, поэтому немного заговаривались.
    В следующий раз я постараюсь сделать чуть более структурированные вопросы и дать ответы на них. Не стоит рассматривать этот вариант собеседования как "единственный правильный", а лучше смотрите на это как на один из множества различных. Будьте внимательны у вас могут спросить очень много различных других тем на той или иной секции.
    Удачи!

    • @JOHNucsmCENA
      @JOHNucsmCENA 2 ปีที่แล้ว +2

      Привет! Спасибо большое за видео. А можно попросить расшарить видео по деревьям и градиент бустингу которое упоминалось в конце видел?

    • @ШамильНуркаев-щ3ъ
      @ШамильНуркаев-щ3ъ 2 ปีที่แล้ว

      Спасибо за видео, нужно больше такого качественного контента!
      Не смог найти запись с Игорем про бустинги :(. Было бы здорово прикрепить ссылку под видео.

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +6

      Вот лекция Игоря про бустинги th-cam.com/video/wnTlsXaVj-s/w-d-xo.html

    • @Extremesarova
      @Extremesarova 2 ปีที่แล้ว +2

      По поводу очистки памяти мне кажется, что немного напутали. В Python отдельно есть счетчик ссылок и сборщик мусора. То, что вы описали больше похоже на счетчик ссылок, а вот сборщик мусора (garbage collector) позволяет отслеживать ситуации с кольцевыми зависимостями - он отслеживает объекты-контейнеры, которые содержат в себе ссылки на другие объекты и смотрит доступны ли они или нет, если нет, то удаляет и работает он не постоянно - использует определенные эвристики, чтобы определить, когда нужно запуститься.

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +3

      @@Extremesarova так и есть, я ниже в комментариях ответил про ref counting gc и ggc. В целом для джуна достаточным было бы понимание про подсчет ссылок, что есть "нечто" которое работает с ссылками друг на друга, или кольцевыми зависимостями, такой ответ бы принял, частности зачастую спрашивают на уровне выше. Там же и вопросы про GIL

  • @Olga-c2t
    @Olga-c2t 2 ปีที่แล้ว +36

    В любом случае делайте пожалуйста почаще такие собеседования. Пусть розовые очки трещат. Зато хоть что то рядом приближенное к реальности.

  • @mwave3388
    @mwave3388 2 ปีที่แล้ว +48

    Спасибо за видео, очень полезно. Кандидат ещё слабо готов, нужно заниматься. Но вот по поводу отклика, не понятно.
    Нужно знать декораторы, итераторы, все метрики, все cross-val стратегии, все функции потерь, уметь делать GD, SGD, бутстрепинг вручную, знать оконные функции в SQL, всю статистику... дальше можно не продолжать.
    При том что в видео с Валерой Бабушкиным Лид Сеньоры не могут рассказать какие фичи будут полезные для предсказания рекламы. Покажите мне хотя бы одно интервью с человеком, которого всё это спросили и который ВСЁ это знает. Единороги только в сказке живут.

    • @ilnurismagilov6340
      @ilnurismagilov6340 ปีที่แล้ว +2

      Согласен, странный подход.
      Хорошо бы приоритезировать подготовку к собеседованию.
      Силу фич, так сказать, указать. Где фичи - навыки программиста, а сила - повышение шанса получить работу

    • @bbudikkb3244
      @bbudikkb3244 ปีที่แล้ว

      Так о чём речь? У джуна нет опыта. Значит должны быть знания)))

  • @aleksgor1408
    @aleksgor1408 2 ปีที่แล้ว +39

    Крутой собес. Только из за Дмитрия и посмотрел. Т к вместе в Хакатоне участвовали в одной команде. Дима хорошо практически подкован. И молодец, что прокачивает себя в собесах, думаю успех неизбежен в скором времени. Я думаю junior на то и junior, что есть где то пробелы. Невозможно все запомнить, как меня поддержали и сказали на одном собесе. Переодически что то забывается из за большого пласта ds, особенно когда активно много учишь.
    Я бы на такой собес не решился бы на Ютуб ).

  • @ДмитрийСорока-е1й
    @ДмитрийСорока-е1й 2 ปีที่แล้ว +54

    Мне хочется сказать.
    Мои отношения с питоном я бы оценил как «примерно такие же как с русским языком», т.е. я довольно сносно могу на нем разговаривать, писать тексты и пользоваться его гибкостью, при этом если попросить меня сейчас сделать коротенький доклад на тему родного языка или поспрашать, в формате этого интервью, я практически ничего не смогу рассказать…, я не знаю (уже не помню) что такое причастие, деепричастные обороты, подлежащее и сказуемое (при желании смогу быстро восстановить эти знания)…. Примерно такая же история и с питоном…, я не испытываю сложностей с написанием кода и реализацией задач/решений (+ достаточное количество источников, в которых всегда можно что-то уточнить и допонять), при этом часто отдаю себе отчет что гибкость питона позволяет сделать мой код «более оптимальным». Есть опыт, но нет академических знаний и я работаю над этим.
    Все мои знания получены из онлайн источников и литературы…. и ничего страшного в этом, нет до тех пор пока ты не столкнешься с необходимостью разговаривать на эти темы, вот тут начинается весело!!!...., получив вопрос/задачу, понимая что ты имеешь необходимые знания для ответа или решения, нередко бывает так, что начинаешь нести какую-то лютую дичь и когда несешь ее даже отдаешь себе в этом отчет, при том что я, например, имею хороший опыт публичных выступлений и у меня нет страха на эту тему…. Я вижу проблему в бедности профильного разговорного опыта, я очень мало разговаривал на эти темы живым языком с живым собеседником (речь даже не про интервью), я/мы_такие_же даже создали чат в telegram, где регулярно устраиваем друг другу собесы (джун джуну), перерастающие в обсуждения…ой, я даже скажу: команда из этого чата поучаствовала в одном из хакатонов и попала в ТОП-10, это опять/еще_раз был опыт общения, работы над задачей и питчем, в том числе.
    К сожалению нигде (я не встречал) не освещается вопрос психологии интервью, это важно для всех особенно для джуна (совет типа «главное не волнуйся» - почему-то не работают).

    • @ДмитрийСорока-е1й
      @ДмитрийСорока-е1й 2 ปีที่แล้ว +38

      Перед тем как согласится/податься на это интервью я просмотрел несколько подобных…. И конечно же (видимо как многие) я сидел с чашкой чая, глядя в монитор рассуждал о том что, уж если «такие», с «такими» знаниями выходят на рынок, то меня будут просто с руками отрывать, как только я резюме выложу…, в режиме просмотра подобного интервью, ты конечно же пропускаешь через себя все вопросы, которые задают интервьюируемому, конечно имеешь на них ответы и удивляешься тому, как таких простых вещей можно не знать, плавать в них и вообще на что-то претендовать в этой индустрии….
      «Диванным генералам» я желаю иметь силы подписаться на что-то подобное!
      Кроме того нужно понимать что в жизни все гораздо жестче и то, что вы видите сейчас на видео все-таки некий продукт, приближенный к реальности.
      После интервью меня колотило как «в холодную ночевку на четырех тысячах», утром я проснулся другим человеком и написал Стасу: «Стас, жизнь разделилась на "до и после"...Спасибо огромное !!!». Мне есть чем заняться. Спасибо КС, спасибо Стас!!!

    • @ShouseD
      @ShouseD 2 ปีที่แล้ว +2

      а можно в вашу группу джунов вступить?

    • @nikita9311
      @nikita9311 ปีที่แล้ว +2

      Как попасть в чат?

    • @li.nikolas
      @li.nikolas ปีที่แล้ว +1

      Как успехи в специальности ? Работаете ? подтянули темы ?

  • @ЭдуардПольников
    @ЭдуардПольников 2 ปีที่แล้ว +87

    Очень интересно, если посмотреть такое же интервью с middle и senior уровнями.

    • @vadimvadim1662
      @vadimvadim1662 2 ปีที่แล้ว +1

      такие уже есть на канале Fless

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +24

      Возможно в ближайшее время сделаем с Middle уровнем парнем. Будет жесткий собес

    • @vadimvadim1662
      @vadimvadim1662 2 ปีที่แล้ว +3

      @@stasgafarov собесы с джунами веселее смотреть, да и количество потенциальных джунов явно больше нежели мидлов

    • @ЭдуардПольников
      @ЭдуардПольников 2 ปีที่แล้ว +1

      @@stasgafarov это заслуживает лайк!!!)

  • @han-stroy
    @han-stroy 2 ปีที่แล้ว +42

    Вообще дядька молодец. Но я был не много разочарован тем, что сам интервьюер не дал четкого понятия, почему лес работает лучше деревьев. Ответ то прост, отдельное дерево значительно переобучается, то есть дисперсия большая, смещения нет. А лес из множества независимых деревьев, сохраняет отсутствие смещения плюс еще и уменьшает дисперсию (по-моему на корень из N- независимых деревьев, а для этого уже применяется бэггинг). В итоге получаем модель без смещение и с маленькой дисперсией - профит.

    • @noname-bi7ve
      @noname-bi7ve 2 ปีที่แล้ว +2

      ответ прост, но он у вас неправильный

    • @han-stroy
      @han-stroy 2 ปีที่แล้ว +12

      @@noname-bi7ve Аргументированно!

    • @Extremesarova
      @Extremesarova 2 ปีที่แล้ว +5

      ​@@han-stroy у вас все +- верно, если вы говорите про глубокие деревья.
      - У одного неглубокого дерева небольшая дисперсия и большое смещение (в среднем предсказывает не очень точно, зато стабильно - улавливает только высокоуровневые паттерны).
      - У одного глубокого дерева большая дисперсия и небольшое смещение (точно предсказывает на тренировочной выборке, но результат меняется от выборки к выборке - переобучается).
      В случайном лесе, по идее, стоит использовать глубокие деревья - за счет этого будем достигать небольшого смещения (высокой точности), а большУю дисперсию будем уменьшать засчет бэггинга (метод случайных подпространств поможет сделать базовые модели (деревья) менее скоррелированными между собой).
      Поэтому случайный лес и лучше отдельного дерева - позволяет уменьшить обе компоненты ошибки в bias-variance decomposition.

    • @han-stroy
      @han-stroy 2 ปีที่แล้ว

      @@Extremesarova Все правильно. Суть леса - сократить дисперсию за счет использования независимых деревьев (конечно грубоких/переобученных) Чем больше независимых деревьев будет, тем больше будет сокращена дисперсия. Не помню сейчас, дисперсия сокращается либо на корень из N независимых деревьев, либо на N деревьев.

    • @1233-f7h
      @1233-f7h หลายเดือนก่อน

      @@han-stroy сокращается на N (где N - кол-во базовых алгоритмов), это можно вывести посчитав дисперсию для ансамбля. Но тут важный момент - уменьшение дисперсии в N раз справедливо только в случае если базовые алгоритмы слабо коррелируют (ну, если строго говорить, то вообще не коррелируют, тогда действительно ровно в N раз) друг с другом, для этого в рандом форесте при построении деревьев в каждом листе используют только часть признаков. Поэтому несмотря на кажущуюся простоту и силу, тот же рандом форест на практике уступает бустингу.

  • @zokirzokir3201
    @zokirzokir3201 2 ปีที่แล้ว +29

    Отличный формат. Пора мне уже написать нормальное резюме, чтобы меня пригласили на собес, потому что в этом интервью для меня всё очень просто 😅

    • @ЖенькаЛопотин
      @ЖенькаЛопотин ปีที่แล้ว +4

      Ну и как успехи? Нашёл работу? Или хотя бы резюме то написал?)

    • @zokirzokir3201
      @zokirzokir3201 ปีที่แล้ว

      @@ЖенькаЛопотин не, трусы шью)

  • @sergeybobkov9354
    @sergeybobkov9354 2 ปีที่แล้ว +7

    Супер полезный ролик, дает очень четкие представления о том, как выстраивать план обучения

  • @НикитаИванов-д6с
    @НикитаИванов-д6с 2 ปีที่แล้ว +18

    Благодарю за это видео! Помогло определить собственные слабые стороны...Надеюсь будут еще в ближайшем будущем!😁

  • @Extremesarova
    @Extremesarova 2 ปีที่แล้ว +77

    Было бы идеально, если бы была разметка по темам и вопросам с таймкодами :)

    • @karpovcourses
      @karpovcourses  2 ปีที่แล้ว +30

      Уже работаем над тем, чтобы это было в каждом видео :) Сейчас хотели быстрее выложить.

  • @nuri3029
    @nuri3029 ปีที่แล้ว +1

    Подушню: set изменяемый тип. Послышалось на 6 минуте, что его отнесли к неизменяемым. Спасибо! Очень полезно!

  • @alexandreabramtsev9160
    @alexandreabramtsev9160 2 ปีที่แล้ว +5

    15:45 есть еще 1 споcоб. Пропустить через конструктор - те написать b = dict(a)

  • @ДарьяМозгова-у2ш
    @ДарьяМозгова-у2ш 2 ปีที่แล้ว +8

    Спасибо за видео и примерное понимание вопросов! Поняла, что с блоком питона у меня полный замес. Интересно, что АБ руками не трогала, но знания с курса маркетинга вспыли внезапным образом и оказывается все не так плохо )
    Подход Станислава - лучшее, что может случиться на первом собеседовании. Скорее всего в реальности все будет не столь бережно и дружелюбно, но жить стало лучше, жить стало веселее :)

  • @savelygornov1060
    @savelygornov1060 2 ปีที่แล้ว +21

    Круто, но хотелось бы увидеть полноценную часть по питону

  • @dmitriy7474
    @dmitriy7474 2 ปีที่แล้ว +48

    Я из всех слов только стринги знаю

  • @ivanshelonik3979
    @ivanshelonik3979 2 ปีที่แล้ว +5

    Cross Validation is usually a very good way to measure an accurate performance. While it does not prevent your model to overfit, it still measures a true performance estimate.

  • @artyomstepanov7484
    @artyomstepanov7484 2 ปีที่แล้ว +26

    Если исходить из предположения, что среднестатистический джун- это студент/свежий выпускник вуза, то спрашивать джунов про A/B-тесты- это жёстко. Кажется, что в A/B-тестах много тонких моментов, которые объективно приходят только с практикой + A/B-тесты в вузах не преподают. Если бы вместо A/B-теста в собесе была просто статистика, было бы ок

    • @liveworkdie
      @liveworkdie 2 ปีที่แล้ว +2

      A/B тест входит в любой платный курс по DS, поэтому абсолютно не лишним спросить про A/B

    • @artyomstepanov7484
      @artyomstepanov7484 2 ปีที่แล้ว +32

      @@liveworkdie А когда платные курсы успели стать необходимым условием для того, чтобы попасть на первую работу? Если человек меняет профессию, то аргумент с платными курсами роляет, но на профильных специальностях в вузах, как это ни забавно, A/B-тестам не учат

    • @liveworkdie
      @liveworkdie 2 ปีที่แล้ว +21

      @@artyomstepanov7484 собственно встречный вопрос - а когда успешное прохождение программы ВУЗа стало критрием успеха для того, чтобы занять позицию джуна DA/DS? Если неизвестно, что такое A/B и неизвестно как применять/дизайнить исследование, то это не позиция джуна, а позиция интерна/стажёра. На работу ищут людей с навыком, не с дипломом. Диплом может стать бенефитом и только.

    • @artyomstepanov7484
      @artyomstepanov7484 2 ปีที่แล้ว +6

      @@liveworkdie А я и не говорил, что профильный вузовский диплом является необходимым и/или достаточным условием для получения работы. Мое фи преимущественно связано с тем, что большинство людей в ds- это выпускники профильных направлений, которые не проходили в вузах A/B-тесты, но при этом устроились на джуновскую должность без этих знаний и прекрасно себя сейчас чувствуют. Поэтому и считаю, что с джунов можно и не требовать A/B-тесты

    • @liveworkdie
      @liveworkdie 2 ปีที่แล้ว +5

      @@artyomstepanov7484 в индустрии не определились, что такое специалист в области DS. Что касается требований к позиции джун DS - тем более. Мы не видели сферических требований в вакууме к этому джуну. Может там уже подразумевалось A/B? Повторюсь. Не вижу проблемы в том, чтобы спросить про А/B, потому что это стартерпак любого платного курса и это камень в сторону вузовского образования.

  • @ilyachepelov1744
    @ilyachepelov1744 2 ปีที่แล้ว +18

    За видео Спасибо! Полезное для себя нашёл.
    Так проводит собеседование на позицию Junior DS лично Станислав, или так проходит среднее собеседование в большинстве компаний?
    Неужели алгоритмическая история яндекса про "напиши с 0 существующую функцию" (groupby) важнее, чем проверка умения пользоваться тем же "groupby", "pivot_table", "merge"?
    Год работаю 90% времени с SQL - оконные функции понадобились 1 раз.
    Вопросы по ML хорошие.

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +3

      Скорее стоит воспринимать как провожу собеседования я. Честно говоря из опыта оконными функциями я пользуюсь очень часто особенно когда создаем train датасет с данными по сигналу за какой-то временной период

    • @bogdanns2
      @bogdanns2 2 ปีที่แล้ว +1

      @@stasgafarov а я привык по максимуму все делать в пандасе)
      Да, это не очень оптимально с точки зрения ресурсов при обработке данных, особенно если обработка идёт в пандасе на локальной машине (в отличие от сервера БД), но лично мне проще, поэтому и sql меня храмает)
      Занимался прогнозами продаж, огромное количество признаков делал в пандасе, недоумеваю, как их в скуле можно делать. Ну а тоже скользящее среднее или лаги реализованы в готовые функции.
      А так спасибо за интервью, почерпнул немало ньюансов

  • @ПавелИванов-э6ы
    @ПавелИванов-э6ы 2 ปีที่แล้ว +5

    Спасибо большое за интервью. Имею сопоставимый уровень с собеседкемым и просмотр был очень полезен. Не совсем понятно, что значит "data scientist". Будет очень приятно видеть аналогичные интервью , но для junior/intern ml engineer.

  • @QScientist
    @QScientist ปีที่แล้ว

    в начале на 16й минуте можно было еще сделать передачу в функцию двух словарей, и в функции написать b['z']=99 и например генератором или map ом копирнуть до вызова самой функции

  • @teamsonbut5632
    @teamsonbut5632 ปีที่แล้ว +1

    Машинное обучение с большими данными это всего лишь одно из направлений науки о данных. На самом деле в этой области кит утонет)). А человек и подавно. Просто кто-то хорошо разбирается в алгоритмах, кто-то в данных и их конфигурациях, кто-то умеет быстро печатать текст, а кто-то знает кучу формул и умеет их применять. Почему открылось такое направление в науке? Да потому что каждый способный человек в вычислительном деле может предложить что-то уникальное, но вот это уникальное не каждая машина способна обработать и вот для этого была основана такая наука - чтобы идеи переводить в реализацию. К сожалению в этом направлении произошли все прорывы, которые возможны на нашем уровне конфигураций самого "железа". Так что будем ждать чего-то прорывного, которое сможет дать пищу для мозгов одарённых людей!)

  • @artemqqq7153
    @artemqqq7153 2 ปีที่แล้ว +1

    В первый раз услышал про A/B тесты)

  • @xandrviking1113
    @xandrviking1113 3 หลายเดือนก่อน

    Оконные функции на джуна ? Мир реально сошёл с ума !

  • @guru_Fuff
    @guru_Fuff 2 ปีที่แล้ว +4

    Дмитрий молодец

  • @petyap7600
    @petyap7600 2 ปีที่แล้ว +3

    На последний вопрос ответы не осознал. Нужна помощь.
    "В каких случаях логрег лучше случайного леса?" - когда есть несколько хороших признаков и много шумных?
    "Почему" - берутся подвыборки признаков, тем самым размывается влияние сильных признаков и в среднем каждое дерево предсказывает значение хуже случайности?
    Честно говоря, всегда думал, что в лесах минус только в скорости.

    • @ВалентинПрокопец-з9ю
      @ВалентинПрокопец-з9ю 2 ปีที่แล้ว

      Насколько я понял, если у тебя очень много шума в твоих данных, то какое-то дерево из твоего случайного леса может взять себе в качестве подмножества ТОЛЬКО шум. Как следствие результат его обучения будет даже хуже 0.5, то есть хуже подбрасывания монетки. Если шума действительно много, то несколько деревьев могут так обучиться и давать очень плохие результаты. А случайный лес эффективен только тогда, когда большая часть деревьев даёт результат больше 0.5. Регрессивный метод просто отсекает лишний шум и работает с настоящими данными, поэтому в таком случае он куда эффективнее.

  • @nuri3029
    @nuri3029 ปีที่แล้ว

    Было очень круто!! Спасибо

  • @alevadnaya
    @alevadnaya 2 ปีที่แล้ว +2

    Спасибо, очень интересно

  • @stalkermustang
    @stalkermustang 2 ปีที่แล้ว +8

    Видел, в комментах спрашивали про видео "Игоря Котенкова про бустинг и деревья". Вот это видео, th-cam.com/video/wnTlsXaVj-s/w-d-xo.html . Правда я не согласен со Стасом, что там говорится про подбор гиперпараметров - так, очень верхнеуровнево, потому что это не было целью лекции.

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว

      Ой ладно тебе, ты отлично про гиперпараметры рассказал, остальное можно спокойно нагуглить, руководств чуть больше чем дофига.

  • @ОлегПетров-ю4п
    @ОлегПетров-ю4п 2 ปีที่แล้ว

    Спасибо за видео, очень полезно.

  • @ИринаГришакова-р2щ
    @ИринаГришакова-р2щ 2 ปีที่แล้ว +1

    Спасибо. Было реально полезно

  • @alexeykazakov3694
    @alexeykazakov3694 2 ปีที่แล้ว

    Супер! Хочу еще видосов типа такого)

  • @ivanshvedov1823
    @ivanshvedov1823 2 ปีที่แล้ว +1

    Во второй задаче можно было пересоздать словарь b = dict(a) без for key value

  • @elenagavrilova3109
    @elenagavrilova3109 7 หลายเดือนก่อน

    Сорри как можно в DS не пользоваться set? Интервью классное, полезное! Спасибо!

  • @Ybuotue
    @Ybuotue 2 ปีที่แล้ว

    Очень круто, спасибо за Джуна.

  • @МаксимСверидов-п8н
    @МаксимСверидов-п8н 2 ปีที่แล้ว +2

    Крутое видео! Можно ли ссылку на хвалёное выступление про решающие деревья?

  • @traveler-i1z
    @traveler-i1z 7 หลายเดือนก่อน

    1:02:41 насчет неинициализированной переменной
    Ну такие ошибки уж джун должен сам исправлять

  • @BetForBeer
    @BetForBeer 2 ปีที่แล้ว +7

    Сеты изменяемый тип данных.

  • @lfc9671
    @lfc9671 2 ปีที่แล้ว

    Здравствуйте. Спасибо! В принципе, я понял как демонтировать подлокотник с Мазды 6 GH

  • @old_bedouin
    @old_bedouin 2 ปีที่แล้ว +6

    Камон, мы не можем использовать t test на бутсрапированных данных из за нарушения правила независимости

  • @ТамілаНикитишин
    @ТамілаНикитишин 2 ปีที่แล้ว +1

    6:01 set - mutable, frozen set immutable

  • @romanbush5164
    @romanbush5164 ปีที่แล้ว +2

    Похоже мужик больше математик - профессор чем програмист 👍, 2 часть обсолютно не понял, где это изучить. Даже я такие тонкости питона не знал).

    • @sjdjjsjsjs3991
      @sjdjjsjsjs3991 3 หลายเดือนก่อน

      Так в программирование из математики приходят

  • @СергейЮров-б6е
    @СергейЮров-б6е 2 ปีที่แล้ว +1

    Крутой контент. Даже не в плане вопросов, а просто атмосферы. А что, можно говорить про ML без линейной алгебры? Я не докапываюсь, просто недопонял.

  • @danilmrt2633
    @danilmrt2633 2 ปีที่แล้ว +1

    Большое спасибо за видео! Про какую лекцию Игоря о Random Forest в конце идет речь?

    • @maximstuff4417
      @maximstuff4417 2 ปีที่แล้ว

      Добрый день, не нашли?

  • @1233-f7h
    @1233-f7h หลายเดือนก่อน

    6:00 сеты это mutable тип данных.

  • @vinylrave2185
    @vinylrave2185 2 ปีที่แล้ว +3

    у меня как-то на собесе на джуна нужно было ml в прод запустить

  • @blackbigdeath
    @blackbigdeath ปีที่แล้ว

    Хороший собес, только длинный, мне кажется нормального джуна можно задетектить за полчаса. Соискатель имеет знания в области матана, но они резко прореживаются в области понятий машинного обучения. Да и питона можно было накануне подтянуть. В некоторых вопросах сдавался на второй попытке, хотя мог продолжать отвечать. Надо учитывать что со сторны пришедший человек - ему не так легко подхватить контекст, в котором вы варитесь. Джуном он смог бы работать.

  • @ShouseD
    @ShouseD 2 ปีที่แล้ว

    48:37 "нет это сложно, давай еще раз!"
    Я б на его месте начал мычать че-нить нечленораздельное)

  • @usachevplayer
    @usachevplayer 2 ปีที่แล้ว +2

    Мне показалось решение с груп бай сложнее чем должно быть, почему нельзя так сделать просто, с учётом, что размерности одинаковые?
    C = {}
    for i in range (0,len(A)):
    if B[i] in C:
    C[B[i]] += A[i]
    else:
    C[B[i]] = A[i]

    • @cv462-l4x
      @cv462-l4x 2 ปีที่แล้ว +1

      потому что zip сам сделает связку, это наглядно говорит, что элементов в A и B одинаковое количество. И зачем вы делаете условия, когда в ролике показали, что есть просто метод get, позволяющий сделать то же самое более компактно?

  • @МихаилЕрмолаев-ч3н
    @МихаилЕрмолаев-ч3н 2 ปีที่แล้ว

    Станиславу бы еще филмьыозвучивать, тембр голоса киношный.

  • @amirnurken5747
    @amirnurken5747 ปีที่แล้ว

    Подскажите пожалуйста, полноценная ли оценка возможностей в таком формате, если к примеру претендующий на должность - не обладает теоретическими знаниями, но на практике, способен справиться с любой задачей уровня junior? Заранее спасибо!

  • @alex.wizard
    @alex.wizard ปีที่แล้ว

    Ребят. Просьба перед выкладыванием видео - усиливать звук.

  • @JohnSmith-fi7ir
    @JohnSmith-fi7ir ปีที่แล้ว

    А как там что побутстрэпить что бы сгенерировать там отклонения или что-то?)) Бутстрэпинг это легально?

  • @spyphyfarnsworth6050
    @spyphyfarnsworth6050 หลายเดือนก่อน

    это уровень mini-junior

  • @gbrs72
    @gbrs72 ปีที่แล้ว

    44:25 смотря что значит пересечение, разве в иннерджойне не может быть до 625 элементов?

  • @ntiltt
    @ntiltt 2 ปีที่แล้ว +5

    А можно пожалуйста ссылку на видео про мл, про которую говориться в обратной связи?

    • @cv462-l4x
      @cv462-l4x 2 ปีที่แล้ว

      th-cam.com/video/wnTlsXaVj-s/w-d-xo.html

  • @Stk770
    @Stk770 2 ปีที่แล้ว +4

    Всем привет! Кто-нибудь, поделитесь, пожалуйста, записью выступления Котенкова, про которое рассказывает Стас

    • @falsenegative
      @falsenegative 2 ปีที่แล้ว

      тоже не нашел

    • @cv462-l4x
      @cv462-l4x 2 ปีที่แล้ว +3

      th-cam.com/video/wnTlsXaVj-s/w-d-xo.html не благодарите )

  • @dimapugach5586
    @dimapugach5586 2 ปีที่แล้ว +1

    Добрый день, спасибо за интересное собеседование. После просмотра остался вопрос о приоритетах разных этапов собеседования. Можно ли за счет хорошо отвеченного например python чуть хуже ответить на работу с данными и получить место?

    • @cv462-l4x
      @cv462-l4x 2 ปีที่แล้ว

      нет нельзя ) очевидно, что тогда бы остальное не спрашивали. Если вы знаете питон и не знаете ML, то ищите работу программиста на питоне, а не аналитика в ML

  • @ГлуховскийСергей
    @ГлуховскийСергей 2 ปีที่แล้ว +1

    А что за статьи от exbf, про ненормальность

  • @partykiev8894
    @partykiev8894 2 ปีที่แล้ว

    честный рандом нельзя предположить

  • @antonkurtis7698
    @antonkurtis7698 2 ปีที่แล้ว +2

    Почему не во всех компаниях такой тех собес? Ответил на 90% вопросов\заданий из видео, но в реальной жизни на работу так и не устроился.
    Вопрос еще Интервьюеру : смотрят ли на возраст потенциальных работников? Поздно ли джуном идти в 37 лет?

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +1

      Готов ли ты попробовать на камеру ответить на вопросы, при условии что они могут быть другими, но тоже уровня Junior?
      Отвечая на вопрос, да говорят порой смотрят, но я честно говоря ниразу не сталкивался с этим в живую. Как мне кажется, нет не поздно, но лучше всего попробовать получить какой-то реаьлный опыт и иметь портволию за счет pet-проектов. В ODS есть отдельно чатик pet-projects в котором можно найти либо команду либо проект в портфолио.

  • @kimfilbi8522
    @kimfilbi8522 8 หลายเดือนก่อน

    Подскажите, о каком именно выступлении Игоря Котенкова шла речь?

    • @karpovcourses
      @karpovcourses  8 หลายเดือนก่อน

      В комментариях подсказывают, что об этом: th-cam.com/video/wnTlsXaVj-s/w-d-xo.htmlfeature=shared

    • @kimfilbi8522
      @kimfilbi8522 8 หลายเดือนก่อน

      @@karpovcourses спасибо большое

  • @Антон-ы5р4ф
    @Антон-ы5р4ф 2 ปีที่แล้ว +1

    Видео крутое, спасибо, но вопрос: заплатить достаточно денег за курс и не знать, что такое валидация - это нормально?)

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +4

      Вообще вопрос с валидацией и построением грамотной валидации для проверки вашей модели чуть больше чем сложный. Думаю если вы учавствовали хоть раз в соревнованиях по маш обучению на кегле или хоть раз делали хорошую модель обладающую высокой обобщающей способностью вы были бы чуть более сдержанным. Чтобы не быть голословным и привести пример, лучше всего посмотреть Mercedes-Benz Greener Manufacturing Kaggle Competition и конкретно разбор Даниила Савенкова

  • @Анастасия-с9с3л
    @Анастасия-с9с3л 2 ปีที่แล้ว +1

    Очень хочется узнать, всегда нужно вот именно так, в диалоге с интервьюером, писать код или можно сказать: "дайте несколько минут подумать и помолчите пожалуйста"? ))

    • @karpovcourses
      @karpovcourses  2 ปีที่แล้ว +1

      Будет абсолютно нормально, если вы попросите пару минут в тишине!

  • @nataliamarkova4506
    @nataliamarkova4506 2 ปีที่แล้ว +1

    Мне как-то один лид сказал, что написать градиентный спуск - это прям базовый уровень. Станислав, что думаете об этом? Тут человека не стали спрашивать, получается, это уже на джун +?

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +2

      Честно говоря мой ответ будет следующим: В случае когда человек не может ответить какие-то простые вещи например линейную регрессию, и как именно линейная регрессия с помощью градиентного спуска обновляет коэфициенты при признаках, могут попросить написать градиентный спуск, чтобы удостовериться что человек действительно понимает что происходит.

  • @Серьезныйчеловек-о5й
    @Серьезныйчеловек-о5й ปีที่แล้ว +1

    когда set стал неизменяемым? элементы множества неизменяемы, а вот сам set изменяем

  • @SmadyarovBerik
    @SmadyarovBerik 3 หลายเดือนก่อน +1

    Кто знает ответ на вопрос со звездочкой ? 1:28:20

  • @tapah36
    @tapah36 2 ปีที่แล้ว +6

    Выключил на моменте, что tuple и namedtuple неизменяемые, остальные меняемые.
    К вашему сведению, числа, строки и булевы значения так же являются неизменяемыми типами данных.

  • @vilgubaydullin1195
    @vilgubaydullin1195 2 ปีที่แล้ว

    Не понимаю смысл задачи со звездочкой. Получается так, что одного дерева будет достаточно для разбиения. Или вопрос в том, что лес может быть хуже? То есть эксперта в кричащей толпе никто не услышит.
    нельзя ли при переборе параметров для леса поставить n_estimators начиная с 1? Я только учусь, не ругайтесь

  • @sergeyvladimirovich4560
    @sergeyvladimirovich4560 2 ปีที่แล้ว

    В конце упоминаете выступления по деревьям, кажется Игоря Котякова???), скиньте, пожалуйста, ссылку на это видео

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว

      в комментариях выше кинули ссылку

  • @herenickname
    @herenickname 2 ปีที่แล้ว

    Больше авторов пытался вктатиться в вопрос с group by)

  • @ioksi4371
    @ioksi4371 2 ปีที่แล้ว +1

    Я конечно не в этой сфере, но вопрос…
    Разве глубокие знания питона в этой сфере вообще нужны ?
    Я чёт думаю, что там онли готовые абстракции используют и никто не пишет свои костыли бесполезные
    Просто надо знать где что применять

    • @traveler-i1z
      @traveler-i1z 7 หลายเดือนก่อน

      Вопрос звучит примерно как «а зачем учить программирование если chatgpt скоро сам код будет писать и программисты не нужны»😁
      Ну да, эта область(data science) в целом та же разработка, просто с уклоном в математику.
      Где то разработка с уклоном в сети, где то в бд и прочее
      А тут уклон в математику, но оно не перестает быть разработкой

    • @voisan1904
      @voisan1904 2 วันที่ผ่านมา

      работа с бд,работа с оптимизацией моделей,а иногда и самому реализовать что нибудь.Никто не просит шарить на уровне многопоточки ,хватит базового понимания ооп,как устроена память и т.п.

  • @СвятославВерцанов
    @СвятославВерцанов 2 ปีที่แล้ว

    Странно немного что небыло вопросов про препроцессинг. А так в целом оч даже.

  • @РусланЮсупов-у2ж
    @РусланЮсупов-у2ж 2 ปีที่แล้ว

    Спасибо .

  • @kislovdmitry4981
    @kislovdmitry4981 2 ปีที่แล้ว

    При рассказе интервьювером о gc есть ощущение смешения rcgc (ref counting gc) и ggc (generational gc); gc.collect это про ggc...

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว

      да, я несколько упростил, и не расскаазывал про особенности работ rcgc и ggc, в целом эти частности хорошо знать на уровне Middle+/Senior DS (но для разраба это точно стоит знать), и оч хорошо когда человек сталкивался с проблемами в живую

  • @maggie_mermaid3678
    @maggie_mermaid3678 2 ปีที่แล้ว +3

    А декораторы прям использует кто-то? Я никогда нигде не видела их, в университете только препод один любил по ним вопросы на экзамене задавать.
    Дмитрию спасибо, что не побоялся поучаствовать!)

    • @taygind
      @taygind 2 ปีที่แล้ว +2

      Например, при создании dag в airflow

    • @maggie_mermaid3678
      @maggie_mermaid3678 2 ปีที่แล้ว

      @@taygind пошла гуглить) Спасибо)

    • @nicejke9630
      @nicejke9630 2 ปีที่แล้ว +1

      Декораторы в целом гига полезная и удобная штука, поскольку позволяют с легкостью менять поведение уже написанных функций. А используют их мало потому что многим просто лень разбираться что это за зверь и как работает)

    • @maggie_mermaid3678
      @maggie_mermaid3678 2 ปีที่แล้ว

      @@nicejke9630 придется тоже тогда понять) Действительно, нигде не видела их кроме, как на лекциях в университете. Теперь благодаря TaygindK нашла примеры.

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว +2

      наверное самое интересное, что большинство вызовов библиотек которые вы используете были написаны с помощью декораторов. Например функция pandas.read_csv() если провалиться в код и посмотреть реализацию можно увидеть декораторы Appender(что на самом деле callable класс) и deprecate_nonkeyword_arguments.

  • @Igor-sp7tw
    @Igor-sp7tw 2 ปีที่แล้ว

    Стас ты говорил про выступление Игоря Котенкова 1:38:12 а можешь ссылку дать

    • @RNG_name_generator
      @RNG_name_generator หลายเดือนก่อน

      th-cam.com/video/wnTlsXaVj-s/w-d-xo.html

  • @ifrenzyk
    @ifrenzyk 2 ปีที่แล้ว

    Дайте пожалуйста ссылку на видео Игоря о котором говорилось в конце

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว

      если про бустинги то в комментариях выше ответил. Если про не градиентные методы оптимизации то можно попробовать найти на канале в видео

  • @maximstuff4417
    @maximstuff4417 2 ปีที่แล้ว

    О какой лекции Игоря Котикова идет речь?

  • @cold_heart_i
    @cold_heart_i 2 ปีที่แล้ว

    Насколько я помню в деревьях решений фичи без возврата берутся

  • @НикитаРоманов-е3п
    @НикитаРоманов-е3п 2 ปีที่แล้ว

    Многие вопросы отвечал за Дмитрия, это не очень круто. В остальном познавательно👍

  • @nonameanonimous1012
    @nonameanonimous1012 2 ปีที่แล้ว

    Не корректные вопросы в начале. По поводу изменяемых и не изменяемых данных. Видно же, что интервьер не понял их смысла. Он отвечал (на мой взгляд от части правильно), что сами данные изменяемые. Имея ввиду их значения. А не само положение в адресном пространстве памяти.

  • @erlanabdraimov3088
    @erlanabdraimov3088 2 ปีที่แล้ว

    def checking(a: list, b: list) -> dict:
    result = {}
    pointer = 0
    for item in range(len(B)):
    if b[item] not in result:
    result[b[item]] = a[pointer]
    pointer += 1
    else:
    if b[item] in result:
    result[b[item]] += a[pointer]
    pointer += 1
    # for item in range(len(A)):
    # if b[item] in result:
    # result[b[item]] += a[item]
    return result
    result {'c': 21, 'a': 15, 'b': 18}

    • @vlad_covers
      @vlad_covers 2 ปีที่แล้ว

      def groupbysum(a, b):
      dt = defaultdict(int)
      for val, i in zip(a, b):
      dt[i] += val
      return dt

  • @luckytima2315
    @luckytima2315 2 ปีที่แล้ว +1

    Сразу видно что у человека первый яп это пайтон ))

  • @mlpython1089
    @mlpython1089 2 ปีที่แล้ว +1

    Спасибо за материал.
    Скажите, пожалуста, как сечас обстоят дела с ML. Последние события ведь должны были обнулить релевантную историю данных.

    • @gorodiskykirill4193
      @gorodiskykirill4193 2 ปีที่แล้ว +1

      Можете немного подробнее описать, что за события такие? Data Science ведь сейчас довольно популярное и перспективное направление.
      Спасибо.

    • @liveworkdie
      @liveworkdie 2 ปีที่แล้ว +2

      >обнулить релевантную историю данных.
      what does it mean?

    • @liveworkdie
      @liveworkdie 2 ปีที่แล้ว +8

      Github работает, доки по либам работают, материалы доступны, технологии в основном опенсорс. Про какие события идёт речь понятно, как это должно было повлиять на ML непонятно. Тем более если у нас есть православный catboost.

    • @aleksandrsvetlichnyy1576
      @aleksandrsvetlichnyy1576 2 ปีที่แล้ว +2

      @@liveworkdie и lgbt classifier 😄

    • @gorodiskykirill4193
      @gorodiskykirill4193 2 ปีที่แล้ว +4

      @Максим В курсе, сам с Украины и видел кадры Мариуполя от друзей, которым посчастливилось выехать.
      Думал, может человек имеет ввиду что-то другое, например какой-то технический прорыв в технологиях, что изменяет положение дел в ML. Просто автор не совсем понятно выразился по поводу "релевантной истории данных"
      Слава Украине и нашим воинам!🇺🇦

  • @HOOKAH10
    @HOOKAH10 2 ปีที่แล้ว

    Того кого собеседовали окончил Каарпов курс ?

  • @СергейПанин-л6к
    @СергейПанин-л6к 2 ปีที่แล้ว +1

    Я конечно понимаю мотивацию интервьюера довести интервьюируеомого до нужного ответа, но если человек не знает что такое указатели и как они работают, он никогда до этого не дойдет. И выглядит это как мучение.

  • @VitalyKoryakin
    @VitalyKoryakin 2 ปีที่แล้ว +1

    Хм, буду знать, что мок интервью - это бесплатная лекция по азам программирования 🙄

  • @eduardganzha1385
    @eduardganzha1385 2 ปีที่แล้ว

    Воу, я представлял, что собеседование будет на много сложнее. Но на процентов 80 вопрос я бы ответил точно)

  • @shamanart456
    @shamanart456 ปีที่แล้ว

    Зачем я это смотрю, не знаю)

  • @egor3974
    @egor3974 2 ปีที่แล้ว

    А может кто-то помочь с линкой, которую предлагали в конце видео про деревья? А то чего-то повылазило(

    • @stasgafarov
      @stasgafarov 2 ปีที่แล้ว

      ответил в комментариях выше

  • @b_o_r-d5d
    @b_o_r-d5d ปีที่แล้ว

    отучился в яндекс практикуме 6 месяцев на аналитика данных, и в целом процентов 10-20 смог бы ответить. ещё учится и учится...

    • @surfcoffe
      @surfcoffe ปีที่แล้ว

      🤒

    • @eu_dz8684
      @eu_dz8684 2 หลายเดือนก่อน

      cейчас работаете?

  • @russvetden9342
    @russvetden9342 ปีที่แล้ว +3

    2 минуты посмотрел испугался и выключил. И это джуниор. На Сеньёра наверное как на космонавта собеседуют

    • @TeppopucT
      @TeppopucT ปีที่แล้ว +6

      Не... На синьора как в боевых искусствах на высоких рангах...
      Просто смотрят друг на друга секунд 20 и после этого уже всё всё понимают.

    • @ЕгорБеззубенко-в1п
      @ЕгорБеззубенко-в1п ปีที่แล้ว +1

      В реале на такой собес даже попасть сложно, а спрашивают шире и глубже, так как конкурсы большие на место, и даже ответив всё отлично, запросто пролетаешь. И так раз 50

  • @Alex_the_Great_86
    @Alex_the_Great_86 4 หลายเดือนก่อน

    append - это метод, а не функция

  • @darkelectro7044
    @darkelectro7044 2 ปีที่แล้ว

    первый же вопрос меня опрокинул😅

  • @АртемТит-в5ь
    @АртемТит-в5ь 2 ปีที่แล้ว +1

    не думаю что с такими знаниями нужно вообще работу искать

    • @АртемТит-в5ь
      @АртемТит-в5ь 2 ปีที่แล้ว

      хоть бы у всех такое интервью было)

  • @wimp825
    @wimp825 2 ปีที่แล้ว +1

    Эх, если бы чел получше отвечал, было бы поинтереснее. Но все равно спасибо

  • @СарматПересветов
    @СарматПересветов หลายเดือนก่อน

    Знания собеседуемого ниже плинтуса

  • @aleksandrfrolov7071
    @aleksandrfrolov7071 2 ปีที่แล้ว

    Очень интересно, но ничего не понятно =)))

  • @evolution_31
    @evolution_31 2 ปีที่แล้ว +2

    Вы прикалываетесь??? что это за собеседование.... позорище, поразвелось датасайнтистов....