[ТАЙМ-ТЕГИ] 00:01:41 Вопросы про опыт работы 00:13:08 Вопросы по теории вероятностей 00:20:43 Вопросы по SQL 00:26:15 Вопросы по линейным моделям в data science 00:40:12 Вопросы по валидации моделей 00:44:18 Бизнес-задачи 01:04:45 Feedback
Я может чего-то не понимаю, но первая задача на тервер, что значит точно также будет? Если доставать и обратно класть шары, то это даже не условная вероятность, как она сказала, а классическая вероятность, а если всё же брать условную вероятность, то надо принимать в расчет, какой шар вам попадется в k-1 случаях до этого и уже от этого отталкиваться
Насколько я понимаю, вообще первый вопрос, к-ый нужно было задать интервьюеру после поставновки этой задачи, раз он сам это не сообщил, это будут ли шары доставаться и затем класться обратно или нет, т.к. да, во втором случае вероятность будет неизменной что для 1-го шара, что для к-го, но не будет в первом случае, что заметно усложняет задачу.
Анастасия молодец, не успугалась прийти. Те кто говорят что слабо, то хотелось бы посмотреть как бы они чувствовали себя перед камерой. Да тематика вопросов очень разнообразная. Для меня было очень полезно и придало мне уверенности в своих силах. Хочу продолжение
Пройдя более, чем с десяток собесов на миддла в сбер, ВТБ, Мегафон, альфу, озон, райф за прошедший месяц, хочется сказать, что эти вопросы даже не для джуна, не говоря про миддла) Очень хотелось бы на таких интервьюеров попадать, конечно. В общем совет миддлам - копать в линейные/нелинейные алгоритмы поглубже раз в 5. Как и в валидацию/бизнес задачи. Про тервер, к слову, не спрашивали от слова совсем. Из 12 собесов про скиллы в sql спросили всего на двух. Но интересно не увидеть ни вопроса про матстат, про ансамбли, не говоря про устройство функций потерь и оптимизационных операций в алгоритмах.
А можете, пожалуйста, подробнее рассказать про характерные, частые вопросы или несколько примеров привести, чтобы лучше понимать, к чему готовиться? Какое внимание уделяется вопросам программирования: алгоритмам и структурам, O-нотации, задачкам, паттернам ООП, git? про loss и оптимизацию достаточно знать общие принципы и как примерно считаются или необходимо суметь несколько итераций sgd на листочке прогнать? Насколько высок шанс завалить sql, если до этого не имел дело с ним на реальных задачах?
@@АнтонСеливанов-ь2о все что ниже написано - исключительно мой опыт (во что-то глубоко не копали, так как я сразу говорил, что не знал; во что-то копали), Так что не экстраполируйте сильно. У меня опыта в ООП не было (как и пром разработки), но многие спрашивали про продакшн; по самому ООП лишь тестовое задание небольшое было, на интервью лишь пара вопросов. Алгоритмы, структуры, О-большое не спрашивали, но в Альфе, Мэйле, Яндексе и Озоне были достаточно непростые задачки (а ля Leetcode среднего уровня), и если что-то делаешь не так спрашивают: а как можно поменьше памяти занять? А как сделать работу за O(n) время. Так что помимо алгоритмов и структур, немного надо понимать, что к чему. Но важнее грамотно реализовывать код. По части кода пару раз про хэш-функции, декораторы и время работы словарей/массивов спрашивали. Это редко. По Гиту вопросов не было, больше про опыт продакшна в общих словах (как-на чем выкатывали и тд), но с этим у меня тоже слабо. Дальше может и копали бы в мл-опс, докер и тд. Реализовать sgd или что-то подобное на листочке из всех раз просили всего один раз. В основном спрашивают разные нюансы в общих словах, и не только про бустинг. В том числе обычные деревья, регрессии - как, почему так работают, почему функция оптимизации такая и не иная, какие ограничения это накладывает, какие требования к данным, как правильно настраивать модель и т.д. Имхо, sql в меньшем приоритете, спрашивают не особо часто. Но знать важно, ибо спрашивают! Реальный опыт незаменим, но если разобраться с джойнами, оконными функциями, агрегациями, вложенными запросами, мб конструкцией CASE и пощупать это руками (например в sql-tutorial или w3schools.com) - думаю, проблем не будет. Как мне кажется, по SQL гоняют больше мл-инженеров. Но это имхо, и я бы посоветовал немного разобраться в вышеупомянутом. Если суммировать - лично у меня про мл-алгоритмы на позицию миддл ДС спрашивали больше всего. А так же про проекты - как, каким путем реализовывал.
Очень крутой формат. 1. Зовите пожалуйста джунов, желательно тех, кто ищет работу (в слаке ОДС думаю можно найти ребят, готовых поучаствовать) 2. Слишком мало вопросов по терверу и sql, нет вопросов по статистике, алгоритмам и языку (понятно, что автор хотел сократить видео, дабы оно не длилось два часа, НО это именно тот годный контент, который должен длится по два часа, его смотришь и кайфуешь) 3. Возможно интервьюеру стоило бы озвучивать ответ, который он хотел бы услышать 4. В конце какой-то вердикт(нанято/не нанято=)) и рекомендации бы еще В любом случае очень годно, спасибо!
А мне вот был не очень очевиден ответ во 2 задаче по теорверу. Я решал так: пусть k1 - колво белых, k2 - черных в 1ой урне. Тогда можем посчитать белые и черные во 2ой. Построил функцию от k1, k2 равную вероятности. И посчитал производную от неё по k1, k2. Приравнял их к 0, как необх. усл. максимума. Решил систему.
@@mifak47 Можно решить по индукции. Допустим, что нам известно решение для заданных N и M, т.е. мы знаем, сколько n и m надо положить в условную первую урну. Тогда встает вопрос: а что делать, если нам дали ещё один дополнительный шар? Рассмотрим два случая: 1) Нам дали белый шар. Тогда его надо класть в урну, где "концентрация" белых шаров ниже, т.к. это даст больший эффект на финальную вероятность, чем если положить его в урну, где уже и так много белых шаров. Доказательство довольно простое - надо просто рассмотреть функцию, как растет вероятность белого при изменении количества белых шаров и заданом количестве черных шаров. 2) Нам дали черный шар. Тогда, его тоже надо положить в урну, где "концентрация" черных выше - чтобы вероятность белого уменьшилась меньше. Доказывается аналогично предыдущему. Теперь рассмотрим случай, когда у нас всего два шара: черный и белый. Нетрудно посчитать, что надо разложить их по разным урнам. Т.е. в первой урне лежит белый, во второй - черный. Тогда для случая произвольных N и M, можно начать с одного черного и белого, и далее итеративно применять правило. Нетрудно видеть, что при применении этого правила, каждый новый шар всегда будет попадать в урну, где изначально лежал черный шар, т.к. в урне с одним белым, концентрация белых равна свою максимуму (единице). Значит, оптимальное решение - в одной урне один белый шар, в другой урне все остальные.
@@АлександрПолевой-е2б Ну, это, к сожалению, неправда, которая кроется в первом пункте за словами "доказательство довольно простое". Приведу контр пример. Допустим нам дали белый шар и у нас есть какое-то распределение шаров в урнах. Допустим распределение следующее -- в первой урне у нас 1000 белых шаров и 9000 черных, а во второй 1 белый и 1 черный. В первой урне концентрация белых шаров ниже, чем во второй (1/10 против 1/2). Если к нам пришел белый шар, то по логике решения, его должно быть выгодно положить в левую урну. Однако это не так, если мы положим шар в левую урну, то вероятность вытащить белый шар изменится с (1000/10000+1/2)*1/2 = 0.3 до (1001/10001+1/2)*1/2 = 0.300045, а если бы мы положили в правую урну (где концентрация выше), то получим (1/10 + 2/3)*1/2 = 0.38(3), то есть вероятность вытащить белый шар вырастет значительно и выгоднее класть в правую урну с более высокой концентрацией. Можно и обратный пример -- сделай в левой урне не 1000 белых и 9000 черных, а 9000 белых и 1000 черных, класть все равно будет выгоднее в правую (хотя "концентрация" в левой будет теперь уже выше). Все это приводит нас к тому факту, что решения таким способом достичь не получится.
Не проще ли в одну урну положить один белый шар, а во вторую положить оставшиеся? Интуитивно кажется так самая высокая вероятность UPD: Прочитал коммент выше, там такая же идея
Эх, интересно как связаны вопросы с middle ролью. На все это можно ответить пройдя любой курс по ML, и прочитав 2 статьи по бизнес-метрикам. С АБ-тестом произошел некоторый провал( Upd Я отпишу свой взгляд на вопросы для middle и старше, чтобы комментарий выше не был банальной критикой с моей стороны. Такие вопросы должны быть открытыми и представлять собой некоторую реальную задачу, которую нельзя решить за один шаг. Нужно будет накидать идей, выбрать самую работоспособную, проверить ее возможные недостатки и проблемы реализации. Обязательно связывать это с реальным миром. Вопрос "объясните менеджеру, почему он не прав в оценке результатов теста" - совсем низкого уровня. Он может стать сложнее, если обсуждаются неочевидные тонкости (и тогда он станет скорее техническим), но это не тот случай. Обратная связь, что кейсы были уровня сеньор-лид выглядит очень натянутой.
@Astroprudding, вы когда в последний раз интервью на мидла проходили??? Если вы считаете, что вопросы на мидла слишком простые, то вы плохо понимаете рынок труда. Сочувствую вашим подчинённым если они есть. Ну а если вы ещё только начинаете свою карьеру как DS, то смелее в бой на собесы и хватит дрожать от мысли, что знаний все ещё недостаточно 💪💪💪
@@ВладимирШумаков-м9щ Это сообщение восхитительно, то у меня есть подчиненные, то я начинаю карьеру в DS. Сочувствую рынку труда, где на мидла собеседуют по L1, L2 регуляризации, без единого кейса для проверки способности кандидата предлагать решение реальной проблемы
7:57 - Окей, на сколько это законно? Я сразу вспомнил Ди Каприо из фильма "Волк с Уолл-стрит", где он на этот вопрос ответил - "Да не законно это нихрена"
Это первое собеседование на позицию senior middle DS из тех что я видел на TH-cam. Спасибо 👍👍👍 Уверен, что буду пересматривать его перед своими следующими собеседованиями. Насте огромное спасибо за смелость. 💪💪💪
Читаю комментарии: это просто шедевр и песня!! Такое исследование человеческой натуры )))) - Я невероятно крут, вы копошитесь где-то внизу - Пройдёшь собеседование? - Нет, обстоятельства
Кажется больше постановкой, для рекламы, чем реальным интервью: большинство вопросов не были раскрыты в достаточной степени, и в большинстве случаев ведущий сам отвечал на свои же вопросы :) (от кандидата очень много "воды")
Я недавно проходил собеседования на Мидла в разных банках. На мой взгляд, вопросы адекватные. Примерно на такую глубину и спрашивают. Спасибо за выпуск. Оооочень понравилось
Подскажите, пожалуйста, только в банках проходили или ещë где? Можете рассказать, насколько сурово с вопросами по следующим направлениям: 1) алгоритмы, структуры данных, О-нотация, задачки со всяких хакерранков? 2) ООП, паттерны, архитектура? 3) всякие SOLID, KISS, YAGNI и прочие слова, которые любят спросить у программистов? 4) контроль версий, git, mlfow, wandb? 5) распараллеливание, нити, процессы, async? 6) внутренности алгоритмов ML, алгоритм обратного распространения ошибки на бумажке? 7) основы матстатистики - вероятностные распределения, выборки, оценка выборочных параметров, построение доверительных интервалов? 8) QA и тесты? Собеседующие так же доброжелательны, как товарищ на видео или всë же более суровы и менее общительны?
Я вам отвечу, если можно, я сейчас сама прохожу собеседования и сама провожу😅 у меня сложилось такое ощущение, что в банках (наверное кроме тинькофф) довольно слабые ds, которые задают поверхностные вопросы и текущее собеседование отражает этот уровень. Если это компании типо озон или Яндекс, то уже будут и алгоритмы и более глубокие вопросы. Я сама работаю в банке, но так как я шарю чуть больше чем обычные ds в банках, то вопросы у меня тоже уже чуть посложнее. По поводу доброжелательности зависит от человека, но в целом даже если ты не знаешь, но приводишь верные рассуждения или можешь вывести на ходу, это уже большой плюс.
@@МаринаТолмашова-с8ш большое спасибо за ответ. Никогда бы не подумал, что в банках слабые ds... Но, видимо, им достаточно такого уровня. Сложно, конечно, представить, какие вопросы простые, а какие - чуть посложнее, но, с другой, стороны, описать это наверное тоже непросто :-D А вообще по ощущениям - какова сейчас ситуация - ds' ов хватает? Кандидатов много? И какая доля из них - не случайные ребята? А если область джун+ - миддл? И вопрос немного отвлечëнный - аспирантура/кандидатская степень - скорее плюс или минус?)
Простые: это как работает тот или иной алгоритм, какие метрики качества знаешь, какая нибудь простая задача с тер вера, посложнее: напиши алгоритм, задача про шары как в видео, только если ты шары не возвращаешь в урну. Кандидатов в принципе хватает, но довольно слабых, он прошли курсы и валятся буквально на первой алгоритмической задаче или чуть более глубоком копании в теорию. Я сама долго искала работу, уже планировала в аналитике оставаться 🤷🏻♀️ Степень мне кажется не важна, мне даже кажется что это чуть overqualified
Многие пишут что вопросы легкие и уровня джуна... Отличие джуна от мидла/сеньора в том, что как раз джун на эти вопросы отвечает легко, у него от зубов отскакивает, т.к. он месяц назад полугодовой мл-курс окончил. Он расскажет тебе о всех моделях и метриках, что услышал. Но он не понимает когда какую и почему нужно применять в твоем бизнесе. Мидл/синьор, в большинстве своем, фул-тайм варится в области своей задачи и поэтому забыл давно о метриках и подходах, которые не применял на работе в последние 2-3 года. Но плюс мидла-серьора в том, что он точно улавливает как мл-метрики подвязать к бизнес метрикам (мидл-меньше, сеньор-больше), как придумать и провести эксперимент, подтверждающий/опровергающий предложения и просьбы овнера. И главное, если понимает, что для задачи понадобится подход, который не использовал 2 года - он идет в гугл и за час вспоминает все, что проходил на МЛ-курсах по этой теме давным давно, и так же быстро это реализует. Цель интервью как раз понять - ты джун после курсов, легко отвечающий на стандартные вопросы, или человек, поработавший в бою несколько лет, повидавший и попробовавший разное, чем занимался и чего не боишьсь. С этим кандидат справилась.
Кандидат точно хорошего уровня мидл, с перспективой на сеньора, т.к. всё-таки отшить надоедливого продакт-менеджера не смогла сразу ;) Да и задачу с оттоком в бизнес-метрику перевела не сразу, а это очень требуется на данном уровне
@@101afg101 если это шутка, то она очень хорошая. По вашему описанию, девушка хороший джун - отвечает на технические вопросы и вообще не отвечает на продуктовые. Но в выводе она "хороший мидл" с перспективой на сеньора
@@St0pGame она мидл, т.к. несколько лет проработала в полях, отвечает на вопросы не вспоминая курс, а вспоминая реальную практику. Ей не надо разжевывать задачи как джуну, она сама выберет инструменты и способ решения. Так же у неё опыт обучения других, что говорит о желании и перспективе синьора. Но после соответствующего опыта, конечно, где она будет брать на себя больше ответственности.
Клёво, формат однозначно интересный. На уровни разбить: + Джуна ещё и мидда и тимлида + Разные форматы собес какие баще (чтоб пояснили может это народу зайдет, мне точно зайдет) + По направлениям домена: Финансы/ ритейл (его вообще мало)
Круто, но порой прыгает звук, и было бы круто, чтобы человек проходил собеседование не на листе, а на доске, чтобы зрителю было видно, что человек пишет
в процессе просмотра всего интервью не покидало ощущение нереальности. может так обычно и собеседуют симпатичных девушек, но интервьюер постоянно пытается подсказывать и меняет тему, если видит что кандидат начинает "плавать" в вопросе. а на реальных интервью наоборот пытаются наводящими вопросами прощупать твои слабые места и задать пару конкретных вопросов в углубление, чтобы убедиться, что твои знания в какой-то области поверхностны.
Я не согласен. На мой взгляд в реальной жизни стараются понять, что ты знаешь. Понять можно только помогая и задавая наводящие вопросы. Также с помощью наводящих вопросов можно понять насколько лёгко будет работать с человеком. Если понимает намеки, то и работать будет легко и не придётся по 100 раз объяснять. Что скажете?
@@ВладимирШумаков-м9щ ну в общем согласен, на интервью обычно стараются быть с собеседуемым максимально вежливыми, чтобы человек расслабился, был откровенным, не боялся ошибиться. А уже в конце скажут, что мы вам позвоним, позже, когда нибудь, может быть)
По-моему это как интервьювер видит собеседуемого. Если он видит, что она понимает, то он и сам дополняет некоторые моменты. Сл мной такое же собеседование было. Человек видел, что я понимаю и наше общение пошло довольно легко
Вьюшка, Семплинг - Файн! К сожалению это не интервью, а плохой спектакль:( 1) Теория вероятности. Первая задача: Кандидат не объясняет, почему проверка K-ого шара на белость не отличается от проверки первого. Вторая задача: Интервьюер: "довольно понятно почему оно оптимально", это должен говорить кандидат и сразу добавлять почему же оно оптимально. 2) SQL. Простенький запрос с трудом вымученный Кандидатом, максимум это вопрос для скрина - проверить, что вы хоть что-то слышали про SQL. 3) Линейные модели. Тут кандидат к сожаления не упомянул главного: что линейные модели содержат мало параметров и они почти не переобучаются. Кандидат не называется собственно линейные модели по имени - линейная регрессия и линейный SVM. Про онлайн совершенно не в тему, любая модель может обучаться в онлайне, вопрос в ресурсах, качестве обучения и способе. По поводу быстроты линейных моделей тоже неверно, все зависит от числа параметров модели - неглубокий небольшой лес вполне может работать быстрее. Про отдачу модели в центробанк: а параметры кто же будет нормализовывать сперва, как кандидат собирается сравнивать коэффициент у возраста и годовой зарплаты без нормализации? Выбор 50 лучших фичей: не упомянут, самый простой способ - выбрать случайно 50 фичей и выбрать лучший набор среди них. L1 - Кандидат не объясняет почему собственно L1 ведет к спарсити. 4) Кластеризация. Спектральная кластеризация: Кандидат не верно говорит, почему его сложно посчитать - нужно решить линейное уравнение, для этого надо найти обратную матрицу, это сложность O(N^3). “Вложенная структрура” - нет понятного объяснения от Кандидата почему K-means работать не будет. “K-means считает число точек” - не считает он точки. Интервьюер: “K-means не лучший алгоритм”. Не лучший для каких задача? В каких условиях? Если просто не лучший, почему это возможно самый популярный алгоритм кластеризации? Вывод: Кандидат не дотягивает до джуна, Интервьюер до мидла.
@@ВалерияСмирнова-ц7л именно поэтому и получилось, что формально ответ верный, но объяснение уровня "это очевидно", хотя для варианта без возвращения не очевидно
Как я понял в первой задаче вероятность не меняется в связи с тем что не известно какие шары вытаскивались до к-го шара. И этот принципиальный момент интервьювер не уточнил. Такое ощущение что он сам не понимает разницу.
Было бы очень интересно посмотреть собеседование сильного интервьюера с сильным действительно опытным мидлом! Я джун от ДС и даже у меня посложнее собесы уже были, интересно как на вопросы отвечал бы настоящий профессионал
По идее: топ, интересно было бы посмотреть больше видео такого формата в будущем. По интервью: слабый кандидат на Middle DS. Кажется, что такие вопросы стоит задавать на позицию Junior DS (кроме бизнес-задач), и он должен уверенно на них отвечать. По фидбэку в конце: фидбэк хочется видеть более критичный. Но вряд ли в таком формате интервью это возможно.
Как-то слабовато на мидла, смотрел кусочками. Включил про валидацию -- только стратификацию упомянула, причем только по таргету, насколько можно судить. Ни оценки стабильности и предсказательной силы фичей, ни исключения covariate shift, ни хотя бы выбора стратегии семплирования -- oos/oot и тд, ни проверки модели на бизнес-логику (упрощенно -- фичи работают в правильную сторону). Далее можно перейти к более общим вопросам, например стратегии семплирования самого train для задач регрессии, многоклассовой классификации -- как вообще отобрать корректный кусок данных, который отдать на разметку (если нет понятного события) -- например, как из 10 млрд транзакций десятков разных типов с разницей в частоте в тысячи раз выбрать те, которые отдать эксперту на разметку. Короче, ни методологических, ни математических приемов валидация моделей не назвала
Вообще можно много чего. О валидации, как и о линейных моделях можно разговаривать часами. Цель собеседования (особенно в рамках сжатого тайминга) понять кругозор в DS, о чем человек думает в первую очередь, когда строит валидацию, а не закопаться в глубь по каждому вопросу.
" как вообще отобрать корректный кусок данных, который отдать на разметку (если нет понятного события) -- например, как из 10 млрд транзакций десятков разных типов с разницей в частоте в тысячи раз выбрать те, которые отдать эксперту на разметку " Никита, не могли бы дать ссылку на решение этого вопроса или ключевые слова?
Крутой и насыщенный ролик. Такой рубрики давно не хватало! Мое внимание часто отвлекала светящаяся табличка «Нанято». Возможно, это такая задумка авторов 🤔 но не отвлекает ли это на самом собеседовании?
Какая разница??? Это же мелочи. Если в них зарываться, то ни одну реальную задачу не сделаешь. В целом ответила полно и правильно. Для реальной задачи она бы ещё раз перепроверила и возможность подобных ошибок была бы устранена.
Классная инфа. Не все понял. Но понял что некоторые люди могут решать нереальные задачи про вероятности и про шары в урне, и про медианы в таблицах и про нерадивых сотрудников и взаимодействия с ними и их бесполезной статистикой. Респект.! Я хз как вы это делаете.
49:00 Я не понял одного, о какой фазе идёт речь? Если мы сделали inference и получили условно нули и единицы (churn) то как мы можем определять их на TP,TN,FP,FN если у нас True лейбелов пока ещё нет??? Здесь речь идёт о том, кому мы будем делать предложение на скидки зная вероятности Churn!
Пролистал список тем и немного офигел: 1) Зачем ДСа мидла спрашивать про тер вер? Это вопрос для джунов, которых нельзя погонять по опыту и технологиям. 2) SQL не очень репрезентативный, т.к. много где nosql, но пусть будет, действительно часто спрашивают. 3) Почему только про линейные модели спросили? Уверен что с помощью них решается намного меньше задач, чем через деревья. Структура больше похоже на интервью джуна с более сложными вопросами. Обычно на мидла гоняют по опыту и от туда все вопросы вытекают. Подозреваю такой формат больше заходит под ютуб и людей разных спек и домейнов.
немного шокирован ответом на 1-й вопрос по теории вероятностей. Разве вытащив k-1 шаров мы не можем вычесть соответствующее количество уже вытащенных белых и чёрных шаров из их общего количества? И этим уточнить вычисление вероятности для k-го шара?
@@ilyakuzmin2256 согласен, но это уточнение кардинально влияет на правильный ответ. Вообще такие задачки на логику часто и задаются для того, чтобы понять как человек способен задавать уточняющие вопросы, которые повлияют на вариант решения. Или он зациклится на первоначальном, возможно неверном, понимании задачи.
@@ihorsavchenko2787 Полностью согласен. Человек, который шарит за теорвер, сразу бы спросил, нужна ли вероятность при условии вытащенных шаров, или же безусловная вероятность. Девушка, очевидно, в теорвере совсем не бум-бум, а умеет только фит-предикт гонять.
@@PaulGanarara мне кажется здесь смысл задачи в том, что для её корректного решения надо задать уточняющий вопрос, можно ли смотреть на уже вытащенные шары.
Блин зачем нужны все эти вопросы по теорверу?? Аааа.. Это же как справочные данные, когда надо это легко гуглится. Надо людей тестировать на подход к реальным задачам
урна)) справились ?? как будут мешать шары в урнах 1) урны просто переставят местами случайно ( перемешают таким образом) и дадут выбрать 2) шары в каждой из урне перемешают и перемешают урны и дадут выбрать урны.... если вариант 1 то вероятность 100% вниз укладываем черные вверх белые. вариант 2) вариант тогда да если n=m то 1 шар в другую урну соответственно вероятность белого шара из другой урны будем максимальна. ...ну еще есть 3 вариант))) если шары перемешают из одной урны в другую, потом перемешают шары в урнах и перемешают урны местами)))..
@@DataScienceGuy Видимо раз на раз не приходится потому что мои неудачные собесы на джун дса заканчивались на том что я не могу оптимально реализовать встроенный каунтер из collections или рассчитать потребление памяти бабл сорта ;(
Спасибо за видео! Очень здорово снято и материал будет очень полезен новичкам. Тем не менее, хотел бы заметить (как hiring manager и data scientist) - это вопросы уровня очень junior ds или mid-senior analyst. Middle DS должен уметь писать неплохой и чистый Python код (и я не про черновики в ноутбуках), автоматизировать ML пайплайны, деплоить модели, хорошо понимать основные метрики классических проблем (классификация, регрессии) и неплохо понимать фундаментальные плюсы/минусы юзкейсов boosted trees моделей vs базовых (логрег и дерево). (От мидла редко ожидаются знания или серьезный опыт работы с нейронками, так что это скипаю.) Я интернов куда суровее собеседую. :)
@@Fless привет, можно позвать людей с фивта мфти, у нас есть много сильных дс среди выпускников. Мб смогу помочь найти кандидатов для жёсткого собеседования, если интересно, то тг @runfme. Через месяца два, когда пройду собеседования на работу и пойму, насколько я сейчас готов, то и сам соглашусь на такое)
Добрый день. Подскажите можно ли найти что-то подобное в принципе? Как лучше поступить ? Писать игру с нуля не получится точно! Простая карточная игра (качество и сложность не важно. лучше что-то по проще..) HTML, CSS, JS, MySQL Описание: Регистрация игрока, Минимум два участника Спасибо
соглащусь ). права странно смотреть собес её на мидла, когда она (вроде) говорила, что она суперсеньёр . если на это не отвлекаться, то идея и воплощение хороши.
обожаю математику за такие условия типа: найди медиану, не используя функцию медиан. супер блть вскопай яму, не используя лопаты да? поэтому я и учусь на фронтенда
Во фронте куча задач серии «сделай X, не используя Y». Постоянно всплывает такое, когда работаешь с легаси-кодом или код будет запускать не на попсовых браузерах.
@@dmitrypetrov3052 вообще то я уже полгода этим занимаюсь и ничего такого ещё не видел, такое только происходит во время работы над не очень популярными проектами, например в верстке писем, но опять же никто не заставляет
Ну как-то очень слабо для мидла,это даже для джуна лоу-лвл. Теор/вер-вопросы ниочем. Линейный модели-ну спросить хотя бы стандарт про l-нормы,лассо и прочее. Про валидацию-ни 1 вопроса про дата лики и оценку чувствительности. Вопросов про оптимизацию, матричные операции и факторизации и хотя бы верхнеуровнево про дискретку и графы не было. В итоге это скорее история про "фит-предикт" дата саентиста(но может бизнесу такие и нужны).
Илья, кандидата. Интервьюеров уже wait-list набрался, а нужны кандидаты, способные выдержать сложное интервью на синьора или тимлида. Принимать оффер не нужно, это лишь тренировка. Готов поучаствовать?
Извините, я не хочу писать какой-то негативный комментарий ,напишу как есть. Вопросы какие-то нереально слабые для middle разработчика) Я занимаюсь ml чуть больше 5 месяцев(курсы,kaggle и тд) И ответы на эти вопросы я знал=) ОЧЕНЬ УДИВИТЕЛЬНО! и даже скажу ,что ответы от девушки были далеко не все
А вот как быть, когда сходу тупишь и не можешь такие задачки решать? Ну, например, мне тяжело думать под таким контролем. Комфортнее посидеть, подумать. По факту ведь скорость соображания менее важна качества?) И как быть, например, когда несколько лет работал в CV, и с тервером вообще не сталкивался. И на собесе ты валишься на этом вопросе? 🤣🤣
Не понял, почему в задаче о распределении белых и черных шаров сказано, что "оптимальность этого решения очевидна". Мне вот не очевидна, можно ли услышать доказательства от авторов?
P = 0,5x + 0,5y, где x и y - вероятность достать белый шар из первой или второй урны соответственно. Если у нас 1 белый и 1 чёрный шар, то Мы получим 0,5*1/2 + 0,5*0 = 0,25 или 0,5*1 + 0,5*0 = 0,5 (в первом случае оба шара в одной корзине, во втором по шару в каждой) Результат Примера с одним белым и одним чёрным шаром по одному на корзину тождественнен с любым примером, где все белые шары положили в первую корзину, и все чёрные в другую при равенстве белых и чёрных шаров и равен 0,5 Теперь попробуем оптимизировать решение для 4 шаров (2Б и 2Ч) Производную так просто не посчитаем т.к. у нас будет 2 неизвестные: (P = w/n + (2 - w)/(4-n) где w кол-во белых шаров в первой корзине, n кол-во шаров в первой корзине) Поэтому переберём все варианты (кроме 2б/2ч и 0/2б2ч т.к. их мы уже считали) 1б/1б2ч = 0,5*1 + 0,5*0,33 = 0,665 1ч/2б1ч = 0,5*0 + 0,5*0,66 = 0,33 Если мы возьмём большее кол-во шаров, то заметим, что нам выгодно минимальным количеством белых шаров получать 50% вероятность достать белый шар. При этом большее количество белых шаров при отсутствии чёрных не выгодно, т.к. уменьшает вероятность достать белый шар из второй корзины, а смешение белых и чёрных шаров будет не выгодно т.к. у нас очень "жирный" коэффицент 0,5 (выбор корзины)
@@vladimirbeliayev836 это все отлично, но это не есть строгое доказательство для любого числа шаров. Я не оспариваю верность решения -- мне тоже кажется, что решение предложенное в видео оптимально. Я лишь не согласен с тем, что "оптимальность решения очевидна" -- она не очевидна, потому что я доказательства так и не увидел, у нас в университете преподаватель говорил "если вы пишете "очевидно что", то я вас точно попрошу предоставить доказательство". Более того, я написал интервьюеру из видео, однако он также не предоставил доказательства.
@@daniilchesakov6010 а что если так: пусть у нас N белых(хороших) и M черных(плохих). Известно что надо оптимизировать величину Z = 0.5(X+Y), где X вероятность вытащить хороший шар из первой урны и Y вытащить хороший шар из второй урны. В начальном состоянии имеем право спихнуть все шары в одну урну(первую) и далее работать перестановками шаров из первой во вторую и обратно. То есть X = N / (N+M), Y = 0. Давайте оптимизировать каждую из величин X и Y. На каждом шаге нашего алгоритма делаем преобразование, которое не уменьшает вероятность суммы (X+Y). 1. Перекладываем плохие шары во вторую урну. Вероятность X - максимизируется и доходит до = N / N = 1, вероятность Y - не меняется (= 0 / M). 2. В первой урне только хорошие шары, поэтому не уменьшая X, имеем право переносить хорошие шары из первой урны во вторую до тех пор, пока в первой не останется 1 хороший шар. Тем временем, с каждым шагом алгоритма, вероятность Y растет, то есть 1/M+1, 2/M+2, ..., (N-1)/(N+M-1). 3. Таким образом, пришли к ситуации, которую все представляют интуитивно понятной и очевидной. Как считаете, ок?) Кажется, что это скорее предъявление жадного алгоритма, но никак не доказательство его оптимальности
@@daniilchesakov6010 Поискал на англоязычных форумах доказательство данного факта в общем случае и ничего не нашел( Все попытки сводятся к рассмотрению частного случая и анализа функции от нескольких переменных, что не является достаточно изящным решением
4:20 естественно если человека задалбывать вечными приглашениями в группу, то он туда перейдет в среднем. Потом что большинство населения малограмотное ЛИБО это тупо удобнее. Это также как реклама кароче. Для этого используют дата саинс????
Московского рынка не знаю. По Бостонским меркам очень слабо. Я нанял 4х человек за последний год, и девушка на начальную позицию не прошла бы. Интервьюер тоже не очень. Не копает и принимает ответы, из которых понятно только то, что по большей части кандидат плавает.
Задача на sql решена хреново))))) Решается элементарно With t1 as (select rownum() over (order by column) rn, column from table) Select * from t1 where rn = (select max(rn) / 2 from t1) С тем, как правильно поделить/округлять надо подумать, но че-то там каунтом считать, когда посчитанны уже rownumber - бред
@@MyDeimonS Ну я вроде про это оставил комментарий)))) Просто суть в том, что они сначала считают rn, а потом дополнительно считают count(*), а до кучи еще и создают вьюху, в которой они просто сортируют данные))))))
@@MyDeimonS Я, на всякий случай, поясню, что row_number не работает без предложения order by, и как делить/округлять вопрос второстепенный в этом смысле Во всяком случае я такого не встречал))) Чтобы задать порядковый номер - нужна сортировка
также решил, для чет нечет case when наложил. Но прикол в том, что не все сиквелы оконные поддерживают. Мы к сожалению на сасе работаем и там нет оконных и констракта with, я бы тоже долго возился, если б постгрю не повторил. А вообще не понятно, зачем на саентиста его спрашивать. Лучше б питон погоняли бы
Ну у меня ни разу такого не было. Была либо полная жесть, когда у джунов олимпиадные задачи справшивают, или формулы с факториалами по теорверу, дебри типо индекса Джини, вывести формулу бэкпропагешена, либо же полный дет сад, когда на собесе одни манагеры и, если шаришь в бизнесе, можно как Остап нести чушь. Ни разу не видел такой золотой середины.
Идея классная, ждём продолжения! Но конкретно этот собес не о чём. Я ради интереса ставил на паузу и отвечал на каждый вопрос, в итоге я не ответил на вопрос про SQL(алгоритм я понятное дело придумал, но так как синтаксиса SQL я не знаю, ничего бы не написал), также ничего не написал про алгоритм кластеризации(ибо не решал задачи в этой области), и про А/В тестирование. Понятное дело, про опыт работы я бы тоже ничего не ответил. Ну и кажется, что если школьник отвечает на большую часть вопросов(где-то даже подробнее чем соискатель), а мне ещё до Джуна, как до луны, то это не уровень мидла. P.S сори если где-то грамматические ошибки, математику я учил, а вот русский как-то не очень)))
[ТАЙМ-ТЕГИ]
00:01:41 Вопросы про опыт работы
00:13:08 Вопросы по теории вероятностей
00:20:43 Вопросы по SQL
00:26:15 Вопросы по линейным моделям в data science
00:40:12 Вопросы по валидации моделей
00:44:18 Бизнес-задачи
01:04:45 Feedback
0
Tcffg
4
Если я меня еще раз спросят по SQL - я пошлю нахуй или встану и уйду, может еще и Exel тоже data science?
Табличные данные много считать, поэтому лучше линейные? бля ну тесла со своими видеопотоками по вашему должна была бы загнуться ребят
@@MrPopikeyshen хочешь в следующем шоу поучаствовать? Там будет сложнее, без SQL
Я может чего-то не понимаю, но первая задача на тервер, что значит точно также будет? Если доставать и обратно класть шары, то это даже не условная вероятность, как она сказала, а классическая вероятность, а если всё же брать условную вероятность, то надо принимать в расчет, какой шар вам попадется в k-1 случаях до этого и уже от этого отталкиваться
если это расписать по полной вероятности, то получится, что вне зависимости от значения k, ответ будет M/(N+M)
@@egortarutin6276 можешь расписать?)
Насколько я понимаю, вообще первый вопрос, к-ый нужно было задать интервьюеру после поставновки этой задачи, раз он сам это не сообщил, это будут ли шары доставаться и затем класться обратно или нет, т.к. да, во втором случае вероятность будет неизменной что для 1-го шара, что для к-го, но не будет в первом случае, что заметно усложняет задачу.
Анастасия молодец, не успугалась прийти. Те кто говорят что слабо, то хотелось бы посмотреть как бы они чувствовали себя перед камерой. Да тематика вопросов очень разнообразная. Для меня было очень полезно и придало мне уверенности в своих силах. Хочу продолжение
у нее свой канал на ютубе, чо ты несешь, камера ее уж точно не смущает.
Пройдя более, чем с десяток собесов на миддла в сбер, ВТБ, Мегафон, альфу, озон, райф за прошедший месяц, хочется сказать, что эти вопросы даже не для джуна, не говоря про миддла) Очень хотелось бы на таких интервьюеров попадать, конечно. В общем совет миддлам - копать в линейные/нелинейные алгоритмы поглубже раз в 5. Как и в валидацию/бизнес задачи. Про тервер, к слову, не спрашивали от слова совсем. Из 12 собесов про скиллы в sql спросили всего на двух. Но интересно не увидеть ни вопроса про матстат, про ансамбли, не говоря про устройство функций потерь и оптимизационных операций в алгоритмах.
Хочешь поучаствовать в следующем шоу? Вопросы сложнее будут
@@Fless спасибо, не хочу позориться) да и хватило уже так-то. Просто не хочется, чтобы у посмотревших сильно занижались ожидания.
Жаль. Шоу еще планируем, но найти кандидатов оказалось не так просто, как интервьюеров
А можете, пожалуйста, подробнее рассказать про характерные, частые вопросы или несколько примеров привести, чтобы лучше понимать, к чему готовиться?
Какое внимание уделяется вопросам программирования: алгоритмам и структурам, O-нотации, задачкам, паттернам ООП, git?
про loss и оптимизацию достаточно знать общие принципы и как примерно считаются или необходимо суметь несколько итераций sgd на листочке прогнать?
Насколько высок шанс завалить sql, если до этого не имел дело с ним на реальных задачах?
@@АнтонСеливанов-ь2о все что ниже написано - исключительно мой опыт (во что-то глубоко не копали, так как я сразу говорил, что не знал; во что-то копали), Так что не экстраполируйте сильно.
У меня опыта в ООП не было (как и пром разработки), но многие спрашивали про продакшн; по самому ООП лишь тестовое задание небольшое было, на интервью лишь пара вопросов.
Алгоритмы, структуры, О-большое не спрашивали, но в Альфе, Мэйле, Яндексе и Озоне были достаточно непростые задачки (а ля Leetcode среднего уровня), и если что-то делаешь не так спрашивают: а как можно поменьше памяти занять? А как сделать работу за O(n) время. Так что помимо алгоритмов и структур, немного надо понимать, что к чему. Но важнее грамотно реализовывать код. По части кода пару раз про хэш-функции, декораторы и время работы словарей/массивов спрашивали. Это редко.
По Гиту вопросов не было, больше про опыт продакшна в общих словах (как-на чем выкатывали и тд), но с этим у меня тоже слабо. Дальше может и копали бы в мл-опс, докер и тд.
Реализовать sgd или что-то подобное на листочке из всех раз просили всего один раз. В основном спрашивают разные нюансы в общих словах, и не только про бустинг. В том числе обычные деревья, регрессии - как, почему так работают, почему функция оптимизации такая и не иная, какие ограничения это накладывает, какие требования к данным, как правильно настраивать модель и т.д.
Имхо, sql в меньшем приоритете, спрашивают не особо часто. Но знать важно, ибо спрашивают! Реальный опыт незаменим, но если разобраться с джойнами, оконными функциями, агрегациями, вложенными запросами, мб конструкцией CASE и пощупать это руками (например в sql-tutorial или w3schools.com) - думаю, проблем не будет. Как мне кажется, по SQL гоняют больше мл-инженеров. Но это имхо, и я бы посоветовал немного разобраться в вышеупомянутом.
Если суммировать - лично у меня про мл-алгоритмы на позицию миддл ДС спрашивали больше всего. А так же про проекты - как, каким путем реализовывал.
Спасибо большое!!! Очень понравилось! Надеюсь в скором будет такое же интервью для Junior Data Scientist
Очень крутой формат.
1. Зовите пожалуйста джунов, желательно тех, кто ищет работу (в слаке ОДС думаю можно найти ребят, готовых поучаствовать)
2. Слишком мало вопросов по терверу и sql, нет вопросов по статистике, алгоритмам и языку (понятно, что автор хотел сократить видео, дабы оно не длилось два часа, НО это именно тот годный контент, который должен длится по два часа, его смотришь и кайфуешь)
3. Возможно интервьюеру стоило бы озвучивать ответ, который он хотел бы услышать
4. В конце какой-то вердикт(нанято/не нанято=)) и рекомендации бы еще
В любом случае очень годно, спасибо!
Зачем вопросы по тер веру нужны?
А мне вот был не очень очевиден ответ во 2 задаче по теорверу. Я решал так: пусть k1 - колво белых, k2 - черных в 1ой урне. Тогда можем посчитать белые и черные во 2ой. Построил функцию от k1, k2 равную вероятности. И посчитал производную от неё по k1, k2. Приравнял их к 0, как необх. усл. максимума. Решил систему.
Кто-то может рассказать поподробней как эта задача решается? как-то в конце совсем не ясно стало.
@@mifak47 Можно решить по индукции. Допустим, что нам известно решение для заданных N и M, т.е. мы знаем, сколько n и m надо положить в условную первую урну. Тогда встает вопрос: а что делать, если нам дали ещё один дополнительный шар? Рассмотрим два случая:
1) Нам дали белый шар. Тогда его надо класть в урну, где "концентрация" белых шаров ниже, т.к. это даст больший эффект на финальную вероятность, чем если положить его в урну, где уже и так много белых шаров. Доказательство довольно простое - надо просто рассмотреть функцию, как растет вероятность белого при изменении количества белых шаров и заданом количестве черных шаров.
2) Нам дали черный шар. Тогда, его тоже надо положить в урну, где "концентрация" черных выше - чтобы вероятность белого уменьшилась меньше. Доказывается аналогично предыдущему.
Теперь рассмотрим случай, когда у нас всего два шара: черный и белый. Нетрудно посчитать, что надо разложить их по разным урнам. Т.е. в первой урне лежит белый, во второй - черный.
Тогда для случая произвольных N и M, можно начать с одного черного и белого, и далее итеративно применять правило. Нетрудно видеть, что при применении этого правила, каждый новый шар всегда будет попадать в урну, где изначально лежал черный шар, т.к. в урне с одним белым, концентрация белых равна свою максимуму (единице). Значит, оптимальное решение - в одной урне один белый шар, в другой урне все остальные.
@@АлександрПолевой-е2б гениально
@@АлександрПолевой-е2б Ну, это, к сожалению, неправда, которая кроется в первом пункте за словами "доказательство довольно простое". Приведу контр пример. Допустим нам дали белый шар и у нас есть какое-то распределение шаров в урнах. Допустим распределение следующее -- в первой урне у нас 1000 белых шаров и 9000 черных, а во второй 1 белый и 1 черный. В первой урне концентрация белых шаров ниже, чем во второй (1/10 против 1/2). Если к нам пришел белый шар, то по логике решения, его должно быть выгодно положить в левую урну. Однако это не так, если мы положим шар в левую урну, то вероятность вытащить белый шар изменится с (1000/10000+1/2)*1/2 = 0.3 до (1001/10001+1/2)*1/2 = 0.300045, а если бы мы положили в правую урну (где концентрация выше), то получим (1/10 + 2/3)*1/2 = 0.38(3), то есть вероятность вытащить белый шар вырастет значительно и выгоднее класть в правую урну с более высокой концентрацией. Можно и обратный пример -- сделай в левой урне не 1000 белых и 9000 черных, а 9000 белых и 1000 черных, класть все равно будет выгоднее в правую (хотя "концентрация" в левой будет теперь уже выше). Все это приводит нас к тому факту, что решения таким способом достичь не получится.
Не проще ли в одну урну положить один белый шар, а во вторую положить оставшиеся?
Интуитивно кажется так самая высокая вероятность
UPD: Прочитал коммент выше, там такая же идея
Хороший формат. Жду продолжения! Отдельный лайк за Анастасию, давно её смотрю
Эх, интересно как связаны вопросы с middle ролью. На все это можно ответить пройдя любой курс по ML, и прочитав 2 статьи по бизнес-метрикам. С АБ-тестом произошел некоторый провал(
Upd
Я отпишу свой взгляд на вопросы для middle и старше, чтобы комментарий выше не был банальной критикой с моей стороны. Такие вопросы должны быть открытыми и представлять собой некоторую реальную задачу, которую нельзя решить за один шаг. Нужно будет накидать идей, выбрать самую работоспособную, проверить ее возможные недостатки и проблемы реализации. Обязательно связывать это с реальным миром.
Вопрос "объясните менеджеру, почему он не прав в оценке результатов теста" - совсем низкого уровня. Он может стать сложнее, если обсуждаются неочевидные тонкости (и тогда он станет скорее техническим), но это не тот случай. Обратная связь, что кейсы были уровня сеньор-лид выглядит очень натянутой.
Спасибо за идею! Посмотрим, что интервьюеры захотят спросить в следующих эпизодах. Подозреваю, что примерно то, что ты пишешь
9 из 10 собесов такие)
@Astroprudding, вы когда в последний раз интервью на мидла проходили??? Если вы считаете, что вопросы на мидла слишком простые, то вы плохо понимаете рынок труда. Сочувствую вашим подчинённым если они есть. Ну а если вы ещё только начинаете свою карьеру как DS, то смелее в бой на собесы и хватит дрожать от мысли, что знаний все ещё недостаточно 💪💪💪
@@ВладимирШумаков-м9щ Это сообщение восхитительно, то у меня есть подчиненные, то я начинаю карьеру в DS. Сочувствую рынку труда, где на мидла собеседуют по L1, L2 регуляризации, без единого кейса для проверки способности кандидата предлагать решение реальной проблемы
@@ВладимирШумаков-м9щ кринж. Давайте ещё ниже ставить мидлов
7:57 - Окей, на сколько это законно?
Я сразу вспомнил Ди Каприо из фильма "Волк с Уолл-стрит", где он на этот вопрос ответил - "Да не законно это нихрена"
Это первое собеседование на позицию senior middle DS из тех что я видел на TH-cam. Спасибо 👍👍👍 Уверен, что буду пересматривать его перед своими следующими собеседованиями. Насте огромное спасибо за смелость. 💪💪💪
Читаю комментарии: это просто шедевр и песня!!
Такое исследование человеческой натуры ))))
- Я невероятно крут, вы копошитесь где-то внизу
- Пройдёшь собеседование?
- Нет, обстоятельства
Кажется больше постановкой, для рекламы, чем реальным интервью: большинство вопросов не были раскрыты в достаточной степени, и в большинстве случаев ведущий сам отвечал на свои же вопросы :) (от кандидата очень много "воды")
Я недавно проходил собеседования на Мидла в разных банках. На мой взгляд, вопросы адекватные. Примерно на такую глубину и спрашивают. Спасибо за выпуск. Оооочень понравилось
Подскажите, пожалуйста, только в банках проходили или ещë где?
Можете рассказать, насколько сурово с вопросами по следующим направлениям:
1) алгоритмы, структуры данных, О-нотация, задачки со всяких хакерранков?
2) ООП, паттерны, архитектура?
3) всякие SOLID, KISS, YAGNI и прочие слова, которые любят спросить у программистов?
4) контроль версий, git, mlfow, wandb?
5) распараллеливание, нити, процессы, async?
6) внутренности алгоритмов ML, алгоритм обратного распространения ошибки на бумажке?
7) основы матстатистики - вероятностные распределения, выборки, оценка выборочных параметров, построение доверительных интервалов?
8) QA и тесты?
Собеседующие так же доброжелательны, как товарищ на видео или всë же более суровы и менее общительны?
Я вам отвечу, если можно, я сейчас сама прохожу собеседования и сама провожу😅 у меня сложилось такое ощущение, что в банках (наверное кроме тинькофф) довольно слабые ds, которые задают поверхностные вопросы и текущее собеседование отражает этот уровень. Если это компании типо озон или Яндекс, то уже будут и алгоритмы и более глубокие вопросы. Я сама работаю в банке, но так как я шарю чуть больше чем обычные ds в банках, то вопросы у меня тоже уже чуть посложнее. По поводу доброжелательности зависит от человека, но в целом даже если ты не знаешь, но приводишь верные рассуждения или можешь вывести на ходу, это уже большой плюс.
@@МаринаТолмашова-с8ш большое спасибо за ответ. Никогда бы не подумал, что в банках слабые ds... Но, видимо, им достаточно такого уровня.
Сложно, конечно, представить, какие вопросы простые, а какие - чуть посложнее, но, с другой, стороны, описать это наверное тоже непросто :-D
А вообще по ощущениям - какова сейчас ситуация - ds' ов хватает? Кандидатов много? И какая доля из них - не случайные ребята?
А если область джун+ - миддл?
И вопрос немного отвлечëнный - аспирантура/кандидатская степень - скорее плюс или минус?)
Простые: это как работает тот или иной алгоритм, какие метрики качества знаешь, какая нибудь простая задача с тер вера, посложнее: напиши алгоритм, задача про шары как в видео, только если ты шары не возвращаешь в урну. Кандидатов в принципе хватает, но довольно слабых, он прошли курсы и валятся буквально на первой алгоритмической задаче или чуть более глубоком копании в теорию. Я сама долго искала работу, уже планировала в аналитике оставаться 🤷🏻♀️ Степень мне кажется не важна, мне даже кажется что это чуть overqualified
Подскажите плиз, сколько платят на руки таким мидлам в банках? Потому что требования к мидлам могут быть разные, если зп разные
Многие пишут что вопросы легкие и уровня джуна...
Отличие джуна от мидла/сеньора в том, что как раз джун на эти вопросы отвечает легко, у него от зубов отскакивает, т.к. он месяц назад полугодовой мл-курс окончил. Он расскажет тебе о всех моделях и метриках, что услышал. Но он не понимает когда какую и почему нужно применять в твоем бизнесе.
Мидл/синьор, в большинстве своем, фул-тайм варится в области своей задачи и поэтому забыл давно о метриках и подходах, которые не применял на работе в последние 2-3 года. Но плюс мидла-серьора в том, что он точно улавливает как мл-метрики подвязать к бизнес метрикам (мидл-меньше, сеньор-больше), как придумать и провести эксперимент, подтверждающий/опровергающий предложения и просьбы овнера. И главное, если понимает, что для задачи понадобится подход, который не использовал 2 года - он идет в гугл и за час вспоминает все, что проходил на МЛ-курсах по этой теме давным давно, и так же быстро это реализует.
Цель интервью как раз понять - ты джун после курсов, легко отвечающий на стандартные вопросы, или человек, поработавший в бою несколько лет, повидавший и попробовавший разное, чем занимался и чего не боишьсь. С этим кандидат справилась.
Кандидат точно хорошего уровня мидл, с перспективой на сеньора, т.к. всё-таки отшить надоедливого продакт-менеджера не смогла сразу ;) Да и задачу с оттоком в бизнес-метрику перевела не сразу, а это очень требуется на данном уровне
@@101afg101 если это шутка, то она очень хорошая. По вашему описанию, девушка хороший джун - отвечает на технические вопросы и вообще не отвечает на продуктовые. Но в выводе она "хороший мидл" с перспективой на сеньора
@@St0pGame она мидл, т.к. несколько лет проработала в полях, отвечает на вопросы не вспоминая курс, а вспоминая реальную практику. Ей не надо разжевывать задачи как джуну, она сама выберет инструменты и способ решения.
Так же у неё опыт обучения других, что говорит о желании и перспективе синьора. Но после соответствующего опыта, конечно, где она будет брать на себя больше ответственности.
Лайк, подписка, комментарий в поддержку видео для продвижения в топы!
Удачи всем и хорошего настроения!
Супер, невероятно интересный формат оказывается!
Круто, отличная идея. Интересно было бы посмотреть как выглядит собес на Lead/Head, не видел таких видео в Ютуб:)
Дададада
Клёво, формат однозначно интересный. На уровни разбить:
+ Джуна ещё и мидда и тимлида
+ Разные форматы собес какие баще (чтоб пояснили может это народу зайдет, мне точно зайдет)
+ По направлениям домена:
Финансы/ ритейл (его вообще мало)
Круто, но порой прыгает звук, и было бы круто, чтобы человек проходил собеседование не на листе, а на доске, чтобы зрителю было видно, что человек пишет
Мне планшет пришел в голову
Да, это будет в следующем эпизоде. Там отдельная камера снимала записи кандидатов
Очень круто! А можно на позицию Junior то же самое
Это оно и было 😀
в процессе просмотра всего интервью не покидало ощущение нереальности. может так обычно и собеседуют симпатичных девушек, но интервьюер постоянно пытается подсказывать и меняет тему, если видит что кандидат начинает "плавать" в вопросе. а на реальных интервью наоборот пытаются наводящими вопросами прощупать твои слабые места и задать пару конкретных вопросов в углубление, чтобы убедиться, что твои знания в какой-то области поверхностны.
Хочешь поучаствовать в следующем шоу? Вопросы сложнее будут
Я не согласен. На мой взгляд в реальной жизни стараются понять, что ты знаешь. Понять можно только помогая и задавая наводящие вопросы. Также с помощью наводящих вопросов можно понять насколько лёгко будет работать с человеком. Если понимает намеки, то и работать будет легко и не придётся по 100 раз объяснять. Что скажете?
@@ВладимирШумаков-м9щ ну в общем согласен, на интервью обычно стараются быть с собеседуемым максимально вежливыми, чтобы человек расслабился, был откровенным, не боялся ошибиться. А уже в конце скажут, что мы вам позвоним, позже, когда нибудь, может быть)
По-моему это как интервьювер видит собеседуемого. Если он видит, что она понимает, то он и сам дополняет некоторые моменты. Сл мной такое же собеседование было. Человек видел, что я понимаю и наше общение пошло довольно легко
в реальной жизни, когда на мидла, в половине случаев про проекты выслушают и тестовое покрутят и все. теория упускается
Вьюшка, Семплинг - Файн!
К сожалению это не интервью, а плохой спектакль:(
1) Теория вероятности.
Первая задача:
Кандидат не объясняет, почему проверка K-ого шара на белость не отличается от проверки первого.
Вторая задача:
Интервьюер: "довольно понятно почему оно оптимально", это должен говорить кандидат и сразу добавлять почему же оно оптимально.
2) SQL.
Простенький запрос с трудом вымученный Кандидатом, максимум это вопрос для скрина - проверить, что вы хоть что-то слышали про SQL.
3) Линейные модели.
Тут кандидат к сожаления не упомянул главного: что линейные модели содержат мало параметров и они почти не переобучаются.
Кандидат не называется собственно линейные модели по имени - линейная регрессия и линейный SVM.
Про онлайн совершенно не в тему, любая модель может обучаться в онлайне, вопрос в ресурсах, качестве обучения и способе.
По поводу быстроты линейных моделей тоже неверно, все зависит от числа параметров модели - неглубокий небольшой лес вполне может работать быстрее.
Про отдачу модели в центробанк: а параметры кто же будет нормализовывать сперва, как кандидат собирается сравнивать коэффициент у возраста и годовой зарплаты без нормализации?
Выбор 50 лучших фичей: не упомянут, самый простой способ - выбрать случайно 50 фичей и выбрать лучший набор среди них.
L1 - Кандидат не объясняет почему собственно L1 ведет к спарсити.
4) Кластеризация.
Спектральная кластеризация: Кандидат не верно говорит, почему его сложно посчитать - нужно решить линейное уравнение, для этого надо найти обратную матрицу, это сложность O(N^3).
“Вложенная структрура” - нет понятного объяснения от Кандидата почему K-means работать не будет.
“K-means считает число точек” - не считает он точки.
Интервьюер: “K-means не лучший алгоритм”. Не лучший для каких задача? В каких условиях? Если просто не лучший, почему это возможно самый популярный алгоритм кластеризации?
Вывод: Кандидат не дотягивает до джуна, Интервьюер до мидла.
Про 1 - кандидат понял задачу, как вытаскивание с возвращением :)
@@w01fer86 даже без возвращения ответ тот же)
@@ВалерияСмирнова-ц7л именно поэтому и получилось, что формально ответ верный, но объяснение уровня "это очевидно", хотя для варианта без возвращения не очевидно
Как я понял в первой задаче вероятность не меняется в связи с тем что не известно какие шары вытаскивались до к-го шара. И этот принципиальный момент интервьювер не уточнил. Такое ощущение что он сам не понимает разницу.
Удивительно то, что при этом кандидат позиционирует себя как сеньора, и ведет свои платные курсы (не самые дешевые, вполне по рыночным ценам).
Очень круто, но хотелось бы видеть еще как-то сам ход решения, не всегда легко держать в голове весь алгоритм, особенно в крупных задачах.
Да, это будет в следующих эпизодах
Осень круто! Спасибо вам!
Хотелось бы увидеть собеседование на тему инфаструктуры больших данных. Спасибо!
Было бы очень интересно посмотреть собеседование сильного интервьюера с сильным действительно опытным мидлом! Я джун от ДС и даже у меня посложнее собесы уже были, интересно как на вопросы отвечал бы настоящий профессионал
Сказано - сделано) th-cam.com/video/F5-TDP7DYUE/w-d-xo.html
13:09 - Классика жанра )) по-моему первая глава у Бишопа по Машинному Обучению или около того.
Аве Кодер!
Анастасия умничка конечно , спасибо за контент ❤
По идее: топ, интересно было бы посмотреть больше видео такого формата в будущем.
По интервью: слабый кандидат на Middle DS. Кажется, что такие вопросы стоит задавать на позицию Junior DS (кроме бизнес-задач), и он должен уверенно на них отвечать.
По фидбэку в конце: фидбэк хочется видеть более критичный. Но вряд ли в таком формате интервью это возможно.
Божественно
У меня на позицию джуна такого не спрашивали, больше на знание моделей под капотом), может не в ту фирму собеседовалась 😁
Как-то слабовато на мидла, смотрел кусочками. Включил про валидацию -- только стратификацию упомянула, причем только по таргету, насколько можно судить. Ни оценки стабильности и предсказательной силы фичей, ни исключения covariate shift, ни хотя бы выбора стратегии семплирования -- oos/oot и тд, ни проверки модели на бизнес-логику (упрощенно -- фичи работают в правильную сторону). Далее можно перейти к более общим вопросам, например стратегии семплирования самого train для задач регрессии, многоклассовой классификации -- как вообще отобрать корректный кусок данных, который отдать на разметку (если нет понятного события) -- например, как из 10 млрд транзакций десятков разных типов с разницей в частоте в тысячи раз выбрать те, которые отдать эксперту на разметку. Короче, ни методологических, ни математических приемов валидация моделей не назвала
Вообще можно много чего. О валидации, как и о линейных моделях можно разговаривать часами. Цель собеседования (особенно в рамках сжатого тайминга) понять кругозор в DS, о чем человек думает в первую очередь, когда строит валидацию, а не закопаться в глубь по каждому вопросу.
Понабежали тут диванные эксперты
@Reason To Live че вы на девушку набросились то ?
@Reason To Live простите, перефразирую: зачем нападать на человека? (женского пола)
"
как вообще отобрать корректный кусок данных, который отдать на разметку (если нет понятного события) -- например, как из 10 млрд транзакций десятков разных типов с разницей в частоте в тысячи раз выбрать те, которые отдать эксперту на разметку
"
Никита, не могли бы дать ссылку на решение этого вопроса или ключевые слова?
Походу всяких таких шоу стало больше , чем вакансий!
Крутой и насыщенный ролик. Такой рубрики давно не хватало!
Мое внимание часто отвлекала светящаяся табличка «Нанято». Возможно, это такая задумка авторов 🤔 но не отвлекает ли это на самом собеседовании?
Спасибо! Да, это задумка, но ошибка вышла с частотой смены картинки. Будем править
так а разве медиана в случае тех же 31 будет не под номером 16?
тогда номер этого числа будет не (31-1)/2=15, а (31+1)/2=16
Какая разница??? Это же мелочи. Если в них зарываться, то ни одну реальную задачу не сделаешь. В целом ответила полно и правильно. Для реальной задачи она бы ещё раз перепроверила и возможность подобных ошибок была бы устранена.
Классная инфа. Не все понял. Но понял что некоторые люди могут решать нереальные задачи про вероятности и про шары в урне, и про медианы в таблицах и про нерадивых сотрудников и взаимодействия с ними и их бесполезной статистикой.
Респект.! Я хз как вы это делаете.
Это тебе в уши льют сказки
Отличная рубрика
49:00 Я не понял одного, о какой фазе идёт речь? Если мы сделали inference и получили условно нули и единицы (churn) то как мы можем определять их на TP,TN,FP,FN если у нас True лейбелов пока ещё нет??? Здесь речь идёт о том, кому мы будем делать предложение на скидки зная вероятности Churn!
Умничка, отличный контент!
Витя, ждём собес на продакта! Желательно от ребят из yandex/google/apple/jetbrains/wrike/ozon. Шоу топ!
Пролистал список тем и немного офигел:
1) Зачем ДСа мидла спрашивать про тер вер? Это вопрос для джунов, которых нельзя погонять по опыту и технологиям.
2) SQL не очень репрезентативный, т.к. много где nosql, но пусть будет, действительно часто спрашивают.
3) Почему только про линейные модели спросили? Уверен что с помощью них решается намного меньше задач, чем через деревья.
Структура больше похоже на интервью джуна с более сложными вопросами. Обычно на мидла гоняют по опыту и от туда все вопросы вытекают.
Подозреваю такой формат больше заходит под ютуб и людей разных спек и домейнов.
Классно! Можно в след раз побольше фидбэка!
Мне кажется бизнесовая часть однозначно завалена, но чья здесь больше заслуга, того, ктт задавал вопросы или того, кто на них отвечал, сказать сложно
Хорошая идея с собеседованиями, уверен будет успешный проект!
Очень приятный интервьюер!
немного шокирован ответом на 1-й вопрос по теории вероятностей. Разве вытащив k-1 шаров мы не можем вычесть соответствующее количество уже вытащенных белых и чёрных шаров из их общего количества? И этим уточнить вычисление вероятности для k-го шара?
Так вопрос в том, какова вероятность, что именно K-тый шар будет белым. В условии задачи нет информации о том, какие шары вытащены до K-того.
@@ilyakuzmin2256 согласен, но это уточнение кардинально влияет на правильный ответ. Вообще такие задачки на логику часто и задаются для того, чтобы понять как человек способен задавать уточняющие вопросы, которые повлияют на вариант решения. Или он зациклится на первоначальном, возможно неверном, понимании задачи.
@@ihorsavchenko2787 Полностью согласен. Человек, который шарит за теорвер, сразу бы спросил, нужна ли вероятность при условии вытащенных шаров, или же безусловная вероятность. Девушка, очевидно, в теорвере совсем не бум-бум, а умеет только фит-предикт гонять.
то есть вы в качестве ответа дали бы функцию от числа белых шаров, вынутых за k-1 попытку?
@@PaulGanarara мне кажется здесь смысл задачи в том, что для её корректного решения надо задать уточняющий вопрос, можно ли смотреть на уже вытащенные шары.
Поддался борода очарованию
Огонь!
круто !
Блин зачем нужны все эти вопросы по теорверу?? Аааа.. Это же как справочные данные, когда надо это легко гуглится. Надо людей тестировать на подход к реальным задачам
Уже два видео посмотрел по этой теме на этом канале и сложилось мнение, что это слишком просто. Но в коментах пишут, что все сложнее!
Это же Настя! Моя любимая девочка и датасаентист! И как это я раньше умудрился не увидеть это интервью? Спасибо!
Cool 😎жду на junior
Привет всем, подскажите пожалуйста как перевести сайт kaggle на русский. Свм сайт то переводится, а вот информация в курсах нет. Помогите)
Классный формат
Решил обе задачи по вероятности за 2 минуты
Возьмите на стажировку пж)))
эти задачи были заданы, чтоб глупая биомасса возомнила себя не такой глупой и активизировалась, начала всем этот видос слать.
урна)) справились ?? как будут мешать шары в урнах 1) урны просто переставят местами случайно ( перемешают таким образом) и дадут выбрать 2) шары в каждой из урне перемешают и перемешают урны и дадут выбрать урны.... если вариант 1 то вероятность 100% вниз укладываем черные вверх белые. вариант 2) вариант тогда да если n=m то 1 шар в другую урну соответственно вероятность белого шара из другой урны будем максимальна. ...ну еще есть 3 вариант))) если шары перемешают из одной урны в другую, потом перемешают шары в урнах и перемешают урны местами)))..
Если бы это было боевое интервью, сколько было бы алгоритмических задачек?
Зависит от компании. Возможно, нисколько )
бывают не на джуна вообще не спрашивают никаких задачек, а просто беседуют об опыте кандидата
@@DataScienceGuy Видимо раз на раз не приходится потому что мои неудачные собесы на джун дса заканчивались на том что я не могу оптимально реализовать встроенный каунтер из collections или рассчитать потребление памяти бабл сорта ;(
@@DataScienceGuy Кирилл, ты был бы крутым человеком кого могли бы также проинтервьюировать, или ты уже не джун совсем совсем?)
Только начал смотреть ролик, вставка 18+ подсказывает мне, что она пройдёт
Надо записи собеседуемого тоже показывать иначе не очень понятно.
Ну Анастасия - просто сок! Только за нее на превьюхе сразу лайк :)
У меня тоже при виде Анастасии поднимается...палец, чтобы лайк поставить :)
симп
Спасибо за видео! Очень здорово снято и материал будет очень полезен новичкам. Тем не менее, хотел бы заметить (как hiring manager и data scientist) - это вопросы уровня очень junior ds или mid-senior analyst. Middle DS должен уметь писать неплохой и чистый Python код (и я не про черновики в ноутбуках), автоматизировать ML пайплайны, деплоить модели, хорошо понимать основные метрики классических проблем (классификация, регрессии) и неплохо понимать фундаментальные плюсы/минусы юзкейсов boosted trees моделей vs базовых (логрег и дерево). (От мидла редко ожидаются знания или серьезный опыт работы с нейронками, так что это скипаю.) Я интернов куда суровее собеседую. :)
Людей, готовых сурово пособеседовать, уже целый wait-list :) Трудно найти людей, готовых сурово собеседоваться на камеру
@@Fless привет, можно позвать людей с фивта мфти, у нас есть много сильных дс среди выпускников. Мб смогу помочь найти кандидатов для жёсткого собеседования, если интересно, то тг @runfme. Через месяца два, когда пройду собеседования на работу и пойму, насколько я сейчас готов, то и сам соглашусь на такое)
Добрый день.
Подскажите можно ли
найти что-то подобное в принципе? Как лучше поступить ? Писать игру с нуля не
получится точно!
Простая карточная
игра (качество и сложность не важно. лучше что-то по проще..)
HTML, CSS, JS, MySQL
Описание:
Регистрация игрока, Минимум два участника
Спасибо
Ого, даа нишевых блогера, которых я смотрю неожиданно соединились...я про Никулину)
Поддерживаю
соглащусь ). права странно смотреть собес её на мидла, когда она (вроде) говорила, что она суперсеньёр . если на это не отвлекаться, то идея и воплощение хороши.
У мужика квадратная голова )
Прикольно 😀
топ коммент :)
хорошо бы ещё на этом планшете который в видео , видно было записи что она считает ,или использовала бы его доску. было бы нагляднее . спс.
Сделали во всех следующих эпизодах)
я ответил на 90% его вопросов. но опыта в дата сайнс = 0 , какова вероятность пройти собеседование?
0.9 * 0
Мне кажется про медиану вопрос можно было решить проще, через offset с подзапросом count/2
Здорово, но хотелось бы видеть бумажку, что пишет Анастасия, решая задачи.
почему порядковый номер медианы 31 числа это 15? 16 же, нет? row_number у нас с единицы начинается
Не хватает визуализации условий, хода решения и ответов на экране для зрителей.
Да, это исправили в пилоте английского шоу th-cam.com/video/cGpNcNLWXrc/w-d-xo.html
люди программисты гении какие то
Почему ничего не сказали ничего про бейслайн в вопросе про линейные модели?
обожаю математику за такие условия типа: найди медиану, не используя функцию медиан. супер блть вскопай яму, не используя лопаты да? поэтому я и учусь на фронтенда
Во фронте куча задач серии «сделай X, не используя Y». Постоянно всплывает такое, когда работаешь с легаси-кодом или код будет запускать не на попсовых браузерах.
@@dmitrypetrov3052 вообще то я уже полгода этим занимаюсь и ничего такого ещё не видел, такое только происходит во время работы над не очень популярными проектами, например в верстке писем, но опять же никто не заставляет
Ну как-то очень слабо для мидла,это даже для джуна лоу-лвл. Теор/вер-вопросы ниочем. Линейный модели-ну спросить хотя бы стандарт про l-нормы,лассо и прочее. Про валидацию-ни 1 вопроса про дата лики и оценку чувствительности. Вопросов про оптимизацию, матричные операции и факторизации и хотя бы верхнеуровнево про дискретку и графы не было. В итоге это скорее история про "фит-предикт" дата саентиста(но может бизнесу такие и нужны).
приди и покажи класс, а так сидя на диване перед монитором всякий может.
Хочешь поучаствовать в следующем шоу? Вопросы сложнее будут
@@Fless на правах кого?)мне не надо никуда устраиваться, я уже на своем месте)
Зачем спрашивать вопросы про дискретку и графы… в этом нет никакого смысла
Илья, кандидата. Интервьюеров уже wait-list набрался, а нужны кандидаты, способные выдержать сложное интервью на синьора или тимлида. Принимать оффер не нужно, это лишь тренировка. Готов поучаствовать?
Извините, я не хочу писать какой-то негативный комментарий ,напишу как есть. Вопросы какие-то нереально слабые для middle разработчика) Я занимаюсь
ml чуть больше 5 месяцев(курсы,kaggle и тд) И ответы на эти вопросы я знал=) ОЧЕНЬ УДИВИТЕЛЬНО! и даже скажу ,что ответы от девушки были далеко не все
Чем более senior позиция, тем меньше технических вопросов и больше про бизнес и команду
вопросы как для джуна
нужно сверху снимать или просить чтобы на планшете рисовали так будет еще круче
19:40 правильно понял, что для задания по комбинаторике финальная формула:
((n-1)/(M+N-1))*1/2
((N-1)/(M+N-1))+1/2
Над фото парня хорошо поиздевались на превью)
Интересный формат, единственное хорошо бы видеть, что на бумажке пишет собеседуемый.
Да, это реализовали во втором выпуске - на английском th-cam.com/video/cGpNcNLWXrc/w-d-xo.html
А вот как быть, когда сходу тупишь и не можешь такие задачки решать? Ну, например, мне тяжело думать под таким контролем. Комфортнее посидеть, подумать. По факту ведь скорость соображания менее важна качества?)
И как быть, например, когда несколько лет работал в CV, и с тервером вообще не сталкивался. И на собесе ты валишься на этом вопросе? 🤣🤣
Так Анастасия вроде бы сама синьор у себя на рабочем месте. Или это просто условное интервью для выпуска?
Никого не хочу обидеть :) но это epic fail
И как я пропустил выпуск, если стоит колокольчик? странно )
Не понял, почему в задаче о распределении белых и черных шаров сказано, что "оптимальность этого решения очевидна". Мне вот не очевидна, можно ли услышать доказательства от авторов?
P = 0,5x + 0,5y, где x и y - вероятность достать белый шар из первой или второй урны соответственно.
Если у нас 1 белый и 1 чёрный шар, то
Мы получим 0,5*1/2 + 0,5*0 = 0,25 или
0,5*1 + 0,5*0 = 0,5 (в первом случае оба шара в одной корзине, во втором по шару в каждой)
Результат Примера с одним белым и одним чёрным шаром по одному на корзину тождественнен с любым примером, где все белые шары положили в первую корзину, и все чёрные в другую при равенстве белых и чёрных шаров и равен 0,5
Теперь попробуем оптимизировать решение для 4 шаров (2Б и 2Ч)
Производную так просто не посчитаем т.к. у нас будет 2 неизвестные:
(P = w/n + (2 - w)/(4-n) где w кол-во белых шаров в первой корзине, n кол-во шаров в первой корзине)
Поэтому переберём все варианты (кроме 2б/2ч и 0/2б2ч т.к. их мы уже считали)
1б/1б2ч = 0,5*1 + 0,5*0,33 = 0,665
1ч/2б1ч = 0,5*0 + 0,5*0,66 = 0,33
Если мы возьмём большее кол-во шаров, то заметим, что нам выгодно минимальным количеством белых шаров получать 50% вероятность достать белый шар. При этом большее количество белых шаров при отсутствии чёрных не выгодно, т.к. уменьшает вероятность достать белый шар из второй корзины, а смешение белых и чёрных шаров будет не выгодно т.к. у нас очень "жирный" коэффицент 0,5 (выбор корзины)
@@vladimirbeliayev836 это все отлично, но это не есть строгое доказательство для любого числа шаров. Я не оспариваю верность решения -- мне тоже кажется, что решение предложенное в видео оптимально. Я лишь не согласен с тем, что "оптимальность решения очевидна" -- она не очевидна, потому что я доказательства так и не увидел, у нас в университете преподаватель говорил "если вы пишете "очевидно что", то я вас точно попрошу предоставить доказательство". Более того, я написал интервьюеру из видео, однако он также не предоставил доказательства.
@@daniilchesakov6010 а что если так: пусть у нас N белых(хороших) и M черных(плохих). Известно что надо оптимизировать величину Z = 0.5(X+Y), где X вероятность вытащить хороший шар из первой урны и Y вытащить хороший шар из второй урны.
В начальном состоянии имеем право спихнуть все шары в одну урну(первую) и далее работать перестановками шаров из первой во вторую и обратно.
То есть X = N / (N+M), Y = 0.
Давайте оптимизировать каждую из величин X и Y. На каждом шаге нашего алгоритма делаем преобразование, которое не уменьшает вероятность суммы (X+Y).
1. Перекладываем плохие шары во вторую урну. Вероятность X - максимизируется и доходит до = N / N = 1, вероятность Y - не меняется (= 0 / M).
2. В первой урне только хорошие шары, поэтому не уменьшая X, имеем право переносить хорошие шары из первой урны во вторую до тех пор, пока в первой не останется 1 хороший шар. Тем временем, с каждым шагом алгоритма, вероятность Y растет, то есть 1/M+1, 2/M+2, ..., (N-1)/(N+M-1).
3. Таким образом, пришли к ситуации, которую все представляют интуитивно понятной и очевидной.
Как считаете, ок?)
Кажется, что это скорее предъявление жадного алгоритма, но никак не доказательство его оптимальности
@@daniilchesakov6010 Поискал на англоязычных форумах доказательство данного факта в общем случае и ничего не нашел(
Все попытки сводятся к рассмотрению частного случая и анализа функции от нескольких переменных, что не является достаточно изящным решением
а мидлов точно прогоняют вопросами с шарами?
4:20 естественно если человека задалбывать вечными приглашениями в группу, то он туда перейдет в среднем. Потом что большинство населения малограмотное ЛИБО это тупо удобнее. Это также как реклама кароче. Для этого используют дата саинс????
Что за прибор на столе показывает буковки? Это дичь несусветная.
Московского рынка не знаю. По Бостонским меркам очень слабо. Я нанял 4х человек за последний год, и девушка на начальную позицию не прошла бы. Интервьюер тоже не очень. Не копает и принимает ответы, из которых понятно только то, что по большей части кандидат плавает.
ну вы конечно голос изуродовали шумоподавлением
Это на мидла такие детские вопросы? А ответы на джуна скорее тянут, чем мидла. Странно. Может, я что-то не понимаю
Говорит "M белых и N черных", а текстом наоборот пишут )
Задача на sql решена хреново)))))
Решается элементарно
With t1 as (select rownum() over (order by column) rn, column from table)
Select * from t1 where rn = (select max(rn) / 2 from t1)
С тем, как правильно поделить/округлять надо подумать, но че-то там каунтом считать, когда посчитанны уже rownumber - бред
При нечетном max(rn) у тебя не отработает условие WHERE (прим.: у тебя есть например строка под rn = 15.5?)
@@MyDeimonS Ну я вроде про это оставил комментарий))))
Просто суть в том, что они сначала считают rn, а потом дополнительно считают count(*), а до кучи еще и создают вьюху, в которой они просто сортируют данные))))))
@@MyDeimonS Я, на всякий случай, поясню, что row_number не работает без предложения order by, и как делить/округлять вопрос второстепенный в этом смысле
Во всяком случае я такого не встречал)))
Чтобы задать порядковый номер - нужна сортировка
также решил, для чет нечет case when наложил. Но прикол в том, что не все сиквелы оконные поддерживают. Мы к сожалению на сасе работаем и там нет оконных и констракта with, я бы тоже долго возился, если б постгрю не повторил. А вообще не понятно, зачем на саентиста его спрашивать. Лучше б питон погоняли бы
а где анализ собеседования? Выводы интервьювера? Или анализ у него тоже всегда недоделаный? Флесс?
Расширим эту секцию, но нужен кандидат, который будет готов быть растерзанным на камеру
@@Fless @DataScienceGuy ?)
@@wadyn95 если его "растерзают" в шоу, как он потом видео снимать будет?
@@Fless поучаствует в новом шоу "на приеме у психотерапевта" :)
Правильное название - "Теория вероятностей"
Оба названия равнодопустимы в русском языке. Специально изучал года 3 назад, когда в ШАД шёл
скажите пожалуйста от этого собеса можна отталкиваться, и хоть приблизительно понять что тебя ждет?
Да, вполне можно. Но будет ещё несколько, тогда картина будет полнее
@@Fless спасибо
Ну у меня ни разу такого не было. Была либо полная жесть, когда у джунов олимпиадные задачи справшивают, или формулы с факториалами по теорверу, дебри типо индекса Джини, вывести формулу бэкпропагешена, либо же полный дет сад, когда на собесе одни манагеры и, если шаришь в бизнесе, можно как Остап нести чушь. Ни разу не видел такой золотой середины.
10:02 Все мы знаем о каком человеке идет речь)))
Валерий Бабушкин?)
@@ДаниилСоловьев-э6ш скорее всего
Идея классная, ждём продолжения! Но конкретно этот собес не о чём. Я ради интереса ставил на паузу и отвечал на каждый вопрос, в итоге я не ответил на вопрос про SQL(алгоритм я понятное дело придумал, но так как синтаксиса SQL я не знаю, ничего бы не написал), также ничего не написал про алгоритм кластеризации(ибо не решал задачи в этой области), и про А/В тестирование. Понятное дело, про опыт работы я бы тоже ничего не ответил. Ну и кажется, что если школьник отвечает на большую часть вопросов(где-то даже подробнее чем соискатель), а мне ещё до Джуна, как до луны, то это не уровень мидла.
P.S сори если где-то грамматические ошибки, математику я учил, а вот русский как-то не очень)))
Любимый Росбанк - глюкавое УГ. Есть большое желание уйти только из-за кривого ПО