[ТАЙМ ТЕГИ] 00:00:00 Привет Assa из @Все Работы Хороши 00:02:00 Введение 00:06:33 Как аналитика данных меняет мир 00:09:55 Про зарплаты, комнату для сна и PS-ку в офисе 00:11:05 Над какими задачами работают аналитики в Ситимобиле 00:14:35 Кого ищут в команду, какие навыки нужны 00:16:50 Собеседование дата-аналитика 00:17:10 Вопросы по резюме и опыт работы 00:30:10 Вопросы по SQL 00:47:06 Вопросы по статистике 00:50:33 Бизнес-кейсы 01:27:55 Общий фидбек интервьера 01:29:04 Заключение
Спасибо огромное, Флесс! Мне очень нравится твой канал и темы, про которые ты рассказываешь. Топовое интервью с топовыми людьми. Очень много для себя подчеркнул из твоих видео. На мой взгляд, твой канал очень недооценен и должен иметь просмотров не меньше Дудя, но к сожалению, людям нравится больше развлекательный контент. Желаю тебе удачи, не останавливаться и снимать полезный контент! Буду смотреть твой канал и развиваться дальше
Про "Парадокс Симпсона": в эконометрике этот эффект хорошо известен под названием эндогеность. Такое случается, когда, например, из модели упущен какой-нибудь значительный фактор, влияющий одновременно на treatment и outcome. На видео, от города зависит как вероятность попасть в группу А или В, так и outcome. По сути, treatment не является случайным относительно значительного фактора (города). Следовательно, делать вывод о зависимости outcome от treatment нельзя. Как с этим бороться: 1) Провести новый А/В тест с нормальной рандомизацией. Т.е. treatment не должен зависеть ни от одной переменной, влияющей на outcome. 2) Использовать adjustment formula для правильной оценки P(outcome|do(treatment)) = sum_{city} P(outcome|treatment, city) P(city)
1. Зовите на собесы джутов (количество откликов на вакансию джуна 50-100, поэтому просмотров должно быть больше; вас смотрят в основном джуны или те, кто планирует стать джуном) 2. верните маркерный стол
@@Fless И что же им делать? Наверное, всё таки, какой-то процент джунов всегда нужен, просто предложение превышает спрос. Соответственно конкурс выше, и собеседование становится ещё более важным. Вопросы сложнее, но всё равно в рамках джуниор компетенции должно оставаться.
Должно. Просто мы конкретно снимаем про то, что здесь и сейчас нужно Ситимобилу. Это в большей степени мидлы и синьоры. Как только придет компания и скажет - снимите собес джунов, то снимем
Конкретно этот пример парадокса Симпсона кажется можно решить дополнив данные сохранив проценты по регионам. Если умножить опрос по опции B в Москве на 3, и по опции A в МО тоже, например, на три, то группы будут намного ровнее. И если их сложить, то парадокса уже никакого не будет.
Честно говоря, не понял почему в задаче на статистику мы предположили, что дисперсия 2000, наверное в реальной задаче мы бы посчитали выборочную дисперсию, которая является случайной величиной. В результате мы бы получили распределение Стьюдента с 999 степенями свободы, и считали бы квантили уже для него
А кто-нибудь может пояснить? Как получилось, что при среднем 49000, дисперсии 2000 и выборке n=1000, 50000 поместились в доверительный интервал 95%? 49000 + 2.56*2000/n, или даже на кв. корень из n (как вроде-бы правильнее) явно меньше получается. Или это я жёстко затупил? Помогите пожалуйста, потому что я уже весь вечер перечитываю литературу и не могу найти в чём ошибаюсь. Спасибо большое!
Вы правы) В такой постановке 50000 в CI не залетает, даже если считать, что интервьюер ошибся и 2000 -- это стандартное отклонение, а не дисперсия. Для 95% CI при нормальности распределения статистики, кстати, должно стоять чиселко 1,96. Можно погуглить квантили нормального распределения и правило 3 и 5 сигм.
@@hechachi1997 Спасибо. Да, 1.96 само собой, и корень из 2000 не надо извлекать только, если бы это было стандартное отклонение. Вот как-то это и странно, что они оба такие, "да, понятно, что залетает в CI, очевидно же", я говорит "подсчитал тут примерно". Вот и думаю который день, как так получилось...
Прошел час с того момента, как кандидат вместо вычисления среднего числа действий на пользователя в день посчитал сумму действий для каждого пользователя... Интервьюер: кажется, кандидат плохо слушает задания
ситимобил решает задачи максимально эффективного перемещения людей?! Дыр-пром-строй-контора - вот уровень работы этой компашки. Агрегатор, который ни за что не несет ответственности. Агрегатор, который штрафует клиентов за свои же ошибки. Агрегатор, который не предоставляет обещанного - никаких 15 минут на подачу машины. Агрегатор, машину от которого можно прождать больше часа. Посредники, которые прячутся от людей, не предоставляют, по закону положенную инфу о поставщике услуг, никаких контактов с руководством - на плохо работающих работников вы можете направить жалобу только этим же самым работникам, а они ее рассмотрят. Посредники, которые не решают никаких конфликтных ситуаций с водителями, приезжающими через посредничество сити-рога-и-мобил-копыта контору. Нет, эту дохлую лошадь уже не реанимировать никакими рекламными роликами.
@@Fless бро, ну все по законам жанра: сначала горячий тейк, потом наброс и обещание все четко разложить по полочкам (которое традиционно не выполняется, но всем похей), а затем можешь уже и нудятину включать, без которой аналитики вроде тебя не могут, все-равно больше 10 минут никто не смотрит
@@Fless бро, я даже немного завидую твоему субъективному восприятию мира. Ну яж не помню уже, у меня (как и у более-менее всех) в день по 30к решений принимается, как все упомнить?
[ТАЙМ ТЕГИ]
00:00:00 Привет Assa из @Все Работы Хороши
00:02:00 Введение
00:06:33 Как аналитика данных меняет мир
00:09:55 Про зарплаты, комнату для сна и PS-ку в офисе
00:11:05 Над какими задачами работают аналитики в Ситимобиле
00:14:35 Кого ищут в команду, какие навыки нужны
00:16:50 Собеседование дата-аналитика
00:17:10 Вопросы по резюме и опыт работы
00:30:10 Вопросы по SQL
00:47:06 Вопросы по статистике
00:50:33 Бизнес-кейсы
01:27:55 Общий фидбек интервьера
01:29:04 Заключение
Респект интервьюеру и кандидату за выдержку! Очень интересный формат интервью на стыке тех и консалтинга
Спасибо огромное, Флесс! Мне очень нравится твой канал и темы, про которые ты рассказываешь. Топовое интервью с топовыми людьми. Очень много для себя подчеркнул из твоих видео. На мой взгляд, твой канал очень недооценен и должен иметь просмотров не меньше Дудя, но к сожалению, людям нравится больше развлекательный контент. Желаю тебе удачи, не останавливаться и снимать полезный контент! Буду смотреть твой канал и развиваться дальше
Спасибо!
Про "Парадокс Симпсона": в эконометрике этот эффект хорошо известен под названием эндогеность. Такое случается, когда, например, из модели упущен какой-нибудь значительный фактор, влияющий одновременно на treatment и outcome. На видео, от города зависит как вероятность попасть в группу А или В, так и outcome. По сути, treatment не является случайным относительно значительного фактора (города). Следовательно, делать вывод о зависимости outcome от treatment нельзя.
Как с этим бороться:
1) Провести новый А/В тест с нормальной рандомизацией. Т.е. treatment не должен зависеть ни от одной переменной, влияющей на outcome.
2) Использовать adjustment formula для правильной оценки P(outcome|do(treatment)) = sum_{city} P(outcome|treatment, city) P(city)
вы приняты )))
Выровнять данные или использовать веса при подсчёте можно.
Николай, добрый день! Напишите, пожалуйста, в Телеграм Алексею t.me/chernobrovov, если интересно пособеседоваться с Ситимобилом
Очень понравился видос, как раз сейчас на аналитика переучиваюсь с программиста)
А чем хуже быть прогером? Просто я сейчас аналитик и задумываюсь иногда про Java, аутсорс и вот это вот все)
сегодня как раз приглашение на вакансию прислали
Оч крутой формат новый!
1. Зовите на собесы джутов (количество откликов на вакансию джуна 50-100, поэтому просмотров должно быть больше; вас смотрят в основном джуны или те, кто планирует стать джуном)
2. верните маркерный стол
Только компаниям сейчас джуны не нужны
@@Fless И что же им делать? Наверное, всё таки, какой-то процент джунов всегда нужен, просто предложение превышает спрос. Соответственно конкурс выше, и собеседование становится ещё более важным. Вопросы сложнее, но всё равно в рамках джуниор компетенции должно оставаться.
Должно. Просто мы конкретно снимаем про то, что здесь и сейчас нужно Ситимобилу. Это в большей степени мидлы и синьоры. Как только придет компания и скажет - снимите собес джунов, то снимем
@@Fless так и надо говорить, что канал снимает грустные интеграции теперь
А какие были не грустные?
Белый фон режет глаза, из-за него нет ощущения пространства
А так всё ок, и кандидат держался уверенно
Конкретно этот пример парадокса Симпсона кажется можно решить дополнив данные сохранив проценты по регионам. Если умножить опрос по опции B в Москве на 3, и по опции A в МО тоже, например, на три, то группы будут намного ровнее. И если их сложить, то парадокса уже никакого не будет.
Контент уровня NEXT LVL!!!!
Твоими стараниями, Лёш =)
@@Fless общими !
Честно говоря, не понял почему в задаче на статистику мы предположили, что дисперсия 2000, наверное в реальной задаче мы бы посчитали выборочную дисперсию, которая является случайной величиной. В результате мы бы получили распределение Стьюдента с 999 степенями свободы, и считали бы квантили уже для него
были времена....
А кто-нибудь может пояснить? Как получилось, что при среднем 49000, дисперсии 2000 и выборке n=1000, 50000 поместились в доверительный интервал 95%? 49000 + 2.56*2000/n, или даже на кв. корень из n (как вроде-бы правильнее) явно меньше получается. Или это я жёстко затупил? Помогите пожалуйста, потому что я уже весь вечер перечитываю литературу и не могу найти в чём ошибаюсь. Спасибо большое!
Вы правы) В такой постановке 50000 в CI не залетает, даже если считать, что интервьюер ошибся и 2000 -- это стандартное отклонение, а не дисперсия. Для 95% CI при нормальности распределения статистики, кстати, должно стоять чиселко 1,96. Можно погуглить квантили нормального распределения и правило 3 и 5 сигм.
@@hechachi1997 Спасибо. Да, 1.96 само собой, и корень из 2000 не надо извлекать только, если бы это было стандартное отклонение. Вот как-то это и странно, что они оба такие, "да, понятно, что залетает в CI, очевидно же", я говорит "подсчитал тут примерно". Вот и думаю который день, как так получилось...
В части парадокса Симпсона - имелось ввиду перевешивание долей по вероятностям попадания в группу?
Похоже на то
А где коммент про структурное мышление которое на 16:40 ?
Спасибо за внимательность. Про это будет следующее видео. Сюда добавлю ссылку, когда выйдет
Какой-то очень слабый кандидат для такого богатого бекграунда, но возможно на таком грейде уже решают не хардскиллы, хз)
картинка на превью мягко говоря не очень)
Забавно, что в чате fless в телеге, наоборот, понравилась. Хотя обычно никто картинки не комментирует
@@Fless парадокс симпсона :D
Прошел час с того момента, как кандидат вместо вычисления среднего числа действий на пользователя в день посчитал сумму действий для каждого пользователя...
Интервьюер: кажется, кандидат плохо слушает задания
ну наверное он это думал все время а вставку на монтаже попозже сделали
ситимобил решает задачи максимально эффективного перемещения людей?! Дыр-пром-строй-контора - вот уровень работы этой компашки. Агрегатор, который ни за что не несет ответственности. Агрегатор, который штрафует клиентов за свои же ошибки. Агрегатор, который не предоставляет обещанного - никаких 15 минут на подачу машины. Агрегатор, машину от которого можно прождать больше часа. Посредники, которые прячутся от людей, не предоставляют, по закону положенную инфу о поставщике услуг, никаких контактов с руководством - на плохо работающих работников вы можете направить жалобу только этим же самым работникам, а они ее рассмотрят. Посредники, которые не решают никаких конфликтных ситуаций с водителями, приезжающими через посредничество сити-рога-и-мобил-копыта контору.
Нет, эту дохлую лошадь уже не реанимировать никакими рекламными роликами.
Да тут вроде не об этом ролик..)
ну это прям анфакабл контент, занудность over 9000
А какой интересный?
@@Fless бро, ну все по законам жанра: сначала горячий тейк, потом наброс и обещание все четко разложить по полочкам (которое традиционно не выполняется, но всем похей), а затем можешь уже и нудятину включать, без которой аналитики вроде тебя не могут, все-равно больше 10 минут никто не смотрит
Нудятина - это ты про рассказ про датасатанистов, офис с пской или сам собес чувака?
@@Fless бро, я даже немного завидую твоему субъективному восприятию мира. Ну яж не помню уже, у меня (как и у более-менее всех) в день по 30к решений принимается, как все упомнить?