[UA] Тестова співбесіда Junior Data Analyst: логіка, SQL, Google Sheet, метрики й ідеї для АВ-тестів
ฝัง
- เผยแพร่เมื่อ 14 มิ.ย. 2024
- Таймкоди відео:
00:00:00 Знайомство з кандидатом.
00:01:00 Задача зі зміною системи часу.
00:08:46 Задача про студентів і їхнє тестування язиковим депресором.
00:25:24 Налаштування датасету для SQL-задач.
00:29:48 SQL-задача №1: топ-5 артистів з найбільшою кількістю хітів на Spotify.
00:36:01 SQL-задача №2: топ-3 хіти, які записані дуетом.
00:49:22 SQL-задача №3: три виконавці, які мають найбільшу кількість років з хітами.
00:51:17 SQL-задача №4: чи правда те, що чим більше артистів у пісні, тим більше буде прослуховувань?
01:01:09 SQL-задача №5: чи є у цьому датасеті пісні з однаковими назвами, але різними музикантами?
01:08:53 Налаштування датасету для роботи в Google Sheets.
01:13:50 Розбивка хітів Spotify по рокам та місяцям.
01:21:45 Розрахунок mde для гіпотетичного АВ-тесту.
01:30:24 Метрики та ідеї АВ-тестів для продукту анімації з фото улюбленця.
01:50:42 Питання від менті опісля тестової співбесіди.
02:03:19 Закінчення зустрічі.
________________________________________________
Датасет, який використовуємо у цій співбесіді: www.kaggle.com/datasets/nelgi...
_________________________________________________
Lenny's Podcast: www.youtube.com/@LennysPodcas...
Українські продуктові подкасти, які слухаю:
1. Product Market Fat (open.spotify.com/show/45K1oQT....
2. Startups are hard (open.spotify.com/show/2lnCQcC....
3. Іван Алцибєєв (www.youtube.com/@ivan-altsybi....
4. УкрПродКаст (www.youtube.com/@UkrProdCast/....
5. Продуктовий ринок (www.youtube.com/@product_ryno....
________________________________________________________________
Мене звати Роман Повзик. Я допомагаю початківцям в аналітиці даних збільшити свої шанси отримати офер.
Якщо хочеш почати кар'єру в аналітиці даних, то напиши мені в LinkedIn і поговоримо: / romanpovzyk .
________________________________________________________________
Посилання, які даю до ознайомлення до зустрічі:
1. • Как свитчеру сформиров... - тут для GoIT розповідаю, як я переходив у роботу з даними з проєктного менеджменту і підходи, які використовував і досі юзаю для самонавчання.
2. • е7: СТАРТ В АНАЛІТИЦІ ... - тут стрім про старт в аналітиці даних.
3. gamedev.dou.ua/articles/produ... - тут загалом описав суть професії, якою займаюся.
4. dou.ua/forums/topic/40265/ - база знань для початківців в аналітиці. Ресурси, які раджу для навчання.
5. dou.ua/forums/topic/40959/ - як проходить робочий тиждень аналітика даних в ІТ.
6. dou.ua/forums/topic/43889/ - тут про пет-проєкти, навіщо потрібні та якими можуть бути.
7. th-cam.com/users/playlist?list... тут приклади технічних співбесід в аналітиці даних.
8. dou.ua/forums/topic/44769/ - 250+ питань на співбесіді для початківця-аналітика.
Дивився це відео по фрагментам (задачі на логіку, SQL, метрики + A/B тести) протягом певного часу, і, як завжди, дякую за відео!
Дякую вам, що дивитеся.
Ну я і не розраховую, що хтось такі співбесіди за один раз гляне 😊
Задачку про години задавали на співбесіді в Ajax Systems зовсім недавно. Тому цілком практична задача)
О, клас, приємно чути, що подібні задачі на розігрів дають на справжніх співбесідах.
подивився перше завдання, вийшло так:
675 (час в хвилинах у них) - 2000 (хвилин у них)
x (час в хвилинах у нас) - 1440 (хвилин у нас)
x = 486
486/60= 8.1 (0.1 від нашої години = 6 хв) = 8 година 6 хв
Так, цілком логічний хід думок та рішення.
Як завжди цікаво і корисно. Дякую!
Дякую за перегляд) Радий, що вам сподобалося і допоможе у підготовці до подібних співбесід.
Теорема Баєса імба, дякую за цікаве відео!
Ага, якраз знайшов цей приклад у статті, де її пояснювали.
Крутые задачи
Дякую, приємно чути.
Стараюся приділяти їх пошуку принаймні дві години щоразу. Заодно і для себе дізнаюся цікаві речі (як у випадку з датасетом Spotify).
Я б зразу перевів у хвилини. Тоді все просто. 675/1000*12=8.1=8 годин 6 хвилин
Так, на те вона і задачка для розігріву 🙂
Романе, а курс статистики від Стенфордського університету можна буде переглядати ще раз після його терміну завершення?
А що мається на увазі під завершенням терміну? Завершення терміну фінансової допомоги для його проходження на півроку чи дедлайн курсу, який пишеться, щоб вас мотивувати?
@@romanpovzyk Скрош за все саме просто термін проходження. Бо я цей курс вже майже завершив.
Але ж рано чи пізно має завершитися дедлайн проходження. Тому хотів запитати, чи можна після цього терміну скористатися ним?
А коли завершиться термін фінансової допомоги, то потрібно буде знову оплатити?
@@user-nl7hm9co3i Не перевіряв, але думаю, що опісля можна просто попрохати її ще раз і отримати курс ще на півроку. Перевірте і відпишете, чи вийшло.
6:75 ранку це хіба не 675 хвилин, адже ніде не вказано, що тут хвилини відрізняються від звичайних? Таким чином від початку дня пройшло 675. Для нашого часу 675/60 = 11.25
Ця країна знаходиться на Землі - у нашому з вами Всесвіті. Наші півдня тривають 12 годин, у цій країні 10 «інших» годин - але це все одно має бути однаковий проміжок за тривалістю. Тому наша хвилина і ця «інша» хвилина все ж відрізняються.
Почему нет вопросов по презентации выводов анализа стейкхолдерам, мне кажется это крайне важный навык, важнее чем аб тесты, ведь не каждый дата аналитик это продуктовый аналитик
Врахую і спробую додати далі.
Серед тих вакансій, на вимоги яких я орієнтуюся при підготовці питань, чи не у кожній є вимоги щодо AB-тестів. Тому і включаю це питання.
можливо дурне запитання, але не зрозумів трохи 2 задачку. Я собі сам поза відео так і розбив на 4 катеогрії студентів, відповідно отримав, що за 100 ч - 20 є хворі, і лише в 18 з них буде чорний язик. Відповідно виходить, що частка хворих з чорним язиком зі 100 ч буде 18, тобто ймовірність що наш клієнт, дійсно хворий і є 18%. Навіщо ще додаткове перемножання? Що я пропустив?
Питання не дурне.
Ви пропустили, що те, що язик буде чорний - ще не означає, що людина хвора. Бо 80 * 0.3 = 24 людини будуть у такій ситуації, але здорові.
Варто шукати відсоток хворих не серед всіх, а серед тих, хто з чорним язиком: 18 / 24.
@@romanpovzyk Дякую. Зрозумів. Та далі та ж сама пропорція: х (частка хворих із загальної суми чорних язиків) = 18 * 100 / 42 = 43%
Так, якщо далі таким чином рахувати, то все правильно. Радий, що зрозуміло пояснив. Коли це візуально зобразити зі стрілками, то стає очевидно 😊
@@romanpovzyk класична задача на формулу Баєса) а якщо я знаю як розв'язувати всі ці задачі є шанс потрапити на позицію Junior Data Analyst'а? Чи цього буде замало?
Рiшення. Якщо iнша краiна перейшла на другий час, то скiльки там часу, то iх cобаче дiло, ще i Китайську стiну треба з ними збудувати)
Складно з таким підходом працювати з продуктом на міжнародних ринках 🙂 Треба таки адаптуватися.
дивують люди які налетіли в коменти і почали кучеряво "гнати дешеві понти". треба віддати належне Володимиру що не посоромився дати добро на опублікування відео. і до слова, фінанси не так вже й далеко від дата аналітики (особливо від продуктової).
Два негативних коментарі - це не «налетіли». Звісно, у комфортній атмосфері, маючи скільки завгодно часу та за відсутності відеозапису, набагато легше щось вирішувати.
Так, Володимир - молодець. Аналітиків-початківців багато, але останніми місяцями лише одна людина на місяць наважується на подібну публічну спробу перевірити себе.
через силу додивився задачі sql. Автор каналу, роби краще - просто мовчи і не підсказуй, тоді побачиш всю ширину "глибин"
Я ж не професійний інтерв'юер.
Мені все ж цікаво взаємодіяти з кандидатом, щоб розуміти хід думок. А не просто мовчки дивитися як вирішуються задачі.
Ну і завдання тут - не завалити людину, а разом пройти задумані завдання.
@@romanpovzykможна одразу попросити кандидата коментувати свої дії, а то він там щось мовчки робить незрозуміло що
кров з очей. чи деградація освіти, чи гаджети, чи занадто багато різних "непотрібних" навичок, але аналітик який півгодини рішає просту ймовірнісну задачу про студентів то вже перебор. задачка рішаеться рівно одну хвилину з олівцем. далі дивитися просто вже не варто.
Ви вирішили її у комфортному середовищі, без поспіху й стресу. Коли це вечір, пишеться відео і воно буде викладено на Ютуб, ви не бачите співбесідника, а тільки чуєте голос (під час шерингу екрану), то це все ж впливає на хід думок.
За останні 5 місяців тільки п'ятеро аналітиків наважилося на таку перевірку себе. Всі вони молодці і я радий, що вдалося поспілкуватися з ними годину-другу.
Ви ймовірно щовечора на літкоді тусуєтесь, пан весь в білому
5 задачу можна зробити через селф джойн:
SELECT
sp.[track_name],
sp_new.[track_name],
sp.[artist(s)_name],
sp_new.[artist(s)_name]
FROM spotify2023 sp
INNER JOIN spotify2023 sp_new ON sp_new.[track_name] = sp.[track_name]
AND sp_new.[artist(s)_name] != sp.[artist(s)_name];
думка правильна але реалізація ні. ось так коректно.
select
a.track_name,
count(1) as cnt
from spotify_2023 a
join spotify_2023 b
on a.track_name = b.track_name
and a.artist_s_name b.artist_s_name
group by a.track_name