[UA] Тестова співбесіда Junior Data Analyst: логіка, SQL, Google Sheet, метрики й ідеї для АВ-тестів

แชร์
ฝัง
  • เผยแพร่เมื่อ 14 มิ.ย. 2024
  • Таймкоди відео:
    00:00:00 Знайомство з кандидатом.
    00:01:00 Задача зі зміною системи часу.
    00:08:46 Задача про студентів і їхнє тестування язиковим депресором.
    00:25:24 Налаштування датасету для SQL-задач.
    00:29:48 SQL-задача №1: топ-5 артистів з найбільшою кількістю хітів на Spotify.
    00:36:01 SQL-задача №2: топ-3 хіти, які записані дуетом.
    00:49:22 SQL-задача №3: три виконавці, які мають найбільшу кількість років з хітами.
    00:51:17 SQL-задача №4: чи правда те, що чим більше артистів у пісні, тим більше буде прослуховувань?
    01:01:09 SQL-задача №5: чи є у цьому датасеті пісні з однаковими назвами, але різними музикантами?
    01:08:53 Налаштування датасету для роботи в Google Sheets.
    01:13:50 Розбивка хітів Spotify по рокам та місяцям.
    01:21:45 Розрахунок mde для гіпотетичного АВ-тесту.
    01:30:24 Метрики та ідеї АВ-тестів для продукту анімації з фото улюбленця.
    01:50:42 Питання від менті опісля тестової співбесіди.
    02:03:19 Закінчення зустрічі.
    ________________________________________________
    Датасет, який використовуємо у цій співбесіді: www.kaggle.com/datasets/nelgi...
    _________________________________________________
    Lenny's Podcast: www.youtube.com/@LennysPodcas...
    Українські продуктові подкасти, які слухаю:
    1. Product Market Fat (open.spotify.com/show/45K1oQT....
    2. Startups are hard (open.spotify.com/show/2lnCQcC....
    3. Іван Алцибєєв (www.youtube.com/@ivan-altsybi....
    4. УкрПродКаст (www.youtube.com/@UkrProdCast/....
    5. Продуктовий ринок (www.youtube.com/@product_ryno....
    ________________________________________________________________
    Мене звати Роман Повзик. Я допомагаю початківцям в аналітиці даних збільшити свої шанси отримати офер.
    Якщо хочеш почати кар'єру в аналітиці даних, то напиши мені в LinkedIn і поговоримо: / romanpovzyk .
    ________________________________________________________________
    Посилання, які даю до ознайомлення до зустрічі:
    1. • Как свитчеру сформиров... - тут для GoIT розповідаю, як я переходив у роботу з даними з проєктного менеджменту і підходи, які використовував і досі юзаю для самонавчання.
    2. • е7: СТАРТ В АНАЛІТИЦІ ... - тут стрім про старт в аналітиці даних.
    3. gamedev.dou.ua/articles/produ... - тут загалом описав суть професії, якою займаюся.
    4. dou.ua/forums/topic/40265/ - база знань для початківців в аналітиці. Ресурси, які раджу для навчання.
    5. dou.ua/forums/topic/40959/ - як проходить робочий тиждень аналітика даних в ІТ.
    6. dou.ua/forums/topic/43889/ - тут про пет-проєкти, навіщо потрібні та якими можуть бути.
    7. th-cam.com/users/playlist?list... тут приклади технічних співбесід в аналітиці даних.
    8. dou.ua/forums/topic/44769/ - 250+ питань на співбесіді для початківця-аналітика.

ความคิดเห็น • 46

  • @ethanblackthorn3533
    @ethanblackthorn3533 หลายเดือนก่อน +1

    Дивився це відео по фрагментам (задачі на логіку, SQL, метрики + A/B тести) протягом певного часу, і, як завжди, дякую за відео!

    • @romanpovzyk
      @romanpovzyk  หลายเดือนก่อน +1

      Дякую вам, що дивитеся.
      Ну я і не розраховую, що хтось такі співбесіди за один раз гляне 😊

  • @and1roman
    @and1roman 18 วันที่ผ่านมา +2

    Задачку про години задавали на співбесіді в Ajax Systems зовсім недавно. Тому цілком практична задача)

    • @romanpovzyk
      @romanpovzyk  17 วันที่ผ่านมา

      О, клас, приємно чути, що подібні задачі на розігрів дають на справжніх співбесідах.

  • @RainbowCrewPeople
    @RainbowCrewPeople 2 หลายเดือนก่อน +6

    подивився перше завдання, вийшло так:
    675 (час в хвилинах у них) - 2000 (хвилин у них)
    x (час в хвилинах у нас) - 1440 (хвилин у нас)
    x = 486
    486/60= 8.1 (0.1 від нашої години = 6 хв) = 8 година 6 хв

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน +1

      Так, цілком логічний хід думок та рішення.

  • @Oleksii_Haivoronskyi1301
    @Oleksii_Haivoronskyi1301 หลายเดือนก่อน +1

    Як завжди цікаво і корисно. Дякую!

    • @romanpovzyk
      @romanpovzyk  หลายเดือนก่อน +1

      Дякую за перегляд) Радий, що вам сподобалося і допоможе у підготовці до подібних співбесід.

  • @vladislavzabrovsky773
    @vladislavzabrovsky773 2 หลายเดือนก่อน +3

    Теорема Баєса імба, дякую за цікаве відео!

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน +1

      Ага, якраз знайшов цей приклад у статті, де її пояснювали.

  • @user-sr5ts2jz7e
    @user-sr5ts2jz7e 2 หลายเดือนก่อน +3

    Крутые задачи

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน

      Дякую, приємно чути.
      Стараюся приділяти їх пошуку принаймні дві години щоразу. Заодно і для себе дізнаюся цікаві речі (як у випадку з датасетом Spotify).

  • @vadimlp77
    @vadimlp77 2 หลายเดือนก่อน +6

    Я б зразу перевів у хвилини. Тоді все просто. 675/1000*12=8.1=8 годин 6 хвилин

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน +3

      Так, на те вона і задачка для розігріву 🙂

  • @user-nl7hm9co3i
    @user-nl7hm9co3i 2 หลายเดือนก่อน +1

    Романе, а курс статистики від Стенфордського університету можна буде переглядати ще раз після його терміну завершення?

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน

      А що мається на увазі під завершенням терміну? Завершення терміну фінансової допомоги для його проходження на півроку чи дедлайн курсу, який пишеться, щоб вас мотивувати?

    • @user-nl7hm9co3i
      @user-nl7hm9co3i 2 หลายเดือนก่อน

      @@romanpovzyk Скрош за все саме просто термін проходження. Бо я цей курс вже майже завершив.
      Але ж рано чи пізно має завершитися дедлайн проходження. Тому хотів запитати, чи можна після цього терміну скористатися ним?
      А коли завершиться термін фінансової допомоги, то потрібно буде знову оплатити?

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน

      @@user-nl7hm9co3i Не перевіряв, але думаю, що опісля можна просто попрохати її ще раз і отримати курс ще на півроку. Перевірте і відпишете, чи вийшло.

  • @DanCh3n
    @DanCh3n 2 หลายเดือนก่อน +2

    6:75 ранку це хіба не 675 хвилин, адже ніде не вказано, що тут хвилини відрізняються від звичайних? Таким чином від початку дня пройшло 675. Для нашого часу 675/60 = 11.25

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน +1

      Ця країна знаходиться на Землі - у нашому з вами Всесвіті. Наші півдня тривають 12 годин, у цій країні 10 «інших» годин - але це все одно має бути однаковий проміжок за тривалістю. Тому наша хвилина і ця «інша» хвилина все ж відрізняються.

  • @aleksandra8579
    @aleksandra8579 2 หลายเดือนก่อน +3

    Почему нет вопросов по презентации выводов анализа стейкхолдерам, мне кажется это крайне важный навык, важнее чем аб тесты, ведь не каждый дата аналитик это продуктовый аналитик

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน +1

      Врахую і спробую додати далі.
      Серед тих вакансій, на вимоги яких я орієнтуюся при підготовці питань, чи не у кожній є вимоги щодо AB-тестів. Тому і включаю це питання.

  • @andrii_barannyk
    @andrii_barannyk 2 หลายเดือนก่อน +1

    можливо дурне запитання, але не зрозумів трохи 2 задачку. Я собі сам поза відео так і розбив на 4 катеогрії студентів, відповідно отримав, що за 100 ч - 20 є хворі, і лише в 18 з них буде чорний язик. Відповідно виходить, що частка хворих з чорним язиком зі 100 ч буде 18, тобто ймовірність що наш клієнт, дійсно хворий і є 18%. Навіщо ще додаткове перемножання? Що я пропустив?

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน

      Питання не дурне.
      Ви пропустили, що те, що язик буде чорний - ще не означає, що людина хвора. Бо 80 * 0.3 = 24 людини будуть у такій ситуації, але здорові.
      Варто шукати відсоток хворих не серед всіх, а серед тих, хто з чорним язиком: 18 / 24.

    • @andrii_barannyk
      @andrii_barannyk 2 หลายเดือนก่อน +1

      @@romanpovzyk Дякую. Зрозумів. Та далі та ж сама пропорція: х (частка хворих із загальної суми чорних язиків) = 18 * 100 / 42 = 43%

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน

      Так, якщо далі таким чином рахувати, то все правильно. Радий, що зрозуміло пояснив. Коли це візуально зобразити зі стрілками, то стає очевидно 😊

    • @maxim_maximovych
      @maxim_maximovych 2 หลายเดือนก่อน

      @@romanpovzyk класична задача на формулу Баєса) а якщо я знаю як розв'язувати всі ці задачі є шанс потрапити на позицію Junior Data Analyst'а? Чи цього буде замало?

  • @user-tf1hb8tk8c
    @user-tf1hb8tk8c 2 หลายเดือนก่อน +1

    Рiшення. Якщо iнша краiна перейшла на другий час, то скiльки там часу, то iх cобаче дiло, ще i Китайську стiну треба з ними збудувати)

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน

      Складно з таким підходом працювати з продуктом на міжнародних ринках 🙂 Треба таки адаптуватися.

  • @serhiihulko9137
    @serhiihulko9137 2 หลายเดือนก่อน +4

    дивують люди які налетіли в коменти і почали кучеряво "гнати дешеві понти". треба віддати належне Володимиру що не посоромився дати добро на опублікування відео. і до слова, фінанси не так вже й далеко від дата аналітики (особливо від продуктової).

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน

      Два негативних коментарі - це не «налетіли». Звісно, у комфортній атмосфері, маючи скільки завгодно часу та за відсутності відеозапису, набагато легше щось вирішувати.
      Так, Володимир - молодець. Аналітиків-початківців багато, але останніми місяцями лише одна людина на місяць наважується на подібну публічну спробу перевірити себе.

  • @revini78
    @revini78 2 หลายเดือนก่อน +1

    через силу додивився задачі sql. Автор каналу, роби краще - просто мовчи і не підсказуй, тоді побачиш всю ширину "глибин"

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน +2

      Я ж не професійний інтерв'юер.
      Мені все ж цікаво взаємодіяти з кандидатом, щоб розуміти хід думок. А не просто мовчки дивитися як вирішуються задачі.
      Ну і завдання тут - не завалити людину, а разом пройти задумані завдання.

    • @aleksandra8579
      @aleksandra8579 2 หลายเดือนก่อน

      @@romanpovzykможна одразу попросити кандидата коментувати свої дії, а то він там щось мовчки робить незрозуміло що

  • @revini78
    @revini78 2 หลายเดือนก่อน +2

    кров з очей. чи деградація освіти, чи гаджети, чи занадто багато різних "непотрібних" навичок, але аналітик який півгодини рішає просту ймовірнісну задачу про студентів то вже перебор. задачка рішаеться рівно одну хвилину з олівцем. далі дивитися просто вже не варто.

    • @romanpovzyk
      @romanpovzyk  2 หลายเดือนก่อน +11

      Ви вирішили її у комфортному середовищі, без поспіху й стресу. Коли це вечір, пишеться відео і воно буде викладено на Ютуб, ви не бачите співбесідника, а тільки чуєте голос (під час шерингу екрану), то це все ж впливає на хід думок.
      За останні 5 місяців тільки п'ятеро аналітиків наважилося на таку перевірку себе. Всі вони молодці і я радий, що вдалося поспілкуватися з ними годину-другу.

    • @aleksandra8579
      @aleksandra8579 2 หลายเดือนก่อน +3

      Ви ймовірно щовечора на літкоді тусуєтесь, пан весь в білому

  • @nikitashashenok5881
    @nikitashashenok5881 2 หลายเดือนก่อน +2

    5 задачу можна зробити через селф джойн:
    SELECT
    sp.[track_name],
    sp_new.[track_name],
    sp.[artist(s)_name],
    sp_new.[artist(s)_name]
    FROM spotify2023 sp
    INNER JOIN spotify2023 sp_new ON sp_new.[track_name] = sp.[track_name]
    AND sp_new.[artist(s)_name] != sp.[artist(s)_name];

    • @financialanalyst4984
      @financialanalyst4984 2 หลายเดือนก่อน +2

      думка правильна але реалізація ні. ось так коректно.
      select
      a.track_name,
      count(1) as cnt
      from spotify_2023 a
      join spotify_2023 b
      on a.track_name = b.track_name
      and a.artist_s_name b.artist_s_name
      group by a.track_name