Меня как-то отбраковали на этапе решения тестового задания, только за то, что в итоговом запросе к датафрейму, когда нужно было показать результат, написал для моего удобства запрос SQL (pandasql).
Если используете Jupyter, то всё ок. А если пишите в PyCharm, то получаете ошибку sqlalchemy.exc.ObjectNotExecutableError: Not an executable object:. Нужно либо переустановить старую версию SQLAlchemy командой терминала( pip install SQLAlchemy==1.4.17) и тогда всё заработает, или разбираться в документации SQLAlchemy 2.0 и переписывать строку запроса q="""SELECT ...""".
Меня смутило поле - дата совершения события. Я думал, что SQL-запрос будет мудренее. Действительно, Анатолий немного упростил ситуацию. И его SQL-запрос по-факту занижает конверсию в покупку. Человек может посмотреть ОДИН и ТОТ же товар трижды в течении дня и затем его купить. Наверное, в этом случае конверсия - 100% для данного товара. Но у Анатолия получится - 33%.
Тоже обратил внимание. По хорошему для воронки нужно считать количество уникальных сочетаний пользователь-товар. С другой стороны, зависит от задач: например, большое количество "холостых" просмотров одним пользователем одного товара жто тоже инсайт - может интерфейс не очень и т.д. В общем, смотря что мы хотим
Не факт что в базе есть данные с каждым днём. Значит нам нужна таблица с датами каждого дня и к ней уже присоединяем основные данные по дате. А в целом спасибо за пример
Сам забыл как сделать, твой совет помог вспомнить) А тебе надо добавить ! в начало будет "!pip install pandasql" ! нужен чтобы команды в консоль отправлять
В видео использую метод append, для объединения данных, метод устарел, начиная с версии Pandas 1.4.0 нужно использовать concat().
в анаконде pandas до сих пор 0.4 версии или какой там... так что это нормально )
Анатолий, это прекрасно. Делайте ещё, пожалуйста. Спасибо.
Спасибо, этот шорт-формат очень крутой! Да еще именно этот пример как раз в тему моей текущей рабочей задачи пришелся!
Спасибо, как раз недавно нужно было сгенерить датасет, но делал это на коленках. Теперь вижу как оптимизировать свою работу. Полезно!
Для начинающих очень полезно. Спасибо большое.
Высший пилотаж!
А для чего в функции generate_funel_actions при создании датафрейма передаётся параметр index = [0]?
Спасибо!
Бывают ситуации когда в пандас сложно выбрать данные. Например когда задача решается оконным функциями sql.
Есть метод transform в панде
Да, супер полезно, спасибо!
Меня как-то отбраковали на этапе решения тестового задания, только за то, что в итоговом запросе к датафрейму, когда нужно было показать результат, написал для моего удобства запрос SQL (pandasql).
Если используете Jupyter, то всё ок. А если пишите в PyCharm, то получаете ошибку sqlalchemy.exc.ObjectNotExecutableError: Not an executable object:.
Нужно либо переустановить старую версию SQLAlchemy командой терминала( pip install SQLAlchemy==1.4.17) и тогда всё заработает, или разбираться в документации SQLAlchemy 2.0 и переписывать строку запроса q="""SELECT ...""".
Видео отличное. Единственное, не мог оторваться от опечатки в слове funnel, но это мелочь.
Меня смутило поле - дата совершения события. Я думал, что SQL-запрос будет мудренее. Действительно, Анатолий немного упростил ситуацию. И его SQL-запрос по-факту занижает конверсию в покупку. Человек может посмотреть ОДИН и ТОТ же товар трижды в течении дня и затем его купить. Наверное, в этом случае конверсия - 100% для данного товара. Но у Анатолия получится - 33%.
Тоже обратил внимание. По хорошему для воронки нужно считать количество уникальных сочетаний пользователь-товар. С другой стороны, зависит от задач: например, большое количество "холостых" просмотров одним пользователем одного товара жто тоже инсайт - может интерфейс не очень и т.д. В общем, смотря что мы хотим
Абсолютно согласен, в таком случае сначала нужно взять только уникальные пары. Но в видео действительно рассмотрел самый простой вариант.
Анатолий, большое спасибо за замечательный контент! Мы не придираемся )) это скорее критический подход аналитика )) Всё, как вы нас учите!
@@АндрейДемидов-й1я Все правильно)
sqlite3 почему не использовать?
Большое спасибо!
Круто, понравилось, спасибо!
круто!
Я ваш фанат, спасибо большое за видео))
Получается, через эту библиотеку и джойнить по неравенству можно?
Не факт что в базе есть данные с каждым днём. Значит нам нужна таблица с датами каждого дня и к ней уже присоединяем основные данные по дате. А в целом спасибо за пример
🔥
загрузил библиотеку pandasql через "pip install pandasql". Но когда импортирую, пишет:
No module named 'pandasql'
Сам забыл как сделать, твой совет помог вспомнить)
А тебе надо добавить ! в начало будет "!pip install pandasql"
! нужен чтобы команды в консоль отправлять
Кайф
Много лишних слов
Из песни слова не выкинешь.