Алексей Ротмистров
Алексей Ротмистров
  • 532
  • 344 724

วีดีโอ

Все характеристики всех конкурсов фрилансеров. Видео 4
มุมมอง 7272 ปีที่แล้ว
#python #regularexpression PlayList th-cam.com/play/PLa8lq3EibqqQhEIpDECO-V4TfjPZO1o35.html 0:00 В этом видео: новый код для сбора промо-характеристик всех конкурсов и код из прошлых видео плейлиста, применяемый не к одному конкурсу. а ко всем. 1:15 Обзор скрипта: выяснить число страниц списка конкурсов, выгрузить с этих страниц промо-характеристики и их URL-адреса, записать в новый датафрейм с...
Основы regular expression, а также requests и bs4. Видео 3
มุมมอง 5942 ปีที่แล้ว
#python #regularexpression PlayList th-cam.com/play/PLa8lq3EibqqQhEIpDECO-V4TfjPZO1o35.html 0:00 Предыстория. 0:30 Репутационные характеристики заказчика конкурса. 0:45 Страницы заказчиков гораздо менее стандартизированны. Поэтому потребуется не только пакет bs4, но и пакет regular expression. 2:40 Обзор структуры скрипта. 3:15 Конструкция in . 5:25 Сочетание пакетов bs4 и regular expression дл...
Основы requests и bs4. Схема парсинга. Видео 2
มุมมอง 6942 ปีที่แล้ว
PlayList th-cam.com/play/PLa8lq3EibqqQhEIpDECO-V4TfjPZO1o35.html 0:00 Предыдущее видео см. в плейлисте. 0:15 Открыть таблицу, ранее сохранённую в формате экселевского файла, в формате датафрейма. 1:15 Атрибутом .index достать наименования строк таблицы. 2:15 Указать, что наименования строк (индекс датафрейма) содержатся в нулевом столбце открываемой таблицы. 2:45 Поскольку путь не указан, файл ...
Основы requests и bs4 за 44 минуты. Видео 1
มุมมอง 1.1K2 ปีที่แล้ว
Praylist th-cam.com/play/PLa8lq3EibqqQhEIpDECO-V4TfjPZO1o35.html 0:00 Содержательная задача: выгрузить с сайта FL.ru информацию о конкурсах для фрилансеров и о реакции фрилансеров на них, чтобы впоследствии выяснить детерминанты (не)популярности конкурсов. 0:30 Архитектура веб-источника: 3 раздела сайта FL.ru . 1:05 Интересующие переменные. 3:15 Архитектура скриптов. 3:30 Упоминание реляционных...
selenium на Python за 25 минут: автоматизированная выгрузка FinAM
มุมมอง 4732 ปีที่แล้ว
0:00 Содержание задачи: есть таблица с 50-ю наименованиями фьючерсов Московской биржи. Требуется выгрузить с сайта finam.ru статистику дневной торговли этими фьючерсами. 1:35 Варианты решения: вручную (долго и чревато ошибками), посредством API веб-источника, 4:50 посредством пакета requests (у каждого инструмента собственный числовой идентификатор, который меняется каждый квартал и который над...
Мультиномиальная регрессия. Кейс IMDb 2 Интерпретация модели
มุมมอง 5132 ปีที่แล้ว
0:00 Теоретические основы мультиномиальной регрессии: две ступени расчёта зависимой переменной; бинарная зависимая переменная и логит (серия th-cam.com/video/3LQ_O6HIOWs/w-d-xo.html ) и линейный многочлен. 1:00 Референтная категория игрека. Вероятность каждой категории игрека противопоставляется вероятности его референтной категории (в моём примере это Y=0). 1:35 Система уравнений. 2:00 Упрощен...
Машинное обучение с учителем помогает разметить тексты
มุมมอง 9173 ปีที่แล้ว
00:00 Для чего размечать тексты с привлечением машинного обучения с учителем? Может пригодиться для решения задачи выявить среди собранных документов нерелевантные и выявить сентимент (эмоциональную нагрузку) собранных документов. 01:50 Достать матрицы (1) "документы-токены" и (2) с разметкой. Если документы размечались по топикам, то проверить наличие противоречий в разметке, поскольку один и ...
Мультиномиальная регрессия. Кейс IMDb 1 Построение модели
มุมมอง 1.2K3 ปีที่แล้ว
0:00 Содержательная цель: как в серии th-cam.com/video/3LQ_O6HIOWs/w-d-xo.html , но теперь у игрека три градации: отсутствие у фильма рейтинга критиков (Y=0), наличие низкого рейтинга (Y=1) или высокого рейтинга (Y=2). Таким образом, цель - выявить, как вероятность каждой из этих градаций зависит от других характеристик фильма. 1:50 Обоснование выбора метода. 2:10 Описание иксов: тип шкалы, рас...
Раздельный сбор. Пробное тематическое моделирование, или topic modeling
มุมมอง 1.3K3 ปีที่แล้ว
2:00 Обзор методов topic modeling и их место среди задач text mining. Методы: Probabilistic Latent Semantic Analysis (PLSA), Latent Dirichlet Allocation (LDA), Additive regularization topic model (ARTM), RANDAN. Проблемы и решения = эволюция методов topic modeling. Что такое математически оптимальная и содержательно интерпретируемая тематическая модель и как её получить? И что такое плохая моде...
Как начать текст-майнинг?
มุมมอง 1.4K3 ปีที่แล้ว
0:00 Широкое и узкое понимание термина text mining. 0:35 Задачи «интеллектуального анализа» текстов, или text mining: 1. Выявить среди собранных документов (текстов) наполненные и для них - высокочастотные токены. 2. Выявить среди собранных документов нерелевантные. 3. Выявить во множестве документов обозримое число интерпретируемых топиков (тем). 4. Выявить сентимент (эмоциональную нагрузку) с...
API YouTube. Семь тысяч комментариев за четыре минуты
มุมมอง 1.4K3 ปีที่แล้ว
The playlist: th-cam.com/play/PLa8lq3EibqqTQQ2JQm8ik5P7gljnw27L4.html 0:00 Родительские (topLevel) комментарии и ответы на них. 0:45 Комментарии можно копипастить из-под видео, можно воспользоваться API Explorer - интерфейс для разработчиков (и исследователей) developers.google.com , а можно сгенерировать код в API Explorer и применить его в Python. 1:40 Требуются методы comments и commentThrea...
Эффективно программировать на Python в Jupyter Notebook
มุมมอง 1.5K3 ปีที่แล้ว
0:00 Anaconda и Google Colaboratory. 0:30 anaconda.com . Выбор версии под операционную систему. 1:10 Как узнать версию операционной системы Windows? 1:35 Установка Anaconda & Jupyter: установка дистрибутива, его запуск, следование инструкциям. 2:55 Запуск Jupyter Notebook. Оперирование Джупитером через вкладку браузера. 3:40 Адрес хранения папок Джупитера. 4:30 Создание нового джупитеровского ф...
Раздельный сбор 15 Парная связь интервальной и номинальной переменных
มุมมอง 1.4K3 ปีที่แล้ว
The playlist: th-cam.com/play/PLa8lq3EibqqTQQ2JQm8ik5P7gljnw27L4.html 0:00 Методы и команды Python, задействованные в этом видео. 0:50 Загрузить таблицу с характеристиками видео categoryName Involvement (получены и выведены в прошлых видео). 1:20 Выяснить, есть ли связь между categoryName (номинальная переменная) и Involvement (интервальная переменная). 2:10 Какие методы можно применять для изм...
API YouTube Раздельный сбор 11 Категории видео методом videoCategories БЕЗ программирования и С
มุมมอง 1.3K3 ปีที่แล้ว
The playlist: th-cam.com/play/PLa8lq3EibqqTQQ2JQm8ik5P7gljnw27L4.html 0:00 Что за числа в столбце categoryId? 1:10 Интерфейс для разработчиков (и исследователей) developers.google.com/ . Понадобится метод videoCategories и файлы с найденными ранее методом videos id категорий видео. 2:25 Аргументы и их значения: аргументы part со значением snippet и id. 3:25 Запуск; код 200. 3:55 Готовый код на ...
Раздельный сбор 14 Парная связь интервальных переменных
มุมมอง 1.4K3 ปีที่แล้ว
Раздельный сбор 14 Парная связь интервальных переменных
Раздельный сбор 13 Описательная статистика номинальной переменной
มุมมอง 1.4K3 ปีที่แล้ว
Раздельный сбор 13 Описательная статистика номинальной переменной
Раздельный сбор 12 Описательная статистика интервальных переменных
มุมมอง 1.9K3 ปีที่แล้ว
Раздельный сбор 12 Описательная статистика интервальных переменных
API YouTube Раздельный сбор 10 Характеристики видео методом videos БЕЗ программирования и С
มุมมอง 1.4K4 ปีที่แล้ว
API TH-cam Раздельный сбор 10 Характеристики видео методом videos БЕЗ программирования и С
API YouTube Раздельный сбор 9 Характеристики каналов методом channels С программированием
มุมมอง 1.2K4 ปีที่แล้ว
API TH-cam Раздельный сбор 9 Характеристики каналов методом channels С программированием
Рейтинги фильмов от критиков и пользователей на IMDb 4 Влияет ли один на другой? Непараметрика
มุมมอง 6284 ปีที่แล้ว
Рейтинги фильмов от критиков и пользователей на IMDb 4 Влияет ли один на другой? Непараметрика
Рейтинги фильмов от критиков и пользователей на IMDb 3 Влияет ли один на другой? Параметрика
มุมมอง 8014 ปีที่แล้ว
Рейтинги фильмов от критиков и пользователей на IMDb 3 Влияет ли один на другой? Параметрика
Рейтинги фильмов от критиков и пользователей на IMDb 2 Сравнить рейтинги
มุมมอง 7924 ปีที่แล้ว
Рейтинги фильмов от критиков и пользователей на IMDb 2 Сравнить рейтинги
Рейтинги фильмов от критиков и пользователей на IMDb 1 Задача Тип шкалы Графики
มุมมอง 9424 ปีที่แล้ว
Рейтинги фильмов от критиков и пользователей на IMDb 1 Задача Тип шкалы Графики
API YouTube Раздельный сбор 8 Характеристики каналов методом channels БЕЗ программирования и С
มุมมอง 1.5K4 ปีที่แล้ว
API TH-cam Раздельный сбор 8 Характеристики каналов методом channels БЕЗ программирования и С
API YouTube Раздельный сбор 7 Собранный ранее скрипт для поиска видео
มุมมอง 1.5K4 ปีที่แล้ว
API TH-cam Раздельный сбор 7 Собранный ранее скрипт для поиска видео
API YouTube Раздельный сбор 6 Поиск каналов циклом while с учётом даты
มุมมอง 1.7K4 ปีที่แล้ว
API TH-cam Раздельный сбор 6 Поиск каналов циклом while с учётом даты
API YouTube Раздельный сбор 5 Сокращение запросов условной конструкцией if
มุมมอง 1.4K4 ปีที่แล้ว
API TH-cam Раздельный сбор 5 Сокращение запросов условной конструкцией if
API YouTube Раздельный сбор 4 Поиск каналов циклом for с пересортировкой
มุมมอง 1.5K4 ปีที่แล้ว
API TH-cam Раздельный сбор 4 Поиск каналов циклом for с пересортировкой
API YouTube Раздельный сбор 3 Поиск каналов циклом while посредством Python
มุมมอง 1.7K4 ปีที่แล้ว
API TH-cam Раздельный сбор 3 Поиск каналов циклом while посредством Python