Парсинг без программирования II. WebScraper

แชร์
ฝัง
  • เผยแพร่เมื่อ 27 ต.ค. 2024

ความคิดเห็น • 66

  • @Bogdan-fq9go
    @Bogdan-fq9go 9 หลายเดือนก่อน +3

    спасибо за ваш труд! как просили, просьба-совет по улчшению: пожалуйста немного помедленнее показывайте свои действия на компе. иногда тяжело понять, что вы сделали и приходится пересматривать на замедленном воспроизведении. А в принципе очень круто 👍

  • @sergeiss6236
    @sergeiss6236 2 ปีที่แล้ว +3

    спасибо за видео,
    не забывай ссылочку на видос добавлять в чат, что бы вовремя узнать о нем.
    очень жду урок про регулярку

    • @usota
      @usota  2 ปีที่แล้ว +1

      Спасибо, поделюсь) Про регулярки самому бы хорошо подучиться )

  • @helenali5107
    @helenali5107 7 หลายเดือนก่อน +1

    СПАСИБО. У Вас круто получается!! Продолжайте.

  • @МаратАрти
    @МаратАрти 2 ปีที่แล้ว +1

    Евгений, как всегда все супер. Узнал даже про некотрые моменты которые не знал. Будем пробывать!Благодарю!

    • @usota
      @usota  2 ปีที่แล้ว

      Спасибо 🙏

  • @Darya_lukina
    @Darya_lukina 2 ปีที่แล้ว +6

    Не нужно убирать лицо ☺️ интересно смотреть на человека который рассказывает такие интересные вещи. Кому не нравится, можете не смотреть, не нужно других этого лишать.

    • @55555qvazar
      @55555qvazar ปีที่แล้ว

      Да Бро!
      Человек раскрывается и делится полезным контентом.
      🤝

  • @andreyberdnikov600
    @andreyberdnikov600 8 หลายเดือนก่อน

    Спасибо за материал! Помог разобраться 🤝

  • @UtkaMF
    @UtkaMF 6 หลายเดือนก่อน

    Спасибо. Понял за первые несколько секунд с авито)

  • @McMaruhin
    @McMaruhin 2 ปีที่แล้ว +2

    С регулярными выражениями вообще круто)

  • @WrldsporteventsR.Y..V.1992
    @WrldsporteventsR.Y..V.1992 2 ปีที่แล้ว +1

    Очень актуально, спасибо!

  • @YaroGum-q6b
    @YaroGum-q6b 11 หลายเดือนก่อน

    Спасибо подпишусь.много интересного

  • @mrartivanov
    @mrartivanov 6 หลายเดือนก่อน +1

    Евгений, покажите пож-та, как заставить листать все страницы на 2гис? Как в третьем уроке (пагинация)

  • @berher7452
    @berher7452 5 หลายเดือนก่อน +1

    Поклон до земли. 20к сохранил. Как разбогатею - с меня донат )

  • @konstantin5908
    @konstantin5908 2 ปีที่แล้ว +1

    👍🔥🥃Круто, будем осваивать. Сейчас python на яндексе добиваю.

    • @usota
      @usota  2 ปีที่แล้ว

      Python - это уже следующий уровень 👍

  • @КуанышКайсенов
    @КуанышКайсенов 2 ปีที่แล้ว +2

    Спасибо за видео, очень познавательно! Главное у меня получилось запарсить данные с Крыши.кз. Последние два дня засел за ваши видео. Есть просьба, покажите как можно запарсить данные (с телефонами) с Хедхантера?

    • @usota
      @usota  2 ปีที่แล้ว +1

      Спасибо 🙏 По поводу парсинга HH в бесплатном доступе по-моему ограниченное количество резюме можно посмотреть. Поэтому парсинг этой площадки без лимитов бесплатно не доступен. Но у них можно купить доступ, правда и денег стоит немаленьких.

    • @cuancase1007
      @cuancase1007 2 ปีที่แล้ว

      @@usota Доступ есть, хотелось выгрузку в табличном виде для дальнейшего анализа

  • @mrartivanov
    @mrartivanov 6 หลายเดือนก่อน

    спасибо!

  • @arslan10696
    @arslan10696 3 หลายเดือนก่อน

    Добрый день! Не видит все отзывы на озоне. Приходится протыкивать все.

  • @elenavoinova1247
    @elenavoinova1247 ปีที่แล้ว +2

    Добрый день) Благодарю за видео) Скажите пожалуйста, после парсинга товаров и добавления на свой сайт, каким образом можно отслеживать изменение цен у поставщика и соответственно обновлять у себя? Спасибо)

    • @usota
      @usota  ปีที่แล้ว

      Спасибо 🙏 отслеживать можно вручную, делая разовый парсинг поставщика и сверяя, например, в экселе со своей выгрузкой с сайта. Такой способ подойдет, если цены обновляются редко. Если нужно обновление каждый день или чаще, то тут нужно писать скрипт для автоматического обновления. WebScraper для этого не подойдёт, к сожалению.

  • @LexGorod
    @LexGorod ปีที่แล้ว +1

    21:33 как минимум один пример, когда одинаковые данные в разных классах: фото (да и видео тоже) в инстаграме - они часто зарыты на разных уровнях. как минимум это зависит от того, одно или несоклько изображений в посте, но даже если одно изображение - уровни (и, собственно, классы) - отличаются.
    про другие сайты не знаю, не сталкивался

  • @psergio_it4884
    @psergio_it4884 ปีที่แล้ว

    В начале ролика говорили и про парсер Авито, а по факту его не показали - хотел бы увидеть в др ролик

  • @Евгений-г4р2т
    @Евгений-г4р2т 10 หลายเดือนก่อน

    Подскажите, как парсить категории с под, под, подкатегориями, ни где не могу найти эту инфу и все перепробовал, только с главной страницы вытаскивает и все, на другие страницы не переходит.?

  • @McMaruhin
    @McMaruhin 2 ปีที่แล้ว +2

    Насчёт классов я запишу видео в котором постараюсь объяснить всё подробно что имел ввиду.
    Скину в час с телегой.

  • @beststoryNOGACHC
    @beststoryNOGACHC 3 หลายเดือนก่อน +2

    А есть ли способ импортировать сценарий более 200 элементов, или как то редактировать сценарий не через браузер...короче нужен способ два сценария поженить вместе в общей сумме более 400 элементов. Создавать он дает более 200 а копировать нифига, как то есть способ отредактировать расширение может напрямую через проводник виндовс до корневой папки chrome или есть какие то другие пути...пожалуйста отпишитесь

    • @usota
      @usota  3 หลายเดือนก่อน +1

      Можно попробовать экспортировать, отредактировать JSON, и импортировать обратно. Но редактировать JSON нужно внимательно, чтобы ничего не сломать. Других способов, к сожалению, не знаю.

  • @dhard1410
    @dhard1410 2 ปีที่แล้ว +2

    можете подсказать, как работает елемент клик. Столкнулся с проблемой когда нужно перейти на следующую страницу определенной категории, она через Link не работает, потому что ссылки нет, он не понимает куда ему переходить. Я вот подумал что возможно елемент клик поможет в этом деле, но не могу понять что я должен выделять. Спасибо!

    • @usota
      @usota  2 ปีที่แล้ว

      Пришлите ссылку на сайт, посмотрим, как можно решить проблему, если ещё актуально) контакты в описании

  • @metamorphosisdesignstudio4828
    @metamorphosisdesignstudio4828 7 หลายเดือนก่อน

    Все-таки я сделал все с ценами и ссылками, все норм. Но вот картинки из пинтереста и даже с авито не смог, скачивает только первых несколько. Картинки самое главное, как дальше? Я кстати вам письмо написал, ищу обратную связь так сказать, еще в тг напишу утром уж. Очень нужно разобраться

  • @yanin68
    @yanin68 2 ปีที่แล้ว +2

    Евгений добрый день или вечер. Возможно ли WebScraper -ом парсить динамические сайты такие как (Dns shop).

    • @usota
      @usota  2 ปีที่แล้ว

      Добрый день, этот инструмент парсит любые сайты. Ну может кроме сайтов с . Но и тут можно придумать, как добраться до данных.
      Днс шоп - парсит легко, прямо сейчас попробовал, данные собирает быстро и полностью.

    • @yanin68
      @yanin68 2 ปีที่แล้ว

      @@usota Спасибо

    • @yanin68
      @yanin68 2 ปีที่แล้ว +1

      И еще ... смотрю Ваш канал постоянно, очень полезный и доходчивый материал, порой бывает смешно как все просто. Еще раз спасибо огромное !!!

    • @usota
      @usota  2 ปีที่แล้ว

      Спасибо за приятные слова 🙏

  • @Илья-п5в5р
    @Илья-п5в5р 2 ปีที่แล้ว +1

    а как указать в элементе, выбор конкретных категорий? Например при выборе фильтров в интернет магазине, чтобы выбирал не все категории товара подряд, а только жестко прописанные.

    • @usota
      @usota  2 ปีที่แล้ว

      Жестко прописать в Start URL. Их же можно указать несколько, когда вы создаёте Sitemap.

  • @mrartivanov
    @mrartivanov 6 หลายเดือนก่อน +1

    button:contains('Показать телефон')

  • @SeoAlexWizard
    @SeoAlexWizard 2 ปีที่แล้ว

    подскажит как можно сделать enter value в web scrapper е?

    • @usota
      @usota  2 ปีที่แล้ว

      Расскажите подробнее?

  • @mrartivanov
    @mrartivanov 6 หลายเดือนก่อน

    нужно научиться hh

  • @dimon015
    @dimon015 7 หลายเดือนก่อน +1

    А Вы работаете в бесплатной версии?

    • @usota
      @usota  7 หลายเดือนก่อน +1

      Да

    • @dimon015
      @dimon015 7 หลายเดือนก่อน +1

      @@usota спасибо! И бесплатной Вам хватает под все задачи? А если на сайте стоит капча?

    • @usota
      @usota  7 หลายเดือนก่อน

      @dimon015 ws использую редко, для быстрых не сложных задач. Для профессионального использования пишу скрипты на Python. У нас в чате @proparsing можно посмотреть много решений по парсингу

    • @dimon015
      @dimon015 7 หลายเดือนก่อน +1

      @@usota подскажите а Вы python самостоятельно изучали? Или какие то курсы?

    • @usota
      @usota  7 หลายเดือนก่อน +1

      Бесплатный курс на Яндекс Практикуме и курс Олега Молчанова

  • @Фау
    @Фау ปีที่แล้ว +1

    Все хорошо кроме того что данные он собирает лесенкой((

    • @usota
      @usota  ปีที่แล้ว +1

      Так бывает, если мы указываем для каждого элемента мультипл. Чтобы избежать эту ошибку - нужно указывать мультипл только главному элементу, внутри которого лежат нужные данные.

    • @Фау
      @Фау ปีที่แล้ว +1

      @@usota спасибо большое за совет, помогло)

    • @psergio_it4884
      @psergio_it4884 ปีที่แล้ว

      ​@@usotaчто значит лесенкой? Можно пример?

  • @ДмитрийВласов-з8ч
    @ДмитрийВласов-з8ч 7 หลายเดือนก่อน +1

    Сплошной сумбур в подаче материала. Кто Вам отзывы пишет? Можно все подать в несколько раз короче

    • @usota
      @usota  7 หลายเดือนก่อน

      Спасибо за оценку. Может сделаем хороший, качественный ролик по этому материалу вместе с вами?

    • @usota
      @usota  6 หลายเดือนก่อน

      Вы так и не ответили на предложение сделать лучше. Возможно вы уже самостоятельно сделали более короткую подачу без сумбура? Поделитесь пожалуйста.

  • @allaurross
    @allaurross ปีที่แล้ว +1

    на седьмой минуте выключил видео
    вообще шлак полный
    тыкает не понятно куда, фиг знает что выскакивает, что-то там рассказывает, цто-то куда то копирует, вставляет.
    То и понятно что из 1200 просмотров всего 64 лайка
    и от меня дизлайк ещё лови.
    Чёрный пиар тоже пиар ))))

    • @usota
      @usota  ปีที่แล้ว

      Спасибо за обратную связь)

  • @AntonGl-g2p
    @AntonGl-g2p 9 หลายเดือนก่อน +1

    А если нужно по определенному списку ссылок переходить , к примеру {ссылка}/номер конкретного товара . То как быть ?

    • @usota
      @usota  9 หลายเดือนก่อน

      Как создать одностраничный сайт со списком ссылок для парсинга
      th-cam.com/video/26kGYPw9454/w-d-xo.html
      Можно через промежуточную страницу

  • @AntonGl-g2p
    @AntonGl-g2p 8 หลายเดือนก่อน

    Как спарсить данные с открывающегося в chrome PDF файла ? Вроде расширение поставил которое переводит PDF в HTML а все равно webScraper не дает ссылку добавить (( тк в начале нее chrome-extension://oemmndcbldboiebfnladdacbdfmadadm/

    • @usota
      @usota  8 หลายเดือนก่อน

      Не тратьте время. WS парсит сайты, которые можно открыть по url, если по простому. Для парсинга PDF используются другие способы, например библиотека pdfquery для Python. Но если очень нужно через WS, то разве что конвертировать все PDF в HTML, загрузить на сервер и с него уже открывать по url и парсить. Но это костыли на костылях, уж простите.