Nodejs Scraper[parser] 🚀 - добавляем параллелизм (async/queue)

แชร์
ฝัง
  • เผยแพร่เมื่อ 18 พ.ย. 2024

ความคิดเห็น • 37

  • @mikkaruru
    @mikkaruru 4 ปีที่แล้ว +3

    Очень круто! Спасибо! Не бросай канал, пожалуйста!

  • @ПОЛЯКЛАТЫШ
    @ПОЛЯКЛАТЫШ 4 ปีที่แล้ว +2

    ЧУВАААААААААААААК ПРОДОЛЖАЙ ВЫПУСКАТЬ ВИДЕО

  • @mikhailreznichenko8035
    @mikhailreznichenko8035 4 ปีที่แล้ว +4

    Офигеные видосы у тебя , продолжай в том же духе!!!

  • @kiryaafimin5609
    @kiryaafimin5609 5 ปีที่แล้ว +11

    Привет! Хорошие видео, без воды. Хотелось бы увидеть, как работать с прокси и авторизацией

    • @duckduckjs
      @duckduckjs  5 ปีที่แล้ว +4

      Постараюсь выложить видос про прокси в ближайшее время

    • @vitaliylufter8765
      @vitaliylufter8765 3 ปีที่แล้ว

      @@duckduckjs ну и где видос про прокся?

  • @mir9915
    @mir9915 4 ปีที่แล้ว +1

    Всех Благ и Быть Добру! Здравия! Было-бы хорошо увидеть, как подобную информация заливать на свой сайт и мониторить новинки удаляя старые (проданные) авто со своего сайта меняя контент. Благодарю!

  • @gitarmengitarmenovich767
    @gitarmengitarmenovich767 4 ปีที่แล้ว +1

    Супер, спасибо большое, зачетный контент, и первый видос тоже отличный, хотелось бы еще глянуть работу с PhantomJS, в чем его преимущества, недостатки, когда нужно использовать, когда не стоит

  • @seriiioga_fx
    @seriiioga_fx 4 ปีที่แล้ว +1

    Действительно круто, тем более на русском ютубе, про папетер вообще видео почти нет - однозначно лайк😁

  • @sergey-v9k4m
    @sergey-v9k4m 4 ปีที่แล้ว

    Концовка топ 😁 счастливый индус с апворка взял заказ))

  • @eugenegronski709
    @eugenegronski709 4 ปีที่แล้ว

    Бомба! Спасибо за то, что поделился знаниями!
    Можешь сделать урок, в котором бы показал как отслеживать динамически, к примеру, по дате публикации новые объявления. Спасибо что прочитал комментарий)

  • @maksymdudyk1718
    @maksymdudyk1718 4 ปีที่แล้ว

    Супер. Если создать еще и серию уроков по скрейпингу, то от покупателей отбоя не будет.

  • @ЮрийВладимирович-ц6л
    @ЮрийВладимирович-ц6л 5 ปีที่แล้ว +1

    музыка на фоне огонь!!!

  • @ardanow1
    @ardanow1 2 ปีที่แล้ว

    Спасибо, круто

  • @uracan7872
    @uracan7872 4 ปีที่แล้ว +1

    Отличное видео. Сделай плиз про обработку огромных фаилов json, который весит например 300мб, в stream режиме. Например отсортировать такой фаил или вытащить определенные данные

  • @ruslan2676
    @ruslan2676 3 ปีที่แล้ว

    Крутое видео, спасибо! Сделай видос как парсить разные сайты одновременно

  • @dmitriyaleksandrovich4443
    @dmitriyaleksandrovich4443 4 ปีที่แล้ว

    Чувак, ты очень крутой!!!

  • @andreydmitriyev4582
    @andreydmitriyev4582 4 ปีที่แล้ว

    Просто спасибо!

  • @script_guru
    @script_guru 3 ปีที่แล้ว

    круто, пили еще)

  • @tattooedvl
    @tattooedvl 4 ปีที่แล้ว

    добрый день, релизуемо ли будет сделать следующее: делаю тг-бота (Сейчас все готово лишь с моей созданной бд для пробы, где лежат фильмы с их данными, кинотеатры с локациями и тд, могу выводить фильмы, в каких они кинотеатрах, какое расстояние и переход на сами сайты), который по локации будет показывать кинотеатры моего города с их сеансами и тд? И если да, правильно ли понимаю, что нужно тоже писать скрапер для вытаскивания "динамики"?

  • @denial3874
    @denial3874 3 ปีที่แล้ว

    DUCK DUCK JS: Почему-то ошибка TypeError: done is not a function

  • @Karl93rus
    @Karl93rus 4 ปีที่แล้ว

    Как обойти 429 респонс "too many requests"? Кто успешно смог? Я немного не так парсинг делаю, то есть без доп. библиотек. Хотя, думаю, у этой либы под капотом такой же Promise.all работает. Я это к чему. Я в 3 потока фигачу. Через 18 запросов меня отрубают. Как можно проксировать? Или прокси листы какие-то платные может кто знает?

    • @vitaliylufter8765
      @vitaliylufter8765 3 ปีที่แล้ว +2

      Так проксю тоже отрубит, проксей ненапасешся. Делай по 5 запросов, с таймаутом по пол секунды, как пример. Каждый запрос меняй user-agent

  • @vitaliylufter8765
    @vitaliylufter8765 3 ปีที่แล้ว

    А зачем там папитиир? Разве обычный http запрос не намного быстрее?

    • @duckduckjs
      @duckduckjs  3 ปีที่แล้ว

      В данном случае он нужен, чтобы собрать данные со страницы spa приложения, которое грузится уже на клиенте, если вы собираете данные с сайта, который при http запросе возвращает полный html код страницы, то пользуйтесь им, будет действительно быстрее

  • @sendspace9430
    @sendspace9430 5 ปีที่แล้ว

    Как полученные данные записать в базу MySQL или в CSV файл?

    • @duckduckjs
      @duckduckjs  5 ปีที่แล้ว +2

      Это можно сделать месте, где мы сохраняем файл. CSV - обычный текстовый файл, каждая строка - значения, разделенные запятыми, так что тут проблем никаких нет. А для записи в БД, должна быть сама БД и подключение к ней, вместо сохранения в файл просто делаем запрос с данными к Mysql. Для этого должен быть установлен сам модуль mysql. Подробнее про работу с Mysql в Node.JS можно почитать здесь например (просто загуглил)
      stepansuvorov.com/blog/2012/09/node-js-%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0-%D1%81-mysql/

  • @Скыбыдыщь
    @Скыбыдыщь 4 ปีที่แล้ว

    Жаль жаль, что ты новые видики не пилишь

  • @mikhailnemirovsky2656
    @mikhailnemirovsky2656 4 ปีที่แล้ว

    Работаете ли по заказам - ?

  • @TheBorninmotion
    @TheBorninmotion 4 ปีที่แล้ว

    А разве парс запрещен в целом ?

  • @dengi_plus_dengi
    @dengi_plus_dengi 5 ปีที่แล้ว

    Давно в ноде import работает?

    • @GagikHarutyunyan_dev
      @GagikHarutyunyan_dev 4 ปีที่แล้ว

      ​@@alfageek5704 решил проблему?

    • @ПанЧиЛо
      @ПанЧиЛо 4 ปีที่แล้ว

      Es-модули поддерживаются ещё начиная с версии 12, но в данном случае использован babel

  • @esp2644
    @esp2644 ปีที่แล้ว

    На bas все же лучше это все делать