Создаем многопоточный граббер форума в несколько стадий с BrowserAutomationStudio

แชร์
ฝัง
  • เผยแพร่เมื่อ 8 ก.พ. 2025
  • Создаем многопоточный граббер в несколько стадий с BrowserAutomationStudio
    English version • Making forum scraper w...
    Скачать бесплатно bablosoft.com/...

ความคิดเห็น • 52

  • @nord134rus
    @nord134rus 7 ปีที่แล้ว +3

    Просто ШИКАРНО!!!!!! Спасибо TWAEGO за видос и прогу!!! Дал ответы в одном видео,сразу на несколько вопросов!!!!!!!

  • @genrihkutz
    @genrihkutz 7 ปีที่แล้ว +1

    Офигенное обновление) просто решает очень много моих костылей)

  • @DanilPidril-w7s
    @DanilPidril-w7s 4 หลายเดือนก่อน

    Это комментарий номер 56. Скрипт BAS поставил лайк и написал этот комментарий. Спасибо за уроки

  • @santiloify
    @santiloify 7 ปีที่แล้ว +2

    TWAEGO спасибо вам за это видео, и за новый функционал, вы нас радуете им. У меня к вам просьба, запишите пожалуйста видео по внедрению модулей из npm в бас, на каком нибудь примере, инфы по этому процессу нет( и разобраться не реально(

    • @browserautomationstudio3109
      @browserautomationstudio3109  7 ปีที่แล้ว +2

      Будет отдельный апдейт, который добавляет поддержку с# и тулзу для конвертации модулей из npm, потом запишу по этому видео

    • @santiloify
      @santiloify 7 ปีที่แล้ว

      ничего себе) в басе по мимо js будет поддержка C# и его модулей? за тулзу отдельное спасибо) а когда это чудо приблизительно выйдет)

    • @browserautomationstudio3109
      @browserautomationstudio3109  7 ปีที่แล้ว +1

      Сразу после апдейта по юзабилити. Через 3 недели примерно.

    • @santiloify
      @santiloify 7 ปีที่แล้ว

      спасибо за ваши ответы. Еще вопрос) количество модулей в папке 'modules' будет как то отражаться на скорости выполнения скрипта, если эти модули в нем не используются.

    • @browserautomationstudio3109
      @browserautomationstudio3109  7 ปีที่แล้ว

      Если модули содержат engine.js(код, который выполняется в начале каждого потока), то будут.

  • @suzannasutonina9343
    @suzannasutonina9343 7 ปีที่แล้ว

    еще скажите, можно ли как то минимизировать нагрузку на ресурсы в каждой копии воркера ? а то каждая копия по 80-90 мб занимает..по сути 100 штук на обычном копме никак не запустить , а покупать дорогой сервак для такого количества не резонно - не знаю как они себя поведут

  • @ezpz701
    @ezpz701 4 ปีที่แล้ว

    почему нельзя спарсить данные в первой фазе так же многопоточно?
    на страницу выдается одинаковое количество ссылок заголовков (T1, T2,..T10) допустим
    взять 10 потоков, сказать первому - ты работаешь всегда с Т1, второму - всегда с Т2, третьему -... , поставить все это в цикл, в конце цикла перелистнуть страницу вперед.
    данные складывать в *.xlsx для первого потока ячейка вывода будет всегда 1, 11, 21,31,41,51... для второго потока 2,12,22,32,42... итд. 3,13,23,43... = на выходе *xlsx файл забитый ссылками в 10 потоков.

    • @roman21n
      @roman21n 3 ปีที่แล้ว

      У вас получилось сделать это?

  • @ЗелёнаяЛужайка
    @ЗелёнаяЛужайка 6 ปีที่แล้ว

    Что ввести в ПОЛУЧИТЬ ТЕКСТ если хочу спарсить с неизвестного сайта?Т.е спарсилось 10 URL теперь нужно получить текст . есть ли какие -то общие match или css или по координатам?

  • @БобБергман
    @БобБергман 4 ปีที่แล้ว

    Как парсить и выводить в лог понятно. А как спарсить, например, чтоб не было просто списком, а чтоб отдельно "заголовок+описание" в несколько txt файлов?

    • @browserautomationstudio3109
      @browserautomationstudio3109  4 ปีที่แล้ว

      А в чем тут проблема?

    • @БобБергман
      @БобБергман 4 ปีที่แล้ว

      ну например 10 постов, надо спарсить "заголовок поста+текст" и на выходе получить 10 txt файлов, каждый пост отдельно в документе.

    • @browserautomationstudio3109
      @browserautomationstudio3109  4 ปีที่แล้ว

      Элементарная задача

  • @mrbooldozer
    @mrbooldozer 7 ปีที่แล้ว +1

    Куллл!!!

  • @FacialHarmonyHub
    @FacialHarmonyHub 3 ปีที่แล้ว

    Сделайте видео как переходить с одной страницы на другую и там парсить с ( к примеру ссылки профилей )

  • @ДмитрийДмитрий-ъ4ф
    @ДмитрийДмитрий-ъ4ф 4 ปีที่แล้ว

    Вывожу текст ссылки в лог - все норм, с каждым циклом прилетает новая ссылка. Если в лог вывожу ресурс - выдает с каждым циклом одну и туже ссылку, самую первую. Как так?

  • @АндрейФролов-ч5к
    @АндрейФролов-ч5к 7 ปีที่แล้ว

    А зачем нужно парсить? Для чего?

  • @МаргаритаСоловьева-ъ2у
    @МаргаритаСоловьева-ъ2у 5 ปีที่แล้ว

    Подскажите пожалуйста если парсить емейл, телефоны как вывести это информацию в Эксель?

  • @stealwin13
    @stealwin13 6 ปีที่แล้ว

    во время парсинга пишет "Поток завршен.Таймаут во время выполнения LoadPage" как это исправить?

    • @browserautomationstudio3109
      @browserautomationstudio3109  6 ปีที่แล้ว +1

      Чтобы это убрать нужно убрать чекбокс полного ожидания загрузки страницы

  • @VR_BkMz
    @VR_BkMz 7 ปีที่แล้ว

    Как сделать, чтобы повторялся шаблон несолько раз ?

  • @alexdolas9911
    @alexdolas9911 7 ปีที่แล้ว

    Как сделать уникальные урлы? А то они часто повторяются

    • @vertigo6319
      @vertigo6319 7 ปีที่แล้ว +2

      1. Собираем все урлы в список.
      2. Применяем функцию "Удалить дубликаты".

  • @suzannasutonina9343
    @suzannasutonina9343 7 ปีที่แล้ว

    дд, скажите как сделать чтобы в каждой копии браузера запускалось расширения вместе с ними ?

    • @browserautomationstudio3109
      @browserautomationstudio3109  7 ปีที่แล้ว

      Поддержка плагинов будет чуть позже.

    • @suzannasutonina9343
      @suzannasutonina9343 7 ปีที่แล้ว

      Twaego Twaego надеюсь вы поняли я про расширения типа vipip.ru например. Когда позже ?

    • @browserautomationstudio3109
      @browserautomationstudio3109  7 ปีที่แล้ว

      Я про эти расширения chrome.google.com/webstore/category/extensions
      Про vipip.ru я ничего не слышал.
      Точных сроков сказать не могу.
      Сейчас есть много задач с большим приоритетом.

    • @suzannasutonina9343
      @suzannasutonina9343 7 ปีที่แล้ว

      ну да они
      там соц сети задействованы..как залогиниться в каждой сети уже понял..а вот как заставить включаться каждую копию браузера ? чтобы браузер уже включался каждый раз с расширениями ? у меня сейчас работает другой бот с бас через соц сети, может задействовать получится и его одновременно . По сути для мне нужно только чтобы браузер запускался с расширением установленным, а все остальное оно само сделает....в инструкции нигде не нашел

    • @browserautomationstudio3109
      @browserautomationstudio3109  7 ปีที่แล้ว

      Расширения в данный момент не поддерживаются.

  • @the-nikitins
    @the-nikitins 6 ปีที่แล้ว

    А для mac есть bas?

  • @wmplati1387
    @wmplati1387 7 ปีที่แล้ว

    это на подобии зенопостера?

  • @haltyrawm
    @haltyrawm 7 ปีที่แล้ว

    Почему на браузере?????????

    • @browserautomationstudio3109
      @browserautomationstudio3109  7 ปีที่แล้ว +1

      Для наглядности. Чтобы лучше было видно как создаются потоки.

  • @DrPrime8
    @DrPrime8 7 ปีที่แล้ว

    А кто видос записывал?