Решаем задачи NLP с помощью Hugging Face | Обработка естественного языка

แชร์
ฝัง
  • เผยแพร่เมื่อ 16 ธ.ค. 2024

ความคิดเห็น • 32

  • @igormel5137
    @igormel5137 2 ปีที่แล้ว +10

    Ох вообще супер. Как раз недавно обратил внимание на эту библиотеку, на англоязычном ютубе. А тут такой шикарный подгон на русском, да еще и классно объяснили.

    • @AndreySozykin
      @AndreySozykin  2 ปีที่แล้ว +5

      Спасибо! Рад, что понравилось!

    • @chiboreache
      @chiboreache 2 ปีที่แล้ว

      сейм!) буквально недавно увлекся нлп, и прям своевременный видосик))

  • @АлександрКаптуров-с8и
    @АлександрКаптуров-с8и 6 หลายเดือนก่อน

    Андрей, научили пользоваться такой крутой библиотекой! Огромный Вам респект! Урок супер!

  • @ИгорьЛатуха
    @ИгорьЛатуха 2 ปีที่แล้ว +3

    До чего техника дошла 😱💥

    • @AndreySozykin
      @AndreySozykin  2 ปีที่แล้ว +1

      Да, именно так.

  • @BeautyMonstra
    @BeautyMonstra 2 ปีที่แล้ว +1

    Оу май гад! У вас восхитительный голос 😻👍
    Манера повествования прекрасна, объясняете подробно 👍
    Спасибо за видео!

  • @math__brainstorm4580
    @math__brainstorm4580 2 ปีที่แล้ว +3

    Спасибо! Отличное видео

  • @vladimirpavlov6894
    @vladimirpavlov6894 8 หลายเดือนก่อน +1

    Здравствуйте! Понимаю, что видео совсем ознакомительное, но:
    Все представленные в видео русскоязычные модели ужасного качества. Rubert полностью перестаёт определять положительные комментарии как положительные, если в них присутствует абсцессная лексика (Поэтому соответствующие синонимы к слову "Невероятный" будут заставлять модель определять текст как негативный). Библиотека для перевода текста перевела текст "Меня зовут Петька и я создаю сайты" с present continious. Хотя данное предложение должно иметь present simple, так как "Создаю сайты" имеется ввиду на постоянной основе, а не в конкретный текущий момент. Любой переводчик (Например, Яндекс) переводит такие простые предложение правильно.
    Вопрос, собственно, следующий - как добиться от моделей результата, который хоть немного применим в реальной жизни и не ломается при попытке работать с текстами чуть сложнее, чем "Добро это хорошо, а зло это плохо"?

  • @МаксимМакаров-р7ь
    @МаксимМакаров-р7ь 2 ปีที่แล้ว +2

    Спасибо большое!

  • @vladimirpavlov6894
    @vladimirpavlov6894 8 หลายเดือนก่อน

    Если у вас не работает строка "from transformers import pipeline", то у вас установилась старая версия transformers. Укажите более новую версию (например, 4.38.2) самостоятельно, с помощью " !pip install transformers==4.38.2 ".

  • @viyrzn
    @viyrzn 2 ปีที่แล้ว +2

    круто!

  • @АртурПоздняк-я9х
    @АртурПоздняк-я9х 2 ปีที่แล้ว +3

    Добрый день, вы будете рассматривать обработку аудио с помощью этой библиотеки?

    • @AndreySozykin
      @AndreySozykin  2 ปีที่แล้ว +4

      В курсе по NLP не планировал. Но если интересно, сделаю отдельное видео.

    • @3dport
      @3dport 2 ปีที่แล้ว +1

      Андрей, большое спасибо за видео! И также было бы очень интересно про обработку аудио!

    • @АртурПоздняк-я9х
      @АртурПоздняк-я9х 2 ปีที่แล้ว +2

      @@AndreySozykin да, очень интересная тема

    • @AndreySozykin
      @AndreySozykin  2 ปีที่แล้ว +1

      Хорошо, попробую сделать. Но не в ближайшее время.

  • @neola_
    @neola_ ปีที่แล้ว

    Добрый день) а Вы не подскажете если есть задача из текста типа "хочу сходить в магазин утречком с мамой и купить молока" выделить задача: сходить , купить; время: утро; с кем: мама ; предмет: магазин, молоко, какой тип пайплайна лучше использовать? или какую задачу с hugging face?

  • @dilnamo
    @dilnamo 10 หลายเดือนก่อน +1

    Здравствуйте, хочу воспользоваться семантическим анализом текста на узбекском языке, но этот код выдает ошибку, что делать, чтобы проанализировать тексты на узбекском языке?

    • @AndreySozykin
      @AndreySozykin  10 หลายเดือนก่อน

      К сожалению, с узбекским языком никогда не работал, поэтому не смогу помочь.

  • @Делакруа́-ы9щ
    @Делакруа́-ы9щ หลายเดือนก่อน

    Для учебных целей библиотека отлично подходит , а вот на практике ее кто нибудь применяет в своих приложениях ?

  • @notacoach
    @notacoach 2 ปีที่แล้ว +1

    Андрей, добрый день! Спасибо за Ваши видео, в них много полезной информации. Как Вы считаете, не свидетельствует ли приведенный Вами пример использования библиотеки RuBERT о непригодности последней к реальному использованию? Простейшее предложение 'Я ненавижу НЛП", классифицируется, фактически, неверно. Всего 75% процентов вероятности, что это негатив. Хотя оригинальный BERT оценивает 'I hate NLP' как практически 100% негатив. У Вас, кстати, даже голос звучит озадаченно когда Вы озвучиваете результат RuBERT.

    • @AndreySozykin
      @AndreySozykin  2 ปีที่แล้ว

      Спасибо за приятный отзыв. Я бы не сказал, что ruBERT не пригодна для практического использования. Ее возможности, действительно, ограниченны. Но в примере текст слишком короткий, обычно анализируются более длинные тексты.

  • @АсельАртыкбаева-и1в
    @АсельАртыкбаева-и1в 9 หลายเดือนก่อน +1

    А тексты на казахском языке можно проанализировать?

    • @AndreySozykin
      @AndreySozykin  9 หลายเดือนก่อน

      Наверное, можно. Но я не пробовал.

    • @АсельАртыкбаева-и1в
      @АсельАртыкбаева-и1в 9 หลายเดือนก่อน

      @@AndreySozykin мне на диссертацию предлагают это вынести. Боюсь не справится

  • @TheKifsif
    @TheKifsif ปีที่แล้ว

    Курс, конечно, на питоне. Но вопрос выбора языка не пояснялся. Это может быть просто личное пристрастие автора (так называемая вкусовщина), а может быть взвешенный выбор. Мы не знаем, отсюда и вопрос.
    Скажите, пожалуйста, какой язык программирования лучше всего выбрать для обработки естественного языка - русского языке? Вопрос нагрузки на сервер предлагаю не рассматривать: если Python практичнее, то его производительности подавляющему большинству заказчиков хватит слихвой. Если иначе сформулировать вопрос, то это вопрос о языке с наиболее мощной инфраструктурой для обработки текстов на русском языке.

    • @vladimirpavlov6894
      @vladimirpavlov6894 8 หลายเดือนก่อน

      В самом первом видео этого курса автор предупредил, что он для тех, кто уже имеет некоторые знания по нейронным сетям, а также оставил ссылку на курс, который стоит посмотреть тем, кто в этой теме впервые.
      Ответ по поводу выбора языка был как раз в том начальном курсе. Если вкратце, то синтаксис Python позволяет очень быстро переписывать код, что очень важно так как нейронные сети и ML - больше исследовательские задачи, в которых архитектура ИНС, да и сам набор данных для её обучения постоянно меняются в поиске наиболее оптимального результата. В продакшене код с Python переводят на C++ и на серверах, обычно, уже модель работает на С++. Собственно, сама библиотека Keras для питона написана на C++. То есть вы сначала исследуете данные и обучаете ИНС на Python, а затем переводите его в С++. Поэтому, для начала, стоит изучить Python. P.S. - Я понимаю, что вы написали этот вопрос почти год назад и уж наверняка знаете ответ. Мой комментарий - скорее для тех, кто совсем недавно посмотрел видео и задался тем же вопросом, что и вы.