rus-gpt.com сервис для инференса llama 3. Программируем с CodeGPT плагином в pycharm.

แชร์
ฝัง
  • เผยแพร่เมื่อ 11 พ.ย. 2024

ความคิดเห็น • 32

  • @Ubili-negra
    @Ubili-negra 6 หลายเดือนก่อน +4

    Незнаю про что тут но парень ВПН помог поднять, досих пор работает))) лайк обязательно, думаю Виталий знает о чем говорит))

  • @ДенисДавыдов-д8ц
    @ДенисДавыдов-д8ц 5 หลายเดือนก่อน +1

    Привет Виталий ! Я новенький в таких делах , буквально недавно загорелся данной темой , програмистом ни разу небыл , но понял сразу , твои видео зачетные ! Хочу также разбератся в нейронках , многое из видео осталось не понятным ) блин, может запилиш краткий курс для новечков , без знания програмирования , чтоб хотябы в теме быть ) по делу самое актуальное что нужно знать на сегоднешней день, так как все это быстро развивается что только диву даешься , благодарю за выложеные ролики ! Я даже новый мини комп купил для такого дела ) в общем настроен решительно !!! )

  • @alexanderkorolev8567
    @alexanderkorolev8567 6 หลายเดือนก่อน +1

    Супер, спасибо

  • @pavelkogtev2651
    @pavelkogtev2651 3 หลายเดือนก่อน

    Здравствуйте. Вы сохраняете историю пользовательских запросов для каких либо своих целей? Думаю для клиентов вашего сервиса помимо цены, также будет важна и приватность. Можете пару слов сказать про это?

  • @no_cola
    @no_cola 2 หลายเดือนก่อน +1

    Круто, а как боретесь с несколькими одновременными запросами? Насколько я понял по видосам из плейлиста - у вас 3 видеокарты на домашнем железе, а для обработки каждого запроса модель должна быть отдельная. Значит ли это что будет тормозить?

    • @kuliev.vitaly
      @kuliev.vitaly  2 หลายเดือนก่อน

      Модель может одновременно несколько запросов обрабатывать

    • @no_cola
      @no_cola 2 หลายเดือนก่อน

      @@kuliev.vitaly хм, непонятно. Как такое возможно, ведь насколько я понимаю, в процессе вычислений используются все веса модели, и пока она не завершит в нее отправлять новый запрос нельзя. Кстати, я полный 0 в нейросетях, пытаюсь разобраться.

    • @kuliev.vitaly
      @kuliev.vitaly  2 หลายเดือนก่อน

      Нужны все веса нейросети и пользовательские данные. Пользовательских данных может быть несколько.

    • @kuliev.vitaly
      @kuliev.vitaly  2 หลายเดือนก่อน

      th-cam.com/video/UB9KAYsYUQQ/w-d-xo.html

    • @no_cola
      @no_cola 2 หลายเดือนก่อน

      @@kuliev.vitaly ну тогда получается что модель по очереди работать с каждым запросом будет. Я пробовал апи сегодня , 100 потоков запросов делал, в целом быстро работает, но не параллельно. У меня был вопрос как такие модели можно распараллеливать

  • @amanboronbaev6478
    @amanboronbaev6478 6 หลายเดือนก่อน +2

    Привет. Какие будут примерно в будущем цены? Просто было бы прикольно старым юзерам дать чуть больше доступности.
    Также хотелось бы новое виде на тему как запушить свой проект(тг бота )на ВМ и как интегрировать туда (в проект тг бота) ламу используя твой сервис

    • @kuliev.vitaly
      @kuliev.vitaly  6 หลายเดือนก่อน +2

      Насчет цен пока решил, но планирую сделать доступнее, чем другие решения. Сейчас интересно получить обратную связь от пользователей.

  • @Metalbender777
    @Metalbender777 6 หลายเดือนก่อน +1

    Извините за мой французский, я немного староват, какое практическое применение лама 3? Заранее благодарю.

    • @kuliev.vitaly
      @kuliev.vitaly  6 หลายเดือนก่อน +1

      Сфера применения такая же, как у chatgpt. Я использую для программирования и обработки текстов. В этом видео есть примеры использования:
      th-cam.com/video/n__fZa3V04s/w-d-xo.html

  • @dumpanddie
    @dumpanddie 6 หลายเดือนก่อน +1

    а почему не использовать тот же ollama и веб интерфейсы от ollama чтоб допилить под нужды будет легче по моему так как если с нуля писать то очень многое нужно сделать и до того как сделаешь!

    • @dumpanddie
      @dumpanddie 6 หลายเดือนก่อน

      эт я для веб интерфейса чем с ботом что то крутить и создавать велосипед который уже создовали командой

    • @kuliev.vitaly
      @kuliev.vitaly  6 หลายเดือนก่อน +1

      Чатов с поддержкой gpt-4 есть несколько, причем бесплатные и работают без впн. С апи в этом плане хуже ситуация.
      Плагин codeGPT позволяет удобнее взаимодействовать с кодом. Тоже самое можно сделать и через веб чат(типа chatgpt), но придется вручную копировать много кода и дополнительнх данных - я так пробовал и это неудобно.

  • @IT_psychopath
    @IT_psychopath 6 หลายเดือนก่อน +1

    получается можно свою Llama3 развернуть на ПК и туда подставить? тестил ее даже на древнем железе, железо даже не ощущает что она вообще есть.😁так что развернуть на буке или ПК, кодеру свою Llama-3 и пробросить в редактор, шикарная тема.
    API вопросов нет, идея огонь! но там надо хотя бы 34B и выше.. 8B тоже огонь, но локально проще.😁
    спасибо! а видосик по дообучить Llama3 на своих данных не хотите запилить? такого вообще толком не нарыть, или слишком поверхностно или бред..

    • @kuliev.vitaly
      @kuliev.vitaly  6 หลายเดือนก่อน

      8b для примера выложил. планирую в сервисе перейти на 70b. Промежуточных размеров 3 ламы нет. Дообучать пока не пробовал, но планирую.

  • @PubgSpeed-wl8yo
    @PubgSpeed-wl8yo 6 หลายเดือนก่อน +6

    Сколько вы платите в месяц за сервер ,на котором лама лежит? И было бы интересно посмотреть видео как вы это все кладете на сервер и настраиваете API, что это работало так же как у вас

    • @kuliev.vitaly
      @kuliev.vitaly  6 หลายเดือนก่อน +5

      Нейросеть запущена на моем компьютере, выделенном дя этой задачи.
      Стоимость аренды аналогичного сервера для запуска llama-3-8b составляет 50-100к рублей в месяц.

    • @PubgSpeed-wl8yo
      @PubgSpeed-wl8yo 6 หลายเดือนก่อน

      @@kuliev.vitaly дорого, дешевле тогда пользоваться опенай, или антропик на данном этапе

    • @dumpanddie
      @dumpanddie 6 หลายเดือนก่อน

      ​@@PubgSpeed-wl8yo ага я пробовал на гугловском a100 на 40г
      но он с легостю запускает на 8b но с 70b уже тормозить
      там а100 только видюха стоит 3млн рублей аналогичный а сейчас работаю через huginface там бесплатно доступен модел на llama3:70b-instruct

    • @kuliev.vitaly
      @kuliev.vitaly  6 หลายเดือนก่อน +2

      У openai есть проблемы с оплатой и впн для России. Пользуйся моим сервисом, сейчас он бесплатный, в будущем будет недорого стоить.

    • @PubgSpeed-wl8yo
      @PubgSpeed-wl8yo 6 หลายเดือนก่อน

      @@kuliev.vitaly у меня нет с этим проблем в плане опенай, и эту ламу можно поставить к себе на компьютер и пользоваться, не совсем понял зачем мне ваш сервер?