Monta tu propio servidor de LLM en local usando llama.cpp (para chatbots y completar textos)

แชร์
ฝัง
  • เผยแพร่เมื่อ 19 ม.ค. 2025

ความคิดเห็น • 21

  • @ismaelmoraleda228
    @ismaelmoraleda228 ปีที่แล้ว

    eres el único que lo ha explicado bien, llevo un buen rato buscando información sobre esto y solo con ver tu video me he ahorrado todo eso. sigue así tío eres un genio 👍

  • @camilareyes8423
    @camilareyes8423 4 หลายเดือนก่อน

    Graciaaaas

  • @insecureup
    @insecureup 8 หลายเดือนก่อน

    Genial !!!

  • @fastsmartsystem
    @fastsmartsystem ปีที่แล้ว

    Yo implemente en el servidor inicialmente tomando como referencia la API de Open AI, pero me dijeron que no, y se pusieron a optimizar casi todo el codigo que habia escrito ya que habia pasado por alto algunos errores 😂😂, ese proyecto me parece muy interesante.
    Te recomiendo que los modelos que uses ponles el prompt que les corresponde, yo uso vicuna v1 7B ya que habla bastante español, aunque funciona mucho mejor en ingles

    • @construyendoachispas
      @construyendoachispas  ปีที่แล้ว +1

      A mí ese proyecto (y su entorno con whisper.cpp y ggml) también me parece muy interesante. También suelo usar Vicuna, aunque recurro más a Stable Vicuna. Pero así aproveche este video para probar Orca, que había leído maravillas sobre él

  • @M3taD4rko
    @M3taD4rko ปีที่แล้ว +1

    buenaa info aun que el audio me hizo sufrir

  • @terrakorp
    @terrakorp ปีที่แล้ว

    ¿qué especificaciones tiene el ordenador en que lo estas corriendo?

    • @construyendoachispas
      @construyendoachispas  ปีที่แล้ว

      Un portátil con un Ryzen 7 5xxx con 16 Gigas de RAM. Hay modelos más pequeños que el que usado que para según que cosas no van mal. Para no complicar el vídeo no he entrado en detalle en los parámetros de optimización que tiene por ejemplo -t permite que use más hilos de ejecución (en el vídeo solo usa 1) yo suelo usar -t 8 y va mejor (tampoco es que vaya 8 veces más rápido que supongo que habrá partes que no podrá paralelizar)

  • @TheSantiago52
    @TheSantiago52 ปีที่แล้ว

    Podemos usar la última versión de llama como lo haces acá, o muy diferente?

    • @construyendoachispas
      @construyendoachispas  ปีที่แล้ว

      Han cambiado la interfaz del servidor y han añadido montón de opciones a la hora de lanzarlo pero el funcionamiento sigue siendo el mismo. Lo unico que las ultima versiones no usan modelos .GGML, en su lugar usan .GGUF

  • @semiconductor-d9t
    @semiconductor-d9t 7 หลายเดือนก่อน

    hablas de una terminal pero no se entiende como se llama esa terminal o como se crea o instala dicha terminal ese es un error común en casi todos los tutoriales hacen como si el usuario ya supiese de que se trata, en mi caso no se de estas cosas y te pido el favor expliques mas pausado de donde salen esas terminales que son para que son como se usan como se llama esos comandos en resumen lo básico para poder entender bien por que me pierdo desde el principio, por que estoy muy perdido y quiero aprender pero la mayoría de tutoriales no explican por donde empezar no explican bien esto es muy decepcionante por donde empiezo? puedes agregar mas tutoriales es que tus temas son interesantes pero me pierdo no es tu culpa pero se puede mejorar el tutorial espero que se haga por que de verdad me interesa pero hace falta mas guia aunque va muy bien pero me pierdo y puede ser una guia excelente

  • @havito
    @havito ปีที่แล้ว

    buenas, estoy buscando un modelo de llm al que entrenar desde 0 con mis datos. Conoces alguno? No fine tunning sino entrenamiento desde 0 (si, se que puede ser una locura pero es una "apuesta" entre un amigo y yo)
    pd: intenta mejorar el audio. Me da que tienes un micro unidireccional y te alejas mucho al hablar y luego te colocas en frente y por eso esas subidas y bajadas tan exageradas.

    • @construyendoachispas
      @construyendoachispas  ปีที่แล้ว +1

      Te paso un librería para entrenar tu propio "mini llama 2" es de lo más sencillo que hay, hasta incluye un ejemplo de entrenamiento con dataset para escribir microcuentos (preparar un dataset grande y con el formato adecuado es uno de lo mayores problemas de entrar estos modelos) github.com/karpathy/llama2.c

    • @construyendoachispas
      @construyendoachispas  ปีที่แล้ว +1

      El audio estoy tratando de solucionarlo, creo que en los últimos dos vídeos mejora aunque aun me queda eliminar el ruido del todo. Gracias por el consejo :)

    • @havito
      @havito ปีที่แล้ว +1

      @@construyendoachispas jejeje, de nada hombre. Es más que nada por los que usan cascos... que podrían morir desangrados... jejeje. Pero me he quedado por el contenido eh! :D

    • @havito
      @havito ปีที่แล้ว

      @@construyendoachispas muchisimas gracias! sabes si solo puedo usar inglés para entrenar?

    • @construyendoachispas
      @construyendoachispas  ปีที่แล้ว +1

      @@havito si hay algún problema podría ser en el tokenizador. La parte que reconoce las palabras y las convierte en tokens. Te deja usar tokenizadores personalizados e igual encuentras alguno para Español. Pero yo de primeras no me complicaría y probaría con el que viene.

  • @rogerpoulopez9256
    @rogerpoulopez9256 ปีที่แล้ว

    Hey gracias por la info pero intenta mejorar el micrófono jaja

    • @construyendoachispas
      @construyendoachispas  ปีที่แล้ว

      jajaja si, creo que lo del micrófono ya lo he solucionado en mis últimos vídeos. Me costo dar con la configuración adecuada

  • @semiconductor-d9t
    @semiconductor-d9t 7 หลายเดือนก่อน

    SEÑOR USTED TIENE UN PROGRAMA QUE PUEDE SER INTERESANTE TIENE POTENCIAL , PERO ESTA INCOMPLETO LA MITAD NO SE ENTIENDE Y LO PEOR ES QUE COMIENZA CON SU VOZ MUY CHILLONA ENSORDECEDORA Y MOLESTA ES NECESARIO ACLARAR EL TEMA Y MEJORAR CON SU VOZ QUE SEA MAS SUAVE ESA PALABRA BIEN BENIDOS¨¨ A GRITOS SUENA HORRIBLE MEJORELO MAS ASUAVE