Fine-tuning a GPT3 Para Que Haga Lo Que Sea
āļāļąāļ
- āđāļāļĒāđāļāļĢāđāđāļĄāļ·āđāļ 16 āļĄāļī.āļĒ. 2024
- En este video veremos como podemos hacer fine-tuning de GPT3 de openai. Para que se pueda adecuar mejor a los distintos casos de uso que podemos llegar a tener.
______________________________________________________________________________________________________________________________________________________________________________________________________
- Ponte en contacto conmigo: / amptech_cc
- ð Si quieres apoyar al canal ðŦķ para que haya mas y mejor contenido (ganar-ganar-ganar jaja) puedes hacerlo por Patreon! ð
/ amptech_cc
______________________________________________________________________________________________________________________________________________________________________________________________________
0:00 - Intro
0:10 - Que es fine-tuning
0:20 - Cuando hacer fine-tuning
1:17 - Costos
1:47 - Configuracion inicial
2:17 - Variable de ambiente
2:44 - Armar tu set de datos
3:25 - Formato de csv
5:00 - Recomendaciones sobre tu set de datos
7:00 - Convertir a jsonl
8:12 - Empezar fine-tuning
10:30 - Probando el modelo
12:12 - Comparacion contra modelo sin FT
13:05 - Menciones importantes
#inteligenciaartificial #openai #chatgpt - āļ§āļīāļāļĒāļēāļĻāļēāļŠāļāļĢāđāđāļĨāļ°āđāļāļāđāļāđāļĨāļĒāļĩ
Excelente informaciÃģn. PodrÃas profundizar en los embeddings?
Muchas gracias por tu video, es altamente de provecho. Yo tambiÃĐn estoy interesado en ver cÃģmo desarrollas, en prÃģximos videos, las bÚsquedas semÃĄnticas y los embedings.
Excelente explicaciÃģn ! Espero haya pronto mas contenido
Muchas gracias por compartir este conocimiento tan valioso.
Muchas gracias por el comentario Oswaldo, que bueno que te ha funcionado :)
Excelente, un video de embeddings serÃa genial!
definitivamente serÃa genial un video centrado en los embedings, gracias.
Ya viene en poco tiempo. Saludos
De lujo manito. Muchas gracias
BuenÃsimo video Alex! Saludos desde Chile. Me gustarÃa saber si el fine tuning me ayudarÃa a ajustar el modelo para que reconozca e identifique ciertos tipos de documentos que suelo trabajar: contratos, certificados, pÃģlizas, etc. me gustarÃa que al pasarle el texto, el modelo identifique de quÃĐ documento se trata, en base al set de datos que le darÃĐ. QuÃĐ opinas?
ha sido increible lo que me acabas de enseÃąar con todo lo motivado que estoy con estos temas, necesitaba entender el concepto fine tuning i genial lo que explicas y como lo explicas, interesaria mucho lo que propusiste de hablar otro video de los embedings o busqueda semantica, creo que es algo de vectores para entender mejor una conversacion como datos o algo asà y me interesa mucho. Muchas gracias
Que bueno que te sirviÃģ el video! Si, ya esta anotado entre los prÃģximos videos el mostrar como hacer la bÚsqueda de textos por medio de embeddings.
Hola, gracias por tus videos, son muy Útiles. SÃ, serÃa genial que puedas hacer un video (si existe esa opciÃģn) explicativo de como "enseÃąar" a GPT3 con informaciÃģn puntual (horarios, lugares, productos, etc) para que sirva de chatbot, para contestar comentarios de preguntas que suelen hacer los clientes.
Hola Jorge, si creo que trabajare en ese video mas adelante, porque si es super importante poder hacerlo sin caer en las alucinaciones de GPT. Saludos!
Apoyo esto, esperando el video !!
@@AMPTech lo mas antes posible por favor!!
â@@AMPTech ð lo espero tambiÃĐn!
SÃ, ÂŋpodrÃas hacer un video sobre bÚsqueda semÃĄntica? Muchas gracias por tus videos.
Excelente video muchas gracias siempre aprendo cosas muy interesantes en tu canal
Y te agradecerÃa mucho si nos pudieras enseÃąar mas sobre bÚsquedas semÃĄnticas con Gpt-3
Gracias por tu comentario! Si, parece que si hay algo de interÃĐs en la bÚsqueda semÃĄntica, lo acabo de agregar a mi lista para prÃģximos videos.
Saludos!
Gracias por tu video amigo, excelente informaciÃģn..., ÂĄsaludos!
Gracias por el comentario ya se vienen mas videos sobre el tema!
Hola! para el proyecto del asistente quizÃĄs te interese echarle un vistazo al proyecto de Open Assistant, muy buen video :D
PodrÃas hacer un fine tunning para entrenar un chatbot especÃfico, por ejemplo de atenciÃģn al pÚblico, donde pueda atender todas las preguntas comunes de una empresa como por ejemplo horarios, direcciones, tipos de servicio, etc
Ya con la API de ChatGPT se puede, aunque el unico inconveniente es que no se puede hacer finetuning y tienes que estar metiendo el contexto y eso gasta muchos tokens y maximo solo utiliza 4096 tokens por llamada
Yo tambiÃĐn quiero que expliquen cÃģmo hacer eso!
@@fastsmartsystem Creo que hay mÃĐtodos para hacer una preseleccion de contexto que ahorre Tokens, un video sobre esto tambiÃĐn estarÃa genial ÂĄgracias!
Por lo que vi el formato de preguntas y respuestas es diferente a este ejercicio y hay varios caracteres especiales que se usan, ahora lo que vi es que para el caso de GPT-3.5 y 4 es diferente, seria bueno hacer un ejemplo, por ejemplo modificando una respuesta como "cual es el mejor equipo del mundo" y que responda siempre el equipo de tu preferencia
armen el discord y vemos que onda igual quiero hacer lo mismo
Muy bueno. Pregunta. ServirÃa el Fine Tuning para dar personalidad al modelo? Por ejemplo, actua como ... ÂŋO hay otra opciÃģn mejor? Muchas gracias
Excelente Alex. Gracias
Chevere tu explicacion , tengo una pregunta es posible fine tunear un modelo fine tuneado sin necesidad de que se cree como un nuevo modelo fine tuning ? Es decir es posible editarlo/actualizarlo en vez de crearlo ?
EstarÃa bueno un video de embeddings + fine t
Espectacular video...
Muchas gracias!
Existe alguna manera para que el modelo de lenguaje Únicamente responda aquellas preguntas que se relacionen con los prompts que montamos? Para dar mayor precisiÃģn a las respuestas del chatbot. Muchas gracias por el contenido !!
Si yo quisiera que respondiera de leyes solo podrÃa trabajar sobre lo ya entrenado o existe alguna manera mÃĄs profunda de hacerlo?
Buen video, seria muy bueno que hicieras uno sobre los emmbedings
Apuntado para los siguientes videos.
Para hacer un chatbot que permita a los usuarios de mi web hacer preguntas sobre el mismo (con un dump de los artÃculos de ayuda, documentaciÃģn, etc) es mejor usar fine tuning o embeddings? Supongo que fine tuning de todo el contenido de base de conocimiento serÃa carÃsimo.
ÂŋCual seria el modelo mas recomendado para un CHATBOT de un Negocio el Fine-Tuning o Embeddings?.
Espero su respuesta. Muchas Gracias
Brutal Alex!
Muchas gracias!
Respondiendo a tu pregunta al final del video : Si, serÃa muy interesante un video explicando mÃĐtodos de respuestas mÃĄs rigurosas como el embedding que sugerÃas y desconozco ÂĄgracias!
Ahorita se cruzaron las vacaciones, pero el siguiente video va as ser sobre los embeddings, va a estar muy interesante.
Saludos!
ÂŋY que opinas de entrenar un modelo por ejemplo en HugginFace?, ÂŋEs posible generar un modelo mÃĄs "personalizado" y acertado?, por ejemplo con el modelo Alpaca.
Genial! muy buen video, lo Único que me estaba enloqueciendo era la pronunciaciÃģn de la letra s en .csv, que la pronuncie como si fuera una c, algo pequeÃąo e insignificante pero que me alcanzaba a incomodar, jaja, perdÃģn por la tonterÃa, por todo lo demÃĄs me encantÃģ el video!, muchas gracias por realizarlo.
Jaja no me habÃa dado cuenta, por andarlo diciendo tan rÃĄpido. Saludos!
Podrias compartir el CSV que ejemplificas en el video? ð. Muy buen video! , Suscripto.
hola amigo, si hicste el video de embeddings? gracias por compartir
14:28 Si por favor haz un video de embeddings ð
hola interesante hare un tuning , suerte a todos, en la nueva ai era!!!!!
Excelente video. SerÃa muy bueno que expliques con la misma claridad que son y como utilizar los embeddings. Muchas gracias!
Hola! Checa en mi canal, uno de los ultimos 5 videos que tengo es sobre embeddings. El nombre del video es "Aprende sobre Embeddings de OpenAI"
Saludos
@@AMPTech muchas gracias!!! Excelente todos el contenido que compartÃs.
Hola Alex. CuÃĄndo serÃa suficiente usar una ai bot como Botpress en lugar de hacer fine tuning?
Yo. intente algo parecido hace tiempo pero mandando a llamar la api de openIA para chatgptt y desde VS y la terminal mandas la pregunta y de ahi mismo la respuesta. q fue. lo q no me agrado por q responde cosas extraÃąas aveces o se vuelve loquita, no hice el fine tuning pero lo intentare a ver si es posible, q debe serlo solo agregando los valores al cÃģdigo ,ya sera buscarle, muy buenos videos siempre bien explicados
Si a veces los modelos no "fine-tuneados" puedes tener respuestas un poco mas variadas aunque el prompt sea muy similar. Mi recomendaciÃģn serÃa probar un poco mas con distintos promts y formatos y ya si no, entonces is pasar al fine-tuning.
DeberÃas hablar de RWKV. Alguien logrÃģ hacer un modelo al nivel de GPT con RNN y tambiÃĐn paralelizable.
Wow
Tienes un link? No creÃa que eso fuera posible
Hola Alex, muchas gracias por el video, muy claro sobre todo para tener una primera idea del tema. Quiero hacerte una consulta: cÃģmo podrÃa hacer para analizar un grupo de libros, y luego hacer consultas que solo abarquen dicho grupo y contenido, pero que se relacionen. Por ejemplo: subir los libros de Harry Potter y luego hacer consultas acerca de cÃģmo fue cambiando un personaje. Debo hacer un entrenamiento? Ya existe alguna plataforma para ello? estoy realmente desorientado. Muchas gracias
En parte entiendo porque OpenAI tuvo que tomar ese camino, aunque como dices, todo termina siendo de los grandes. Afortunadamente estan saliendo muchas iniciativas open source como open assistant, gpt4all, etc. HarÃĐ unos videos sobre estas opciones.
si te agradeceria si haces un video de los embeddings
Hola Alex! Me encantarÃa entender mÃĄs sobre los embeddings de Open AI
EstarÃĄ dentro de los siguientes dos videos que publique!
Hola! cÃģmo me aconsejarÃas montar varios asesores que tomen informaciÃģn relevante de usuarios y con base a eso brinde soluciones o consejos... por ejemplo refinar la data con todos los datos de cada usuario ys e vaya creando para cada uno un modelo y sobre movimientos, transacciones y toda la data existente se retroalimente... alguna idea''???
SerÃa interesante u n videos sobre los proyectos que se pdorian implementar usando esta herramienta
Buen punto, uno dedicado a algunos casos de uso terminarÃa de aterrizar los conceptos. Anotado! Gracias
Me interesÃģ lo de la bÚsqueda semÃĄntica :0! Y muchas gracias por el video :)!!! Aprendà mucho!!
Estoy tomando notas de mi universidad en Obsidian y me interesa empezar a hacer resÚmenes de las mismas en la parte superior de la nota, para cuando tenga que estudiar, pueda ver de un vistazo de quÃĐ se hablÃģ en la clase :)! Cada vez necesito mÃĄs especificaciones en el prompt para que me genere resÚmenes mÃĄs especÃficos, y tal vez lo de la bÚsqueda semÃĄntica pueda ser la respuesta, pero no lo sÃĐ. ÂŋQuÃĐ me recomiendas?
De nuevo, gracias por el video :D!!
Muy buena idea! Yo tambiÃĐn uso obsidian, como todo son .md creo que si se puede. Voy a ver como podria meterlo en alguno de los siguientes videos!
Si creo que con embeddings puedes solucionar una buena parte
Muchas gracias por tus videos. Que tÃĐcnica se puede utilizar para entrenar a Chat GPT a partir de documentaciÃģn tÃĐcnica y evitar las alucinaciones?
Hola Julian, para eso se hace algo llamado bÚsqueda semÃĄntica, en el que vectorizas (con embedding) todos los textos al igual que las preguntas. Y de respuesta, no genera nuevo texto sino que busca el vector mas cercano a la pregunta. Estoy viendo para hacer un video sobre eso.
Saludos!
SerÃa muy interesante tener algo asÃ. ServirÃa por ejemplo si lo entrenamos con leyes, reglamentos o polÃticas, para que ayude con la interpretaciÃģn o a responder cuando tengamos dudas con manuales o normas de una empresa.
@@AMPTech eso quiero. Xq quiero que solo me responda con la teorÃa que le de y no con lo que busque de internet.
No se podrÃa complementar el fine tuning con un prompt definiendo el formato para que la respuesta de gpt sea el correcto haiku?
Hola, gracias por el video. Sabes cuÃĄl serÃa la mejor opciÃģn para que me responda preguntas sobre temas de derecho de un paÃs determinado? Por ejemplo, ingresar los datos correspondientes a las leyes en materia de derecho de seguros de cierto paÃs para que responda cualquier consulta sobre ese tema. Agradezco mucho la orientaciÃģn.
Justo seria el tema de embeddings. Pronto ya vendrÃĄ video de eso!
@@AMPTech Ah perfecto muchas gracias, estarÃĐ muy atento.
Gracias por tu video, nuevo suscriptor!
Puedes hacer un video de busqueda semantica utilizando los embedding de Openai por favor
Muchas gracias Erik, el video de los embeddings sera el proximo. Lo estarÃĐ publicando la semana que viene.
Saludos!
Quisiera hacer fine tuning del modelo Flamingo de deepmind
Super like jaja
Muy bueno. Una duda, que proyectos me recomiendes para llamar la atencion de un hiring manager? Gracias
Para que tipo de vacantes te estas postulando? En general te diria que cualquier proyecto que no sea de los tipicos. Por ejemplo el MNIST no te va a ayudar mucho porque muchos lo hacen, pero un detector de alguna otra cosa te podrÃa servir. Eso y tambiÃĐn encargate de tener actualizado y bien armado tu Github.
Saludos!
@@AMPTech mil gracias! Si, he estado trabajando en mi GitHub desde hace un aÃąo y ya Luce muy Bien. Yo quiero aplicar a vacantes para Data science. Muy bueno tu canal, lo sigo desde El 2020.
Que por quÃĐ no usar localmente el nuevo modelo de Meta âLlaMAâ en lugar de GPT3? Se supone que esta optimizado para tener un rendimiento similar con menos parÃĄmetros y funcionar en una sola grÃĄfica.
Si le eche un ojo. Tal vez despuÃĐs haga un video sobre Llama
Hola me acabo de escribir me fascinan tus videos llevo muchas horas viÃĐndolos, una gran duda quiza algo tonta Âŋhay alguna forma de no usar los tokens de openai y poder de alguna forma entrenar la maquina? me refiero a usar los tokens existentes y rentrenarlos pero sin usar en si nuevos pues con tanta data ya tiene que tener una idea aunque sea vaga de casi cualquier tema y solo es adaptar la informaciÃģn ya esxistente a tu conveniencia Âŋse puede?
Hola Miguel, gracias por tu comentario.
Si lo quieres conectar con GPT3 o GPT4, estas forzado a utilizar su tokenizador. Esto porque su sistema de embedding y el generador de texto esta entrelazados. No se si te refieres a entrenar un modelo de este tipo (LLM), pero estos modelos son muy grandes y toma bastante tiempo y dinero poder llevar a cabo un entrenamiento (Lo mas cercano seria el fine tuning que no es costoso o usar algun modelo mas pequeÃąo que no sea LLM)
Saludos!
Si tuvieras que crear un chatbot que responda preguntas relativas sobre una tienda online con miles de artÃculos, lo mejor serÃa embedding en vez de finetunning. Âŋverdad?
De esta forma se podrÃa preguntar cosas tales como :
- Dime los 5 productos mÃĄs baratos donde tengas en stock mÃĄs de 5 unidades.
- Dime el precio de un lavabo negro
etc..
Gracias
Hola, con respecto a la privacidad de informaciÃģn, si utilizo esta metodologÃa y quiero hacer fine tuning con informaciÃģn relevante para mi, esta informaciÃģn serÃĄ privada o OpenAI puede tener acceso a ella de alguna forma
Muchas gracias
15:05 cuando tengo daily en la maÃąana tambien a veces suena la de los fierros viejos xD
Gracias por el video, sabes que es lo que puedo usar para un detector de un objeto en especifico en un video?
Jaja siempre pasan en el peor momento, el folclor de vivir en la ciudad de mexico. Para poder detectar elementos en un video checa mi video llamado "Entrena YOLOv7 y corre detecciÃģn de los objetos que quieras" Aqui estÃĄ la liga:
th-cam.com/video/wMMu_ReIaHk/w-d-xo.html
algo de los modelos optimizados de meta? que pueden correr localmente
Si tengo en mente hacer video sobre Llama, quiero ver si lo puedo correr en la jetson agx.
que es hyku?
Hola buenas noches, me gustarÃa saber si es posible entrenar la ia con finetunning para que responda sobre una base de datos y que siga usando gpt3-5 o 4, davinci etc. Mantener la IA de gpt
Puedes hacer prompts que le den contexto al modelo, pero no se puede evitar la posibilidad de las alucinaciones.
14:33 Si por favor y gracias.
y como se puede hacer eso usando javascript
Donde esta el video donde se instala openai, me es imposible correrlo desde la consola, ya he aÃąadido los path de windows, pero no hay manera, a ver si alguien , me puede ayudar. Thanks
Oye me surgiÃģ una nueva duda, estos modelos con fine tuning se pueden implementar en servidores de discord para que sean como un bot o algo asi?
Si se puede. Mandando a llamar desde el bot.
PodrÃas profundizar en los embeddings?
Claro! Ve mi ultimo video, es sobre como usarlos y una explicaciÃģn de que son.
th-cam.com/video/-XVkdIdli0I/w-d-xo.html
Saludos!
Que paso con el proyecto de automatizacion que estuvite publicando ?
Todavia voy a publicar varios videos de ese proyecto. Solo que ahorita no he tenido tiempo para dedicarle en forma.
@@AMPTech haha entiendo, :3 yo lo espero :3
Hola eso servirÃa para los modelos mas nuevos como gpt-3.5-turbo o gpt-4? La documentaciÃģn me tiene confundido y no se donde leà que a estos Últimos modelos aun NO tienen la opciÃģn de fine-tuning, alguien que lo confirme o desmienta?
Hay pocas diferencias cuando lo quieras hacer con gpt3.5-turbo
Lo explico en este video, ojalÃĄ te funcione.
th-cam.com/video/Dt14YOtWCpI/w-d-xo.html
@@AMPTech Muchas gracias!! Si ya conseguà hacerlo. Era lo del ChatCompletion
Hola Alejandro. Me gustarÃa contactarte. A dÃģnde te puedo escribir?
soy socia de LegoSoft y estamos trabajando en el desarrollo de una herramienta de AI, nos gustarÃa platicar contigo.
habla de busqueda semantica, y creo que te falto mover la tempeture a 0, que creo que lo que hace es responder simpre exactamente lo mismo y evitar que en segundas respuesta entregue valores o aletoridad
Buenas, la API de ChatGPT es mucho mÃĄs barata, crees que sigue valiendo la pena usar GPT3?
Si, son dos usos distintos. ChatGPT esta diseÃąado para tener conversaciones de prompt corto y completion media. Pero para muchos otros casos de uso no funcionarÃa tan bien. Pero igual que lo que mencionÃĐ al final, hay que probar los modelos que tienen por default (ahora incluido chatgpt) porque para muchos casos de uso puede resultar suficiente.
Una pregunta, se puede hacer fine-tune gratis?
Para GPT3 y 4 no se puede hacer gratis ya que es algo que ocurre del lado de los servidores de openAI.
eres el que hace el doblaje al espaÃąol a Marty Mc Fly??
Jaja no so soy yo!
@@AMPTech ðĪŠ
Como seria para que pueda comunicarse
con mi API
Depende por completo del API que tienes construida. Pero de manera general serÃa predefinir algunos llamados en codigo al rededor de GPT y que las variables que se tengan que enviar las genere GPT.
ObservaciÃģn: El tÃtulo dice Finet en lugar de Fine
Ya no! Jaja muchas gracias JosÃĐ
Buen video, a alguien le pasa el mismo error una y otra vez "Stream interrupted (client disconnected)." ?
Desde la plataforma no te sale algun modelo ya finetuneado?
@@AMPTech Me pasa lo mismo, y no aparece nada desde la plataforma
Hola, en dÃģnde puedo contactarte? Tienes IG o algÚn correo electrÃģnico?
Buen video, a alguien le pasa el mismo error una y otra vez "Stream interrupted (client disconnected)." ?