Excelente video, pero tengo un problema muy recurrente al momento de llamar al modelo desde OLLAMA por web api, "dice que el endpoint no se encuentra" error 404, buscando en la red muchos tienen el mismo problema, sera problema de semantic kernel o del propio ollama ?
Muchas gracias por el material, es decir que yo puedo utilizar este contenido para tener una ia local y estar respondiendo desde una información almacenada de un .txt o . pdf las preguntas que le haga? y si no tratar de responderlas o proveerme un link de ayuda o algo si se lo pido?
probe con postman y me tarda mas de 1 minuto phi3:3.8b y con llama3.2:latest (que era el modelo que tenia ya instalado) tardo menos de 3 segundos en mi laptop. Mucha diferencia. No se supone que en rendimiento es mayor? pesa 2.2 GB el Phi y 2GB el llama.
la respuesta que da phi3.8 es "La capital de Argentina es Buenos Aires. Es no solo el centro político y administrativo del país, sino también su ciudad más grande por población y área metropolitana. Situada en la región noroeste argentina a orillas del Río de La Plata, Buenos Aires posee una rica historia que refleja diversas influencias culturales, especialmente italiana e inglesa, lo cual es evidente en su arquitectura y vida urbana. Además, es un importante centro financiero y cultural dentro del país y alberga varios importantes monumentos históries como la Catedral Metropolitana de Buenos Aires o el Obelisco." y la que da llama3 es La capital de Argentina es Buenos Aires.
Excelente Laucha! gracias
Excelente video, es oro puro, muchas gracias por compartir estas herramientas y el conocimiento
Que buena explicación y tema , suscrito y like
Excelente video, pero tengo un problema muy recurrente al momento de llamar al modelo desde OLLAMA por web api, "dice que el endpoint no se encuentra" error 404, buscando en la red muchos tienen el mismo problema, sera problema de semantic kernel o del propio ollama ?
Muchas gracias por el material, es decir que yo puedo utilizar este contenido para tener una ia local y estar respondiendo desde una información almacenada de un .txt o . pdf las preguntas que le haga? y si no tratar de responderlas o proveerme un link de ayuda o algo si se lo pido?
Lo que queres googlear es RAG. Suerte!
probe con postman y me tarda mas de 1 minuto phi3:3.8b y con llama3.2:latest (que era el modelo que tenia ya instalado) tardo menos de 3 segundos en mi laptop. Mucha diferencia. No se supone que en rendimiento es mayor? pesa 2.2 GB el Phi y 2GB el llama.
la respuesta que da phi3.8 es
"La capital de Argentina es Buenos Aires. Es no solo el centro político y administrativo del país, sino también su ciudad más grande por población y área metropolitana. Situada en la región noroeste argentina a orillas del Río de La Plata, Buenos Aires posee una rica historia que refleja diversas influencias culturales, especialmente italiana e inglesa, lo cual es evidente en su arquitectura y vida urbana. Además, es un importante centro financiero y cultural dentro del país y alberga varios importantes monumentos históries como la Catedral Metropolitana de Buenos Aires o el Obelisco."
y la que da llama3 es
La capital de Argentina es Buenos Aires.