Cómo utilizar GPT4-VISION para EXTRAER INFORMACIÓN de un PDF

Productomania

มุมมอง 9 053

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 31 ต.ค. 2024

ความคิดเห็น • 33

@productomania 10 หลายเดือนก่อน ⁺⁴
He grabado también un TUTORIAL de 45 MINUTOS en el que explico PASO A PASO cómo he creado el escenario de MAKE, lo he incluido en el CURSO de AUTOMATIZACIÓN DE PROCESOS con IA: productomania.io/curso-automatizacion
@Sebasdice 10 หลายเดือนก่อน ⁺⁴
Eres el mas duro en automatización en español. Gracias por tus videos!
@joseguillermocastro4333 10 หลายเดือนก่อน ⁺¹
Mi canal favorito de IA con ejemplos reales ✌️
@DeIdeaANegocio 10 หลายเดือนก่อน ⁺¹
Juan te superas con este tipo de contenido, que grande 👏🏼
@maribelmed 10 หลายเดือนก่อน
Muchas gracias, era uno de mis vídeos más esperados
@futboladicto2239 10 หลายเดือนก่อน
Muy buena Juan, síguele así yo muy pronto tomaré el curso👍🏻👍🏻
@TICdoc_ 10 หลายเดือนก่อน ⁺¹
Muy buena herramienta el Make. Imagino que el paso de pdf a imagen para extraer texto o json después, se podría optimizar extrayendo directamente del pdf que no dejan de ser conjuntos de texto, posiblemente dependerá cómo se haya hecho el pdf, será más o menos fácil.
@maynorelias3725 9 หลายเดือนก่อน
Qué vides tan buenos, suscrito y compartido; más sobre GPTs!! xD
@productomania 9 หลายเดือนก่อน
Gracias!
@AcademyNoCode 10 หลายเดือนก่อน
Muy top el canal Juan. Congratzs🎉
@javieralvarezgarcia1147 10 หลายเดือนก่อน
Muy buena!
@rommelleon9429 หลายเดือนก่อน
Esta demasiado bueno el video, me gustaria probar el escenario, donde podemos encontrar el escenario para importarlo. Si no es mucha molestia o ya no esta disponible 😕
@braindraw1512 21 วันที่ผ่านมา
Buen dia. Como puedo contactarlo para un servicio
@EkhyOk 10 หลายเดือนก่อน ⁺¹
No podemos confiar en chatgpt ni para sacar información tan básica como un folleto de hoteles.
Y vemos que anuncian la ampliación de los contextos pero queda demostrado que es más impreciso todavía con cantidades grandes de información.
@Lgurruchaga04 8 หลายเดือนก่อน
Juan. Estos esquemas o prompt de sistema, los debes crear desde 0 o desde donde se puede bajar un ejemplo y modificarlo segun la funcion?
@productomania 8 หลายเดือนก่อน
Hola! Los debes crear desde cero, pero aquí tienes algunos ejemplos que pueden servirte de inspiración: platform.openai.com/examples
@garyjo3229 9 หลายเดือนก่อน
Una pregunta esa plataforma donde haces la llamada a gpt es ? Make?
@rgarcialobo 5 หลายเดือนก่อน
Hola Juan! Muchas gracias por tus explicaciones. Quería preguntarte si te sigue funcionando el escenario por el tema de la URL de drive. Yo estoy teniendo problemas al probarlo con gpt-4o
@productomania 5 หลายเดือนก่อน
Sí, acabo de probar a migrar a gpt-4o y me funciona, ¿qué error te da?
@rgarcialobo 5 หลายเดือนก่อน
@@productomania No reconoce la imagen y creo que es por la URL, me pasa tanto en Google Drive como en OneDrive. Con ambos me indica esto: [400] You uploaded an unsupported image. Please make sure your image is below 20 MB in size and is of one the following formats: ['png', 'jpeg', 'gif', 'webp']. Es un .png y pesa 51kb.
Sin embargo subí la imagen a firebase y con su URL sin problema.
También lo he realizado subiendo a Cloudinary las imágenes desde make y con la URL también funciona. El problema es que meto más módulos en el camino y otra aplicación más con sus costes asociados.
@productomania 5 หลายเดือนก่อน
@@rgarcialobo ¿Le estás pasando el 'web content link'? Porque Drive también te devuelve el 'web view link', pero ese no sirve.
@rgarcialobo 5 หลายเดือนก่อน
@@productomania Este error me da con 'web content link', con 'web view link' me daba otro. Muchas gracias Juan por tu atención!
@fernandoz6329 10 หลายเดือนก่อน ⁺¹
Muy interesante e ingenioso(y suscripto tambien)! El proceso asume que toda la información del hotel se encuentra en una página? ¿Que sucede si la información de un hotel queda distribuida en 1 o 2 páginas? Se podría consolidar dicha información?
@productomania 10 หลายเดือนก่อน
En una petición a GPT4-Vision puedes enviarle varias imágenes a analizar, podrías enviarle en cada petición siempre 2 o 3 imágenes para solventar el caso que comentas y después asegurarte de alguna forma que no se añade en GSheets información duplicada.
@mariocamachomolina2372 10 หลายเดือนก่อน ⁺¹
Cómo puedo acceder a GPT4-visión desde España ?
@jose.andonaire 10 หลายเดือนก่อน
Hola Juan, cual seria la mejor forma de poder tener llamadas a la API de OpenAI, pero en la cual se quiera poder limitar a cantidad de tokens, de esa forma poder tener un presupuesto determinado por consulta o por IP de la persona que hace la consulta y no se vaya todo el saldo en ello, ya que yo lo hice con un formato JSON pero identificando por filas dividiendo la data en cierta cantidad de caracteres con un delay hacia adelante y hacia atras para que tenga un contexto mejor, pero a veces no da toda la información relacionada
@ofjdaz 10 หลายเดือนก่อน
Hola, que pasa si un hotel no tiene la info completa en una pagina? Es suficientemente inteligente como para entender que tiene que esperar la siguiente imagen? Me pareció que no.
@productomania 10 หลายเดือนก่อน
Buena pregunta. En una misma petición puedes enviarle varias imágenes, podrías enviarle en cada petición siempre la imagen siguiente para resolver ese problema y luego verificar de alguna forma que no añade al GSheets información duplicada.
@ofjdaz 10 หลายเดือนก่อน
La otra duda que tengo, puedes guardarlo a una base de datos como mongo? Etc?
@productomania 10 หลายเดือนก่อน
Sí, Make tiene integración con Mongo: www.make.com/en/integrations/mongodb
@cesarcoronel2402 10 หลายเดือนก่อน ⁺¹
Por qué es mejor pasar el pdf a imágenes para que lo analice, no se puede simplemente pedir que extraiga la información del pdf?
@productomania 10 หลายเดือนก่อน
La API de GPT4-Vision no admite PDFs, solo imágenes.
@achilledup1121 6 หลายเดือนก่อน
Yo creo que el tutorial esta interesante pero una persona que nunca a usado make como yo, va muy perdida...

ต่อไป

เล่นอัตโนมัติ

The ultimate AI SCRAPER is Finally COMPLETE!!