â° Por si tienes prisa, checa los temas por minuto en el vÃdeo: 00:00 IntroducciÃģn 01:41 Lectura de los archivos PDF desde el directorio 03:28 Extraer los datos del PDF y guardarlos en un dataframe 09:37 Descargar archivo CSV 10:21 Descargar archivo Excel
Un excelentÃsimo aporte estimada, lo estaba buscando por mucho tiempo. Gracias. Aunque no sea mucho molestar, ÂŋpodrÃas subir el texto de los cÃģdigos usados, favor? Nuevo suscriptor. ð
excelente video me gusto mucho es justamente lo que estoy buscando, unicamente como le puedo hacer si no tengo, en la linea donde tienes los if y preguntas o buscas la linea de nombre de asignatura como puedo buscar en un pdf sin tener algo en especifico es puro texto pero sin nada en comÚn pero ocupo leer parte de mi pdf y los ejemplos que he hecho me lee todo el pdf, muchas gracias
Hola, un saludo, desde Colombia, me parece excelente tu aporte, estoy muy interesado en la automatizacion de tareas adminstrativas y este aporte me parece genial , muchas gracias con compartir su trabajo...
EstÃĄ muy bueno, pero que pasarÃa si el PDF no estÃĄ estructurado de esa manera, que pasarÃa por ejemplo si estÃĄ el nombre de una secciÃģn y debajo el valor que quiero extraer, como serÃa en ese caso
Hola, me encanta como explicas. De casualidad puedes explicar un nuevo video agregando las librerÃa de ocr (opencv y pyserator) mas pandas para que en lugar de PDF sea un jpg. Es que te entiendo mas ð
Hola disculpa tengo una pregunta y quÃĐ pasa si el texto que quiero estÃĄ como una celda al lado del tÃtulo en un pdf? Por ejemplo se tiene el tÃtulo Orden de Compra en una celda y al frente(en otra celda) estÃĄ esa informaciÃģn porque fue hecho en excel ese pdf??
Hola, sacar datos de pdf son de esas actividades que te dan ganas de llorar ðĒ y buscando me encontrÃĐ con este tuto que lo veo genial!!! Aclaro no se nada de programaciÃģn, pero he alucinando de lo que se puede hacer!!! Pregunta..... Ya tengo Python instalado y lo estoy trabajando por sublime text. Se debe hacer desde el navegador de con Drive?? O se puede hacer localmente com sublime. Nuevo Sub âĪâĪâĪ
ÂĄMuchas gracias por tan amable comentario! ^_^ sin problema lo puedes hacer desde sublime, solo hay que cambiar la ruta de acceso y ÂĄListo! nos da mucho gusto saber que el vÃdeo te fue de utilidad ;)
Muchas gracias por la aportaciÃģn. Quisiera saber si el cÃģdigo puede buscar en facturas, el nÚmero, fecha, importe total e IVA de cualquier tipo de factura, contando que a veces vienen en inglÃĐs, de Amazon, AliExpress...etc. muchas gracias por compartir su sabidurÃa
Si, si los campos estÃĄn bien definidos se puede extraer esa informaciÃģn, en el caso de que haya campos en inglÃĐs, se puede agregar en el If, la alternativa para la traducciÃģn por ejemplo if 'Nombre' | 'Name' in line
@@cctmexico MuchÃsimas gracias, asà le irÃĐ incorporando palabras clave/sinÃģnimos para que encuentre los datos. Hace un gran trabajo, verÃĐ sus otros vÃdeos!
Muchas gracias por el tutorial, he seguido los pasos pero al ejecutarlo solo me muestra los nombres de los archivos y el resto de las columnas quedan en blanco.
Hola muy buen video, pero como serÃa el caso que en un PDF no estÃĐ escrito el Nombre de la asignatura ni nada, solo que me salga el Plan de estudio y Clave. Al momento de leer cada PDF me saldrÃĄ error y quisiera evitar eso poniendo un 0 o un texto vacÃo, Gracias.
buen video no habia encontrado videos del tecnm yo estudio en el de alvaro obregon , justo tengo que hacer lo mismo para mi proyecto de residencia solo que tengo que extraer los datos de un pdf y no se si pands permita insertar los datos en un word Âŋ podrian ayudarme ?
ÂĄMuchos saludos al Tec de Ãlvaro ObregÃģn! puedes enviar los datos directamente a un Excel (minuto 10:31) y despuÃĐs hacer combinaciÃģn de correspondencia para insertar los datos datos en Word
@@cctmexico es mi primera ves uando python y django por ende pandas ð Âŋ sera posible un video con mi caso en particular ? lo que realmente necesita el modulo que desarrollo es : cuando se detecte una palabra clave digamos resultados me devuelva esos datos pero en columna , tan lineal en esas palabras clave no estan eficiente , es un pdf clinico
@@arturoalvarado5294 Este vÃdeo puede ser de utilidad, para la parte de evaluar condiciones: th-cam.com/video/h2yDbU1VDsI/w-d-xo.html y en lugar de usar Django puedes usar Streamlit que es una maravilla!! aquà te dejamos la lista de reproducciÃģn: th-cam.com/play/PLgHCrivozIb0uvT1H_UtpH6Ftt60PI03Y.html
Esta buenisimo para extraer texto de un pdf pero que pasa si esos items fueran nombres de columnas y quiero iterar los datos numericos que se encuentran en cada uno de ellos? Gracias!
Y me podrias ayudar con un proyecto que tengo? Como te puedo contactar? ðĒ Necesito ideas ya que estoy usando phyton, dispongo de archivos pdf que xontienen diferente informacion de clientes y estas las debo comparar con informaciÃģn que esta en un archivo excel, si existe igualdad de datos deberia quedar check de lo contrario que se cree un reporte con las diferencias, me ayudas???? ðĒðĒ Sigo varios de tus videos pq son bastante educativos, gracias
Hola Tengo una situaciÃģn, quiero extraer los datos de mi conferencia de situaciÃģn fiscal en formato PDF pero al momento de correr el cÃģdigo, en varias columnas me arroja NONE, pero en otras si me da el valor del PDF, que puedo hacer para extraer todos los valores? ð
Hola, me parece maravilloso, es justo lo que necesito para solucionar un tema en el trabajo, pero no encuentro el codigo fuente, puedes compartirlo por favor?
opino lo mismo, entiendo que quizÃĄs no pone el cÃģdigo por un doble motivo, primero por que sino no verÃan el video completo, segundo por que ir escribiÃĐndolo uno mismo hace que entiendas mejor como funciona. En mi caso llegue aquà por un problema para detectar texto en negrita y otros formatos.
Muchas gracias por tu video y tu buena explicaciÃģn,sin embargo no se si me puedas ayudar, cuando ejecuto el codigo me sale el siguiente error: TypeError: 'module' object is not iterable
Hola una consulta como podria leer un cuadro de un pdf? que se encuentra los datos como si fuera un excel con en la parte superior que tipo de dato es y abajo enlistado...
My interesante gracias ! Soy novato , querria saber como se haria sin solo coger la pagina [0] es decir juntar texto de toas las paginas de los pdf . Gracias
â° Por si tienes prisa, checa los temas por minuto en el vÃdeo:
00:00 IntroducciÃģn
01:41 Lectura de los archivos PDF desde el directorio
03:28 Extraer los datos del PDF y guardarlos en un dataframe
09:37 Descargar archivo CSV
10:21 Descargar archivo Excel
Un excelentÃsimo aporte estimada, lo estaba buscando por mucho tiempo. Gracias.
Aunque no sea mucho molestar, ÂŋpodrÃas subir el texto de los cÃģdigos usados, favor?
Nuevo suscriptor. ð
Genial, lo que estaba buscando!!! MuchÃsimas gracias...
excelente video me gusto mucho es justamente lo que estoy buscando, unicamente como le puedo hacer si no tengo, en la linea donde tienes los if y preguntas o buscas la linea de nombre de asignatura como puedo buscar en un pdf sin tener algo en especifico es puro texto pero sin nada en comÚn pero ocupo leer parte de mi pdf y los ejemplos que he hecho me lee todo el pdf, muchas gracias
Hola, un saludo, desde Colombia, me parece excelente tu aporte, estoy muy interesado en la automatizacion de tareas adminstrativas y este aporte me parece genial , muchas gracias con compartir su trabajo...
Muchas gracias por dejarnos tan amable comentario y muchos saludos hasta la hermosÃsima Colombia!
Excelente video, muy Útil, muchas gracias
ÂĄMuchas gracias ^_^ por el lindo comentario y por vernos, saludos!
Increible! Me sirvio, muchas gracias por la ayuda y la explicacion. Se valora mucho este contenido +1 Sub
ÂĄNos da mucho gusto saber que te fue de utilidad! Muchas gracias por la sub ;)
EstÃĄ muy bueno, pero que pasarÃa si el PDF no estÃĄ estructurado de esa manera, que pasarÃa por ejemplo si estÃĄ el nombre de una secciÃģn y debajo el valor que quiero extraer, como serÃa en ese caso
EstÃĄ muy interesante la pregunta, vamos a generar un PDF y lo probamos en diferentes posiciones, a ver como reacciona el cÃģdigo :)
Hola, me encanta como explicas.
De casualidad puedes explicar un nuevo video agregando las librerÃa de ocr (opencv y pyserator) mas pandas para que en lugar de PDF sea un jpg.
Es que te entiendo mas ð
Creo que pudiera ser algo muy similar a lo que buscas, lo que hago en este vÃdeo: th-cam.com/video/ULBm11G_1BI/w-d-xo.html
Hola disculpa tengo una pregunta y quÃĐ pasa si el texto que quiero estÃĄ como una celda al lado del tÃtulo en un pdf? Por ejemplo se tiene el tÃtulo Orden de Compra en una celda y al frente(en otra celda) estÃĄ esa informaciÃģn porque fue hecho en excel ese pdf??
Hola, sacar datos de pdf son de esas actividades que te dan ganas de llorar ðĒ y buscando me encontrÃĐ con este tuto que lo veo genial!!! Aclaro no se nada de programaciÃģn, pero he alucinando de lo que se puede hacer!!! Pregunta..... Ya tengo Python instalado y lo estoy trabajando por sublime text. Se debe hacer desde el navegador de con Drive?? O se puede hacer localmente com sublime. Nuevo Sub âĪâĪâĪ
ÂĄMuchas gracias por tan amable comentario! ^_^ sin problema lo puedes hacer desde sublime, solo hay que cambiar la ruta de acceso y ÂĄListo! nos da mucho gusto saber que el vÃdeo te fue de utilidad ;)
hola, seria mucho pedir si puedes hacer una ejecutable de ese programa que hiciste y subirlo a youtube, por favor
intresante pero no se nada de esto como creo las carpetas y todo en si porfavor si tienes algun curso
Muchas gracias, me ha sido de gran utilidad. Seria bueno compartiera algÚn link con el cÃģdigo para evitar errores al copiarlo del vÃdeo.
Muchas gracias por la aportaciÃģn. Quisiera saber si el cÃģdigo puede buscar en facturas, el nÚmero, fecha, importe total e IVA de cualquier tipo de factura, contando que a veces vienen en inglÃĐs, de Amazon, AliExpress...etc. muchas gracias por compartir su sabidurÃa
Si, si los campos estÃĄn bien definidos se puede extraer esa informaciÃģn, en el caso de que haya campos en inglÃĐs, se puede agregar en el If, la alternativa para la traducciÃģn por ejemplo if 'Nombre' | 'Name' in line
@@cctmexico MuchÃsimas gracias, asà le irÃĐ incorporando palabras clave/sinÃģnimos para que encuentre los datos. Hace un gran trabajo, verÃĐ sus otros vÃdeos!
ÂĄMucho ÃĐxito! ^_^@@Cris-ko6dh
@@Cris-ko6dh jaja estoy buscando lo mismo
que chevere se ve
muchas gracias
Excelente video, habra alguna posibilidad de que me guies para yo convertir mis pdf a .csv (su formato es distinto al que propones)
Muchas gracias por el tutorial, he seguido los pasos pero al ejecutarlo solo me muestra los nombres de los archivos y el resto de las columnas quedan en blanco.
Hola muy buen video, pero como serÃa el caso que en un PDF no estÃĐ escrito el Nombre de la asignatura ni nada, solo que me salga el Plan de estudio y Clave. Al momento de leer cada PDF me saldrÃĄ error y quisiera evitar eso poniendo un 0 o un texto vacÃo, Gracias.
buen video no habia encontrado videos del tecnm yo estudio en el de alvaro obregon , justo tengo que hacer lo mismo para mi proyecto de residencia solo que tengo que extraer los datos de un pdf y no se si pands permita insertar los datos en un word Âŋ podrian ayudarme ?
ÂĄMuchos saludos al Tec de Ãlvaro ObregÃģn! puedes enviar los datos directamente a un Excel (minuto 10:31) y despuÃĐs hacer combinaciÃģn de correspondencia para insertar los datos datos en Word
@@cctmexico es mi primera ves uando python y django por ende pandas ð Âŋ sera posible un video con mi caso en particular ? lo que realmente necesita el modulo que desarrollo es : cuando se detecte una palabra clave digamos resultados me devuelva esos datos pero en columna , tan lineal en esas palabras clave no estan eficiente , es un pdf clinico
@@arturoalvarado5294 Este vÃdeo puede ser de utilidad, para la parte de evaluar condiciones: th-cam.com/video/h2yDbU1VDsI/w-d-xo.html y en lugar de usar Django puedes usar Streamlit que es una maravilla!! aquà te dejamos la lista de reproducciÃģn: th-cam.com/play/PLgHCrivozIb0uvT1H_UtpH6Ftt60PI03Y.html
Esta buenisimo para extraer texto de un pdf pero que pasa si esos items fueran nombres de columnas y quiero iterar los datos numericos que se encuentran en cada uno de ellos? Gracias!
PodrÃa ser que los datos extraidos se pasen a un dataframe de Pandas y despuÃĐs utilizar algo como: th-cam.com/users/shortskL7FrlCHTkA
@@cctmexico Gracias! Lo probarÃĐ!
se le puede conectar alguna api como gemini ?
ÂĄSeguro que si! si encontramos algo similar, se los dejamos aquà en el canal :)
quÃĐ bien, cÃģmo se podrÃan extraer las respuestas de un formulario editable PDF
Y me podrias ayudar con un proyecto que tengo? Como te puedo contactar? ðĒ Necesito ideas ya que estoy usando phyton, dispongo de archivos pdf que xontienen diferente informacion de clientes y estas las debo comparar con informaciÃģn que esta en un archivo excel, si existe igualdad de datos deberia quedar check de lo contrario que se cree un reporte con las diferencias, me ayudas???? ðĒðĒ Sigo varios de tus videos pq son bastante educativos, gracias
esta perfecto!
Se puede extraer datos de un documento PDF censurado ?
Hola
Tengo una situaciÃģn, quiero extraer los datos de mi conferencia de situaciÃģn fiscal en formato PDF pero al momento de correr el cÃģdigo, en varias columnas me arroja NONE, pero en otras si me da el valor del PDF, que puedo hacer para extraer todos los valores? ð
ÂŋQuÃĐ tipo de datos, es donde te arroja el None?
Hola, me parece maravilloso, es justo lo que necesito para solucionar un tema en el trabajo, pero no encuentro el codigo fuente, puedes compartirlo por favor?
opino lo mismo, entiendo que quizÃĄs no pone el cÃģdigo por un doble motivo, primero por que sino no verÃan el video completo, segundo por que ir escribiÃĐndolo uno mismo hace que entiendas mejor como funciona.
En mi caso llegue aquà por un problema para detectar texto en negrita y otros formatos.
Muchas gracias por tu video y tu buena explicaciÃģn,sin embargo no se si me puedas ayudar, cuando ejecuto el codigo me sale el siguiente error: TypeError: 'module' object is not iterable
Tal vez sea un error de dedo, porque parece que estas usando una variable que no se puede usar en un ciclo For (donde dice que es no iterable)
Hola una consulta como podria leer un cuadro de un pdf? que se encuentra los datos como si fuera un excel con en la parte superior que tipo de dato es y abajo enlistado...
My interesante gracias ! Soy novato , querria saber como se haria sin solo coger la pagina [0] es decir juntar texto de toas las paginas de los pdf . Gracias
with open('OPE.pdf', 'rb') as pdf_file:
# Crea un objeto PDFReader
pdf_reader = PyPDF2.PdfReader(pdf_file)
texto_com = ''
indpag=len(pdf_reader.pages)
for num_pagina in range(indpag):
pagina = pdf_reader.pages[num_pagina]
texto_pagina=pagina.extract_text()
texto_com +=texto_pagina
lines=texto_com.split('
')
Aportazo ð
y si en una linea tengo 3 datos distintos. como lo puedo hacer
Si los datos tienen nombre de campo, se pueden extraer, por ejemplo: Nombre de vÃdeo----,Nombre de canal----
Tengo una duda, espero puedas responderme, estoy tratando de extraer estÃĐ cÃģdigo 085-2023, del siguiente pÃĄrrafo: RESOLUCION GERENCIAL REGIONAL N° 000085-2023-GRLL-GGR-GRTC
puede subir el cÃģdigo fuente?
Cuando dejamos algo de cÃģdigo lo encuentras en la caja de descripciÃģn del vÃdeo, saludos!
existe split.lines()
super
Se puede usar cuando un pdf tiene varios hojas?
Sii :D