Cara, eu to com uns arquivos em pdf que queria extrair em lote, eles tem o mesmo formato, mas um pouco da informação ta em texto sem tabulação e as vezes ocorre quebra de linha e o restante está em tabulação, eu não consigo por nada com python, olhei uma quantidade de videos sobre, usei chat gpt e o que parece ser simples, ta se tornando coisa de outro mundo já ... mas teu conteúdo é muito bom e direto, obrigado!
eu tava assim tbm, usei o numpy e pandas, e tudo que é logica e maluquice. eu não imaginei que daria tanto trampo. consegui mas eu queria achar um jeito sem esse trampo todo
Cara, eu to com uns arquivos em pdf que queria extrair em lote, eles tem o mesmo formato, mas um pouco da informação ta em texto sem tabulação e as vezes ocorre quebra de linha e o restante está em tabulação, eu não consigo por nada com python, olhei uma quantidade de videos sobre, usei chat gpt e o que parece ser simples, ta se tornando coisa de outro mundo já ... mas teu conteúdo é muito bom e direto, obrigado!
po irmão estou com o mesmo problema, se souber de alguma dica ou algum vídeo que te ajudou me avise, obrigado.
eu tava assim tbm, usei o numpy e pandas, e tudo que é logica e maluquice. eu não imaginei que daria tanto trampo. consegui mas eu queria achar um jeito sem esse trampo todo
Para extrair os dados de um pdf de nota fiscal, como podemos fazer?
Nesse caso acho que seria melhor utilizar a biblioteca pdf2
para mim ocorre o seguinte erro AttributeError: module 'tabula' has no attribute 'read_pdf'
tem que instalar o tabula-py com o pip