Bonjour , quelle technologie avez vous utilisé(tesseract ? ) comment avez vous fais pour rendre votre extraction aussi precise ? Je travaille actuellement sur projet d'océrisation de facture , et le problème que je rencontre c'est que j'ai une variété énorme dans le format de mes factures , je dirais près de 4000 à 5000 formats différents , et le le problème que je rencontre avec mon OCR(j'utilise tesseract) c'est que ça m'extrait le texte brut sans toute fois tenir compte que c'est une facture(les zones etc...) , ça me récupère les informations ligne par ligne , je ne peu pas labeliser vue le nombre de formats de factures , que me proposez vous pour cela ? bert ou spacy peuvent-ils être utiles dans ce cas ?
Bonjour @stevetedom7398, merci pour votre retour, nous pouvons vous proposer un accompagnement sur votre projet ? Je vous laisse vous diriger vers notre responsable commercial Lewis Etesse (letesse@numy-digit.fr) si cela vous intéresse, bonne journée à vous !
Bonjour , quelle technologie avez vous utilisé(tesseract ? ) comment avez vous fais pour rendre votre extraction aussi precise ? Je travaille actuellement sur projet d'océrisation de facture , et le problème que je rencontre c'est que j'ai une variété énorme dans le format de mes factures , je dirais près de 4000 à 5000 formats différents , et le le problème que je rencontre avec mon OCR(j'utilise tesseract) c'est que ça m'extrait le texte brut sans toute fois tenir compte que c'est une facture(les zones etc...) , ça me récupère les informations ligne par ligne , je ne peu pas labeliser vue le nombre de formats de factures , que me proposez vous pour cela ? bert ou spacy peuvent-ils être utiles dans ce cas ?
Bonjour @stevetedom7398, merci pour votre retour, nous pouvons vous proposer un accompagnement sur votre projet ? Je vous laisse vous diriger vers notre responsable commercial Lewis Etesse (letesse@numy-digit.fr) si cela vous intéresse, bonne journée à vous !