Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
projet_scaninvoices:extraction_des_lignes_de_details [2022/09/23 08:26] supadminprojet_scaninvoices:extraction_des_lignes_de_details [2022/11/15 23:09] (Version actuelle) supadmin
Ligne 2: Ligne 2:
  
 (Documentation en cours de rédaction) (Documentation en cours de rédaction)
 +
 +## Préambule - Facture électronique
 +
 +Si la facture de votre fournisseur est au format factur-x par exemple alors celle ci sera directement intégrée dans dolibarr à condition qu'elle soit conforme par rapport à la norme. L'extraction du détail de la facture sera automatique (sous limite de l'implémentation de la norme par l'éditeur du document initial, une information qui n'existe pas ne risque pas d'être inventée).
  
 ## Présentation ## Présentation
Ligne 12: Ligne 16:
  
 Dans le cadre du projet présenté ici il faut noter un point important : d'un côté le serveur d'extraction de données et de l'autre le plugin dolibarr scaninvoices ... les deux sont liés mais n'évoluent pas à la même vitesse, certaines données extraites par le serveur ne sont pas forcément encore exploitées par scaninvoices ! Dans le cadre du projet présenté ici il faut noter un point important : d'un côté le serveur d'extraction de données et de l'autre le plugin dolibarr scaninvoices ... les deux sont liés mais n'évoluent pas à la même vitesse, certaines données extraites par le serveur ne sont pas forcément encore exploitées par scaninvoices !
- 
 ## Liste des champs extraits par le serveur ## Liste des champs extraits par le serveur
  
Ligne 21: Ligne 24:
   * qty : quantité   * qty : quantité
   * tauxtva : taux de tva appliquée sur la ligne   * tauxtva : taux de tva appliquée sur la ligne
-  * tax_value : montant de la tva appliquée sur la ligne+  * tax\_value : montant de la tva appliquée sur la ligne
   * lot : numéro de lot   * lot : numéro de lot
   * ean : code ean   * ean : code ean
   * dlc : date limite de consommation (produit périssable)   * dlc : date limite de consommation (produit périssable)
-  * remise_percent: remise en % appliquée au produit +  * remise\_percent: remise en % appliquée au produit 
-  * unit_price : prix unitaire +  * unit\_price : prix unitaire 
-  * amount_untax : total de la ligne+  * amount\_untax : total de la ligne
   * desc : description détaillée du produit (généralement les lignes suivantes)   * desc : description détaillée du produit (généralement les lignes suivantes)
   * ecopart : éco participation   * ecopart : éco participation
Ligne 34: Ligne 37:
  
 ## Limites ## Limites
- 
 ### Documents numérisés issus d'une photo ou d'un scan ### Documents numérisés issus d'une photo ou d'un scan
  
 Pour l'instant et sauf petite révolution technique chez nous malheureusement ces documents ne sont pas concernés par l'extraction détaillée, trop de parasites entrent en jeux et le résultat n'est pas à la hauteur des objectifs fixés par le projet. Pour l'instant et sauf petite révolution technique chez nous malheureusement ces documents ne sont pas concernés par l'extraction détaillée, trop de parasites entrent en jeux et le résultat n'est pas à la hauteur des objectifs fixés par le projet.
 +
 +En résumé: papier froissé, marque des pliures, présence de taches, qualité d'impression initiale (bavures, bandes verticales) + lourdeur du moteur d'OCR et des outils de nettoyage bitmap
  
 ### Information qui "brouille" le contenu du document ### Information qui "brouille" le contenu du document
Ligne 52: Ligne 56:
 [{{:projet_scaninvoices:pasted:20220922-112228.png?400&direct|document graphique}}] [{{:projet_scaninvoices:pasted:20220922-112228.png?400&direct|document graphique}}]
  
 +
 +### Document incohérent
 +
 +Certaines factures semblent bien parties pour être exploitables ... sauf que tout à coup on ne sait pas pourquoi un article semble vouloir se démarquer des autres ... Exemple avec cette facture où tous les montants des articles sont avec deux chiffres après la virgule sauf un qui en a ... 5 !
 +
 +[{{:projet_scaninvoices:pasted:20220923-124119.png?400&direct|incohérence}}]
  
 ### Lignes et colonnes impossibles à dissocier ### Lignes et colonnes impossibles à dissocier
Ligne 61: Ligne 71:
  
 Il arrive également que certaines factures ne comportent pas assez d'informations pour que l'extraction des lignes puisse être intéressant. C'est particulièrement vrai sur une facture qui n'indique par exemple pas de référence produit ... ou de code (ou de taux) de TVA et qui globalise en fin de document 2 taux de TVA sans aucun moyen de savoir quelle ligne est impactée par quel taux de TVA Il arrive également que certaines factures ne comportent pas assez d'informations pour que l'extraction des lignes puisse être intéressant. C'est particulièrement vrai sur une facture qui n'indique par exemple pas de référence produit ... ou de code (ou de taux) de TVA et qui globalise en fin de document 2 taux de TVA sans aucun moyen de savoir quelle ligne est impactée par quel taux de TVA
 +
 +
 +## Extraire des données = Écrire des expressions régulières
 +
 +Pour extraire des données il faut savoir écrire des [[expressions régulières]] ...