Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
projet_docwizon:dataset:dataset_tickets_de_carburant [2023/12/16 12:30] – supadmin | projet_docwizon:dataset:dataset_tickets_de_carburant [2023/12/20 13:20] (Version actuelle) – supadmin | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
# Dataset des tickets de carburant | # Dataset des tickets de carburant | ||
- | Projet de collecter des photos de tickets de carburants sur https:// | + | Projet de collecter des photos de tickets de carburants sur https:// |
- | [{{ : | + | ## Qualification des données |
+ | |||
+ | [{{ : | ||
Utilisation de l' | Utilisation de l' | ||
- | * choisir la sélection rectangulaire avec deux points de modifications | + | * choisir la sélection rectangulaire avec deux points de modifications |
- | * saisie le texte à l' | + | * main gauche sur le clavier, main droite sur la souris |
+ | * j' | ||
+ | * je patiente et l'OCR indique ce qu'il a trouvé | ||
+ | * j' | ||
+ | * j' | ||
+ | * ensuite je vérifie que l'OCR a bien trouvé les valeurs correspondantes, | ||
+ | * une fois que tout est ok je clique sur le bouton submit | ||
+ | * saisie le texte à l' | ||
* concernant les montants, utiliser uniquement le point même lorsqu' | * concernant les montants, utiliser uniquement le point même lorsqu' | ||
+ | [{{: | ||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
Analyse des données pour constituer un corpus d' | Analyse des données pour constituer un corpus d' | ||
Ligne 18: | Ligne 35: | ||
* Gazole | * Gazole | ||
* Gasoil | * Gasoil | ||
+ | * GO | ||
* SP95 | * SP95 | ||
* SP98 | * SP98 | ||
Ligne 25: | Ligne 43: | ||
+ | ## Exemple de documents à ne pas analyser : SKIP | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: |