Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
projet_docwizon:dataset:dataset_tickets_de_carburant [2023/12/16 11:44] – supadmin | projet_docwizon:dataset:dataset_tickets_de_carburant [2023/12/20 13:20] (Version actuelle) – supadmin | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
# Dataset des tickets de carburant | # Dataset des tickets de carburant | ||
- | Projet de collecter des photos de tickets de carburants sur https:// | + | Projet de collecter des photos de tickets de carburants sur https:// |
+ | |||
+ | ## Qualification des données | ||
+ | |||
+ | [{{ : | ||
+ | |||
+ | Utilisation de l' | ||
+ | * choisir la sélection rectangulaire avec deux points de modifications (mauve, autocomplete) | ||
+ | * main gauche sur le clavier, main droite sur la souris | ||
+ | * j' | ||
+ | * je patiente et l'OCR indique ce qu'il a trouvé | ||
+ | * j' | ||
+ | * j' | ||
+ | * ensuite je vérifie que l'OCR a bien trouvé les valeurs correspondantes, | ||
+ | * une fois que tout est ok je clique sur le bouton submit | ||
+ | * saisie le texte à l' | ||
+ | * concernant les montants, utiliser uniquement le point même lorsqu' | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
Analyse des données pour constituer un corpus d' | Analyse des données pour constituer un corpus d' | ||
Ligne 9: | Ligne 35: | ||
* Gazole | * Gazole | ||
* Gasoil | * Gasoil | ||
+ | * GO | ||
* SP95 | * SP95 | ||
* SP98 | * SP98 | ||
Ligne 14: | Ligne 41: | ||
* SANS PLOMB | * SANS PLOMB | ||
* .../... | * .../... | ||
+ | |||
+ | |||
+ | ## Exemple de documents à ne pas analyser : SKIP | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: |