**Ceci est une ancienne révision du document !**
Dataset des tickets de carburant
Projet de collecter des photos de tickets de carburants sur https://carbu.org/
Utilisation de l'outil:
- choisir la sélection rectangulaire avec deux points de modifications
- saisie le texte à l'identique de l'image en respectant majuscules et minuscules
- concernant les montants, utiliser uniquement le point même lorsqu'il y a une virgule
Analyse des données pour constituer un corpus d'apprentissage, il faut extraire:
- Date : la date jour mois année, pas plus, peut être dans différents formats selon les stations jj/mm/YYYY jj/mm/yy ou jj-mm-yy … peu importe le format il faut pouvoir extraire la donnée
- Montant TTC: uniquement le montant, par exemple 78.15 sans le signe € ou EUR ou rien d'autre, uniquement le montant
- Le carburant: les mots clés à rechercher sont du genre
- Gazole
- Gasoil
- SP95
- SP98
- SP98E10
- SANS PLOMB
- …/…