projet_scaninvoices:expressions_regulieres

**Ceci est une ancienne révision du document !**

Expression régulière ou regex

Permet d'extraire des données dans un bloc de texte

Notes

Voir la documentation basique sur la création des masques d'extraction de données (pour import automatique, expressions régulières)

Syntaxe

  • () : les parenthèses permettent d'indiquer une zone à extraire
  • \w: Caractères alphanumériques, et _
  • \W: Caractères ne composant pas les mots
  • \s+ :
  • \d : Chiffres décimaux
  • \D : Autre chose qu'un chiffre décimal
  • \s : Caractères d'espacement
  • \S : Autre chose qu'un caractère d'espacement

Les {} permettent de définir des répétitions:

  • \d{2} : 2 chiffres
  • \d{4} : 4 chiffres
  • \d{0,5} : entre aucun et 5 chiffres
  • \/ : le / étant réservé il faut le dé-spécialiser en le précédent d'un `\

Premier exemple