• Keine Ergebnisse gefunden

Etude de quelques expressions régulières couramment rencontrées rencontrées

(cas fournis par google support: https://support.google.com/a/answer/1371417?hl=fr#Match-Exact-Phrase-Only)

2.2.6.1. Cas 1 : Correspondance avec une expression exacte uniquement

Exemple: Rechercher une correspondance avec l'expression "stock tips".

###Possibilité de définition 1 : (\W|^)stock\stips(\W|$)

##Possibilité de définition 2 : (\W|^)stock\s{0,3}tips(\W|$)

##Possibilité de définition 3 : (\W|^)stock\s{0,3}tip(s){0,1}(\W|$) Remarques cas 1

\W désigne tout caractère qui n'est pas alphanumérique(lettre, chiffre ou un trait de soulignement). Ce métacaractère exclut la possibilité d'existence des caractères figurant avant ou après la proposition.

^ désigne le début d'une nouvelle ligne. Ce métacaractère indique à l'expression régulière de renvoyer la proposition si elle apparaît au début d'une ligne, c'est-à-dire sans caractère devant.

\s désigne un caractère d'espacement

Dans la possibilité 2, \s et {0,3} indique que zéro à trois espaces peuvent figurer entre les mots stock et tips.

$ désigne la fin d'une ligne. Ce métacaractère indique à l'expression régulière de renvoyer la proposition si elle apparaît à la fin d'une ligne, c'est-à-dire sans caractère derrière.

Dans la possibilité 3, (s) correspond à la lettre s et {0,1} indique que la lettre peut apparaître zéro ou une fois après le mot "tip".

Ainsi, l'expression régulière fait référence à stock tip et à stock tips. Vous pouvez également utiliser le caractère ? à la place de {0,1}.

2.2.6.2. Cas 2 :Correspondance avec un mot ou une expression figurant dans une liste

Exemple: Rechercher une correspondance avec tout mot ou toute expression parmi les mots suivants : baloney , darn, drat, fooey, gosh darnit,heck

###Possibilité de définition:

127 (\W|^)(baloney|darn|drat|fooey|gosh\sdarnit|heck)(\W|$)

Remarques cas 2

(...) regroupe tous les mots, de sorte que la classe de caractère \W s'applique à tous les mots figurant à l'intérieur des parenthèses.

\W désigne tout caractère qui n'est pas une lettre, un chiffre ou un trait de soulignement. Ce métacaractère évite que l'expression régulière ne prenne en compte des caractères figurant avant ou après les mots ou les propositions de la liste.

^ désigne le début d'une nouvelle ligne. Ce métacaractère indique à l'expression régulière de renvoyer le mot s'il apparaît au début d'une ligne, c'est-à-dire sans caractère devant.

$ désigne la fin d'une ligne. Ce métacaractère indique à l'expression régulière de renvoyer le mot s'il apparaît à la fin d'une ligne, c'est-à-dire sans caractère derrière.

| désigne un "ou", de sorte que l'expression régulière corresponde à n'importe quel mot de la liste.

\s désigne un espace. Utilisez cette classe de caractères pour séparer les mots d'une proposition.

2.2.6.3. Cas 3 :Correspondance avec un mot présentant des variantes orthographiques ou des caractères spéciaux

Exemple: Rechercher une correspondance avec le mot "viagra" et certaines autres orthographes pouvant être utilisés par les spammeurs telles que :

vi@gra , v1agra, v1@gra, v!@gr@

###Possibilité de définition:

v[i!1][a@]gr[a@]

Remarques cas 3:

Le métacaractère \W n'a pas été inclus dans l'expression de sorte que d'autres caractères puissent apparaître avant ou après chaque variante orthographique de viagra.

Par exemple, l'expression régulière correspond quand même à viagra dans les exemples suivants : viagra!! ou ***viagra***

[i!1] désigne les caractères i, ! ou 1 qui peuvent apparaître en deuxième position dans le mot.

2.2.6.4. Cas 4 : Correspondance avec une adresse e-mail sur un domaine

spécifique

128 Exemple: Rechercher une correspondance dans toutes les adresses e-mail des domaines yahoo.com, hotmail.com et gmail.com.

###Possibilité de définition:

(\W|^)[\w.+\-]{0,25}@(yahoo|hotmail|gmail)\.com(\W|$) Remarques cas 4

\W désigne tout caractère qui n'est pas une lettre, un chiffre ou un trait de soulignement. Ce métacaractère évite que l'expression régulière ne prenne en compte des caractères figurant avant ou après l'adresse e-mail.

^ désigne le début d'une nouvelle ligne. Ce métacaractère indique à l'expression régulière de renvoyer l'adresse si elle apparaît au début d'une ligne, c'est-à-dire sans caractère devant.

$ désigne la fin d'une ligne. Ce métacaractère indique à l'expression régulière de renvoyer l'adresse si elle apparaît à la fin d'une ligne, c'est-à-dire sans caractère derrière.

[\w.\-] renvoie tout caractère de mot (a-z, A-Z, 0-9 ou un trait de soulignement), un point, un signe plus ou un tiret.

Ce sont les caractères valides les plus couramment utilisés dans la première partie d'une adresse e-mail. Notez que \- (désignant un tiret) doit figurer à la fin de la liste de caractères incluse entre crochets. Sachez qu'il n'est pas nécessaire d'utiliser le caractère d'échappement \ pour le point situé entre crochets. Il ne signifie pas ici n'importe quel caractère. La barre oblique inversée \ figurant avant le tiret et le point (du .com) indique que le tiret et le point ne sont pas des caractères spéciaux appartenant à la syntaxe de l'expression régulière. Ils doivent être renvoyé quoi qu'il en soit. {0,25} indique que 0 à 25 caractères de la série précédente peuvent apparaître avant le signe @. Le paramètre de messagerie relatif à la conformité du contenu autorise une expression régulière à renvoyer jusqu'à 25 caractères pour chaque série de caractères.

Les parenthèses (...) regroupent les domaines et la barre verticale | qui les sépare signifie "ou".

2.2.6.5. Cas 5 :Correspondance avec une adresse IP comprise dans une plage

Exemple: Rechercher une correspondance avec toute adresse IP comprise dans la plage allant de 192.168.1.0 à 192.168.1.255.

###Possibilité de définition 1 : 192\.168\.1\.

###Possibilité de définition 2 : 192\.168\.1\.\d{1,3}

Remarques cas 5

129 La barre oblique inversée \ figurant avant chacun des points est un "caractère d'échappement" : elle indique que les points ne sont pas des caractères spéciaux appartenant à la syntaxe de l'expression régulière.

Dans l'exemple 1, aucun caractère ne vient après le dernier point, de sorte que l'expression régulière représente toute adresse IP commençant par 192.168.1., quel que soit le nombre qui suit.

Dans l'exemple 2, \d désigne tout chiffre compris entre 0 et 9, et {1,3} indique qu'un à trois chiffres peuvent figurer après le dernier point.

Dans ce cas, l'expression régulière représente toute adresse IP complète, commençant par 192.168.1.. Sachez que cette expression peut également renvoyer des adresses IP incorrectes, telles que 192.168.1.999.

2.2.6.6. Cas 6 : Correspondance avec un format alphanumérique

Exemple: Rechercher une correspondance dans les numéros de bons de commande de votre entreprise. Ils peuvent se présenter sous des formats différents, tels que :

PO nn-nnnnn ,PO-nn-nnnn , PO# nn nnnn ,PO#nn-nnnn, PO nnnnnn où le n sont des chiffres.

ex: PO-25-2456

###Possibilité de définition:

(\W|^)PO[#\-]{0,1}\s{0,1}\d{2}[\s-]{0,1}\d{4}(\W|$) Remarques cas 6

\W désigne tout caractère qui n'est pas une lettre, un chiffre ou un trait de soulignement. Ce métacaractère évite que l'expression régulière ne prenne en compte des caractères figurant avant ou après le numéro.

^ désigne le début d'une nouvelle ligne. Ce métacaractère indique à l'expression régulière de renvoyer le numéro s'il apparaît au début d'une ligne, c'est-à-dire sans caractère devant.

$ désigne la fin d'une ligne. Ce métacaractère indique à l'expression régulière de renvoyer le numéro s'il apparaît à la fin d'une ligne, c'est-à-dire sans caractère derrière.

[#\-] représente un signe dièse ou un tiret figurant après les lettres PO et {0,1} indique que ces caractères peuvent apparaître zéro ou une fois.

Notez que \- (désignant un tiret) doit figurer à la fin de la liste de caractères incluse entre crochets.

## \s représente un espace et {0,1} indique qu'il peut apparaître zéro ou une fois.

130

## \d correspond à tout chiffre compris entre 0 et 9, et {2} indique que deux chiffres exactement doivent figurer à cette position du numéro.