Wenn Sie nicht Wörter suchen, sondern Zeichenketten, wie z.B. Kontonummern, Bankleitzahlen finden wollen, die nach einem festen Muster definiert sind, können Sie in der iQ.Suite mit „Regulären Ausdrücken“ nach Mustern in Zeichenketten suchen.
Beschrieben wird die Verwendung der „Regulären Ausdrücke“ am Beispiel der „International Bank Account Number“ [IBAN].
Die deutsche IBAN ist z.B. nach folgendem Muster aufgebaut:
DExx xxxx xxxx xxxx xxxx xx
(DE steht für Deutschland, p für die Prüfziffer, b für die Bankleitzahl und k für die Kontonummer)
In den meisten Ländern ist der Ländercode der einzige Buchstabencode in der IBAN, aber es gibt auch Länder, wie etwa Frankreich, in denen sowohl Bankleitzahl als auch Kontonummern Buchstaben enthalten.
In diesem Beispiel wird davon ausgegangen, dass die Bankleitzahl und Kontonummer aus Ziffern besteht. Durch die unterschiedlichen Regeln kann die IBAN zwischen 18 und 32 Zeichen lang sein.
Step by Step
Erstellen eines „Wall Mail Job Advanced“ Dokumentes
- Stellen Sie in „Operations“ die „vorbereitenden“ Tools (Unpacker/Konvertierer/Textnormalisierer) ein
- Wählen Sie das Analysetool für „Regulär Expressions“ (Unicode Analyzer for Regular Expressions) aus
- Wählen Sie die zu prüfenden Teile der E-Mail aus
- Wählen Sie die von Ihnen erstellte Textliste/Dictonary (Kategorie „Bank“) aus und definieren Sie mit dem Schwellenwert, wie häufig das Textmuster in der E-Mail erkannt werden muss.
Die restlichen Einstellungen nehmen Sie wie gewohnt vor.