J'ai eu ce problème aujourd'hui: p>
Cette regex correspond uniquement en anglais: Si j'ai besoin de soutien pour une langue dans ce monde, quelle regex devrais-je écrire? p> [a-za-z0-9] code>. p>
3 Réponses :
Si vous utilisez des raccourcissements de classe de caractères et un moteur de Regex au courant de l'Unicode, vous pouvez le faire. La classe méfiez-vous de certaines saveurs de regex qui ne le font pas si bien: JavaScript utilise ASCII pour \ w code> correspond à "caractères Word" (lettres, chiffres et soulignements). P>
\ d code> (chiffres) et
\ w code>, mais unicode pour
\ s code> (blancspace). XML fait-il l'inverse. P>
Cela dépend fortement de la syntaxe de langue / regex que vous utilisez. [[: alpha:]]] code> est probablement plus standard.
Et si je ne veux pas de chiffres?
alphabet / lettre: numéro: donc pour allownum match pour toutes les langues , vous pouvez utiliser: Je cherchais un moyen de remplacer tous les caractères non alphanum pour toutes les langues avec une Espace en JS et a fini par utiliser la manière suivante pour le faire: P> \ p {l} code>
\ p {n} code> p>
[\ p {l} \ p {n}] + code> p>
const regexForNonAlphaNum = new RegExp(/[^\p{L}\p{N}]+/ug);
someText.replace(regexForNonAlphaNum, " ");
regex supportant la plupart des langues p>