... lorsqu'il est utilisé dans des motifs tels que Quelle est la liste définitive de tous les caractères intégrés pris en charge classés? Où est-il documenté? Quelles sont les significations exactes? P>
Il semble y avoir beaucoup de réponses "RTFM", se référant à la Javadoc pour La réponse "correcte" mentionnera "l'incombinationDiaCriticalmarks" quelque part sur la page, et ne sera pas une référence vague aux "normes Unicode". P> "\\ p {somecharacterclass}" code>.
J'ai utilisé / vu certains: p>
édité ... h3>
modèle code>. C'est le premier endroit où j'ai regardé avant de poser cette question. Juste pour que tout le monde soit clair, le Javadoc for Standing ne mentionne aucune des classes énumérées ci-dessus. P>
5 Réponses :
La spécification est http: // docs .oracle.com / Javase / 6 / Docs / API / Java / Util / Regex / Pattern.HTML . Dans certains cas, il fait référence au TUS pour une version particulière, vous pouvez trouver ce matériau à http://unicode.org . p>
Ouais j'ai lu modèle Javadoc avant de poster cette question. Quel est le lien exact à la page qui répertorie toutes les classes et leurs significations?
Regardez dans les Javadocs pour le motif < / a> classe. p>
Ouais j'ai lu modèle Javadoc avant de poster cette question. Quel est le lien exact à la page qui répertorie toutes les classes et leurs significations?
C'est dans le lien Javadoc que j'ai posté. C'est la page précise, sauf si je ne comprends pas votre question.
Où est "IncombinateDiaCriticalmarks" sur cette page? (C'est une question rhétorique. Ce n'est pas là). Je souhaite le lien vers la liste complète et la définition de chaque classe de caractères pris en charge.
Modérateurs, veuillez noter: c'est un autre cas d'une réponse de la mine étant distinguée pour le vote des années après le fait. Aucun des autres sur la page ne sont pas révélés. Je ne peux pas m'empêcher de penser que c'est ciblé.
API de modèle dit pour adhérer au niveau d'expression régulier 1 tel que défini par http: //www.unicode. org / rapports / TR18 / P>
Il y a trois belles tables (recherche UCD.HTML) et regardez UCD.HTML elle-même. P>
Le Documentation pour Les catégories prises en charge sont celles de la norme UNICODE dans la version spécifiée par la classe de caractères. Les noms de catégorie sont ceux définis dans la norme, à la fois normatif et informatif. Les noms de bloc pris en charge par modèle sont les noms de bloc valides acceptés et définis par Le Documentation pour Les noms de blocs sont déterminés par la norme UNICODE. P>
blockQuote> sur http://unicode.org Il y a la FAQ Où puis-je trouver la liste définitive des blocs Unicode? : P> A: Les blocs Unicode et leurs noms sont une partie normative de la norme UNICODE. La liste exacte est toujours conservée dans l'un des fichiers du base de données de caractères Unicode , Enfin, dans Ces caractères sont disponibles dans le combinaison Marques diagritiques graphique de code (de graphiques de code de caractères UNICODE 6.0 ). P> p> modèle code> A> dit dans la section "Support Unicode":
unicodeblock.forname code>. p>
BlockQuote>
unicodeblock.forname code>
états: p>
blocks.txt code>
. p>
blockQuote> blocks.txt code>
il y a La ligne: p>
Cette page a de bons détails pour quelques classes populaires comme: < / p>
\ p {l} code> ou \ p {lettre} code>: n'importe quel type de lettre de n'importe quelle langue. LI>
-
\ p {m} code> ou \ p {mark} code>: un caractère destiné à être combiné avec un autre caractère (par exemple, des accents, des UMLAUTS, des boîtes à enfermer, etc.) . li>
-
\ p {n} code> ou \ p {numéro} code>: n'importe quel type de caractère numérique dans n'importe quel script. LI>
ul>
Avez-vous vérifié le
motif Code> Documentation
?@Greghewgill Oui je l'ai fait vérifier ... Es-tu? C'est là que j'ai regardé d'abord et il n'y a aucune mention de ce qui précède, pas de liens avec des pages qui ne font ni
Voir les sections intitulée "Cours de caractères POSIX", "Java.lang.Character Classes" et "Unicode Support": Les catégories prises en charge sont celles de la norme UNICODE dans la version spécifiée par la classe de caractères. Les noms de catégorie sont ceux définis dans la norme, à la fois normatif et informatif. Les noms de bloc pris en charge par modèle sont les noms de bloc valides acceptés et définis par Unicodeblock.forname. I>
@Greghewgill OK, cool. Donc, exactement quel est le lien vers la page qui énumère toutes ces réponses et leurs significations?
Je suis allé à
unicodeblock.forname code> qui a conduit à Unicode.org , où j'ai trouvé Où puis-je trouver la liste définitive des blocs UNICODE? et enfin
blocks.txt code> lui-même.
@Greghewgill que le lien est un bon début, mais cela ne définit pas ce que chaque classe signifie. La plupart sont évidents par leur nom, mais par exemple, quel est le match code> classes code>?
Le fichier
blocks.txt code> Note de la plage de points de code, alors obtenez ensuite le tableau de code de cette plage: unicode.org/charts/pdf/ue000000.pdf (Je ne sais pas ce que ces" balises "sont utilisées non plus.)
@Greghewgill OK, bonne réponse. Si vous postez une réponse avec cela, je l'accepterai! Merci pour votre ténacité.
@Greghewgill BTW, ces "balises" sont des caractères ASCII avec littéralement une petite étiquette de bagages sous chacune - Regardez-les ici