9
votes

java.text.Collator traite "v" et "w" comme la même lettre pour la langue / locale suédoise

Le test suivant réussit correctement avec Java 8.

Comparator<String> stringComparator = Collator.getInstance(new Locale("sv", "SE"));

Assert.assertTrue(stringComparator.compare("aaaa", "bbbb") < 0);
Assert.assertTrue(stringComparator.compare("waaa", "vbbb") < 0);
Assert.assertTrue(stringComparator.compare("vaaa", "wbbb") < 0);

Ceci commande waaa avant vbbb et vaaa code > avant wbbb . Apparemment, il traite v et w comme la même lettre.

En fait, selon Wikipedia, en langue suédoise:

En 2006, l'utilisation de "W" avait augmenté en raison des nouveaux mots d'emprunt. "W" est donc officiellement devenu une lettre et la règle de tri "V" = "W" est devenue obsolète. Les livres et logiciels antérieurs à 2006 utilisent généralement la règle. Une fois la règle obsolète, certains livres et logiciels ont continué de l'appliquer.

Quelqu'un a-t-il une solution générale à ce problème, de sorte que v et w soient traités comme des lettres séparées dans les paramètres régionaux suédois?

java java-8

5 commentaires

Bizarre! Je peux confirmer que c'est toujours le cas dans les bibliothèques Java 10.

Peut docs.oracle.com/javase/tutorial/i18n/text/rule .html d'aide?

Êtes-vous sûr d'utiliser le java.text.Collator standard? Comme ce type a une méthode getInstance plutôt que newInstance et implémente Comparator