Je suis un débutant à Java et j'essaie de me comprendre et de m'expliquer comment cela fonctionne pour la boucle. Les instructions disent que cela convertissait l'équivalent d'unicode numérique pour chaque lettre de chaque mot en utilisant des boucles.
Basé sur ma compréhension La boucle pour la boucle traverse tout le mot en utilisant la longueur de la longueur (), puis la stocke comme int i, qui est transmise dans la parenthèse de I du charat. Charat renvoie chaque caractère dans le mot, puis l'INT le convertit en int qui est stocké comme finalint. P>
Donc, ma question est d'où vient le numéro Unicode? Comment sait-il que c'est unicode? p>
3 Réponses :
Le caractère Java est basé sur Unicode P>
Les informations de caractère sont basées sur la norme UNICODE, version 6.0.0. P> blockQuote>
https://docs.oracle.com /javase/7/docs/api/java/lang/character.html P>
En outre, Char et Int peuvent se convertir. Veuillez vous reporter à: Convertir en vers Char à Java P>
Merci beaucoup pour le matériel de référence. Je vais les regarder. J'essaie de trouver la recherche qui couvre cela, mais apparemment, je ne savais pas assez pour savoir ce que je cherchais. Merci beaucoup!! Savez-vous s'il existe une liste de ce que chaque personnage représente dans Unicode? J'ai rencontré beaucoup de listes, mais je ne sais pas lequel est correct.
@Jackietowns Wikipedia a un Liste des caractères Unicode , mais vous pouvez trouver d'autres sites Web plus accessible. La dernière liste officielle est conservée sur le site pour le consortium Unicode: Unicode.org . Il y a environ 138 000 caractères défini jusqu'à présent et en croissance. Si vous êtes un utilisateur Mac, téléchargez le UNICODechecker app.
Vérifiez la table ASCII - http://www.asciditable.com/
Votre code transforme une char (dernière colonne) dans sa représentation numérique (première colonne). P>
Wow!! Ceci est extrêmement utile !! Je cherchais ce genre de chose !! Pouvez-vous expliquer pourquoi les chiffres sont répertoriés en décembre? Est-ce que cela signifie décimal ou quelque chose? Et pourquoi est-il inscrit comme ça si cela ne vous dérange pas? Et je sais que je pourrais être répété mais où l'Unicode entrera-t-il dans tout cela? Je ne peux pas sembler relier Unicode et ASCII ....
@Jackietowns Oui, décimal (base10), hexadécimal (base 16), octal (base 8) et entité de caractère HTML. Et Unicode est un superset d'ASCII. Voir Wikipedia pour plus d'informations sur tout ça.
@Jackietowns et lisez ceci: Le minimum absolu Chaque développeur doit absolument connaître des ensembles Unicode et de caractères (aucune excuse!) i>
@Basilbourque merci beaucoup pour tout le matériel de référence !!
Cette référence est pour ceux qui parlent d'ASCII ou d'ANSI et pouvaient être confondus ou incertains comment les utiliser correctement ou comment apprendre Unicode. Les utilisateurs Java n'ont besoin que de lire la documentation Java pour apprendre un Char code> est une unité de code UTF-16 et que UTF-16 est l'un des codages de plusieurs caractères du jeu de caractères Unicode. Nous savons tous que nous n'utilisons pas ASCII, à droite?
assez pour expliquer le concept que je suppose;)
Utilisation de Java, comment est ce
Charat () code> Tournez une chaîne en int? p> blockQuote>
Le java
chaîne code> modélise une chaîne en tant que tableau de
char code> (pas
int code>). Donc
Charat CODE> est simplement d'indexer le tableau (conceptuel). Donc, vous dire que la chaîne est em> valeurs entier ... représentant des caractères. P>
(sous la hotte, différentes versions de Java utilisent réellement une variété d'approches de mise en œuvre. Dans certaines versions, la représentation réelle n'est pas un
Char [] code>. Mais c'est tout caché de site ... et vous pouvez l'ignorer en toute sécurité. sup> p>
Donc, ma question est d'où vient le numéro Unicode? p> blockQuote>
Il provient du code qui a créé la chaîne
code>; c'est-à-dire que le code que tel appelé
nouvelle chaîne (...) code>. p>
si la chaîne code> code> est construite à partir d'un
char [] code>, on suppose que les caractères de la matrice sont des codesUnits UTF-16 dans une séquence qui est une représentation UTF-16 valide. P> li>
si la chaîne code> est construite à partir d'un
octet [] code>, la séquence d'octets est décodé em> à partir de certains codages spécifiés ou implicites. Si vous fournissez un codage (E.G.
Charset code>) qui sera utilisé. Sinon, le codage par défaut de l'application em> est utilisé. De toute façon, le décodeur est responsable de la production d'unicode valide. P> li> ul>
Parfois, ces choses se cassent. Par exemple, si votre application fournit un
octet [] code> codé dans un codage et indique le constructeur code> Constructeur code> Il s'agit d'un codage différent, vous êtes susceptible d'obtenir non-sens UNICODE dans le
Chaîne code>. Souvent appelé Mojibake . p>
Comment ça sait que c'est unicode? p> blockQuote>
chaîne code> est conçu pour être basé sur unicode. P>
Le code qui doit savoir em> est le code qui forme les cordes d'autres choses. La classe code> string code> suppose simplement que le contenu informatique est significatif. (À un niveau ... ça ne se soucie pas. Vous pouvez remplir une chaîne
code> avec malformée UTF-16 ou non-sens total. La chaîne
code> enregistre et reproduit fidèlement le non-sens .) p>
Cela dit, il y a une erreur importante dans votre code. P>
La méthode
charat code> ne renvoie pas de code de code unicode. Une chaîne est principalement modélisée en tant que séquence de codeUnits UTF-16 et
Charat code> renvoie ceux em>. p>
Les codes de code Unicode sont en fait des nombres dans la plage de plage 0 hex sub> à 10effondt hex sub>. Cela ne rentre pas dans un
char code> ... qui est limité à 0 heex sub> à FFFF hex sub>. P>.
utf-16 code des points de code Unicode dans 16 bits CodeUnits. Donc, la valeur renvoyée par
Charat code> représente un point de code unicode entier (pour les points de code dans la plage 0 hex sub> à FFFF hex sub>) ou le haut ou partie inférieure d'un point de code (pour des points de code plus grande que FFFF hex sub>). P>
Si vous voulez code> String CODE> Pour renvoyer (Terminer) CODEPOINTS UNICODE, vous devez utiliser
string.codepointat code>. Mais il est important de lire attentivement les Javadocs pour comprendre comment la méthode doit être utilisée. (Il peut être plus simple d'utiliser la méthode
string.codepoints () code>.) P>
En tout cas, ce que cela signifie que votre code n'attribue pas un code de code unicode à
finalint code> dans tous les cas. Cela fonctionne pour les caractères Unicode dans le BMP (code de code zéro) mais pas les avions de code supérieurs. Il se cassera pour les points de codes Unicode pour Emojis, par exemple. P>
Char CODE> est un type numérique qui devrait être représentable comme un caractère. Conversion de
INT code> vient d'expose la valeur numérique sous-jacente.
Ahh, je pense que cela ajoute un peu de clarification! Je vais devoir me rappeler que! Merci!