10
votes

ASCII Personnages non lisibles 28, 29 31

Je traite un fichier que j'ai besoin de diviser en fonction du séparateur.

Le code suivant indique les séparateurs définis pour les fichiers que je traite xxx

peut-on expliquer la signification de ces séparateurs spécifiques?

En regardant les codes ASCII, ces séparateurs sont des séparateurs de fichiers, de groupes et d'unités. Je ne comprends pas vraiment ce que cela signifie.

java unicode ascii

0 commentaires

3 Réponses :

1
votes

Ces caractères sont des caractères de contrôle. Ils ne sont pas censés être écrits ou lus par des humains, mais par des ordinateurs. Vous devriez les traiter dans votre programme comme n'importe quel autre caractère.

0 commentaires

32
votes

à cet ici. site Cool!

28 - FS - Fichier séparateur Le fichier séparateur FS est un contrôle intéressant code, car il nous donne un aperçu de la manière que la technologie informatique était organisée dans les années soixante. Nous sommes maintenant utilisé pour les médias d'accès aléatoires comme RAM et les disques magnétiques, mais lorsque l'ASCII standard a été défini, la plupart des données étaient en série. Je ne parle pas seulement communications série, mais aussi stockage série comme les cartes perforées, papier bande et bandes magnétiques. Dans un tel situation, il est clairement efficace un code de commande unique pour signaler la séparation des deux fichiers. les FS a été défini à cet effet.
29 - GS - Groupe séparateur Le stockage des données a été l'un des principales raisons pour un certain contrôle codes pour obtenir dans la définition ASCII. Les bases de données sont la plupart du temps de configuration avec des tables, contenant des enregistrements. Tous enregistrements d'une table ont la même type, mais les enregistrements de tables différentes peut être différent. Le séparateur de groupe GS est définie aux tables séparées dans un série système de stockage de données. Noter que la table de mots n'a pas été utilisé à ce moment et les gens l'ont appelé ASCII un groupe.
30 - RS - séparateur enregistrement Au sein d'un groupe (ou tableau) les dossiers sont séparés avec RS ou fiche séparateur.
31 - États-Unis - Unité séparateur Les éléments de données les plus petits à stocker dans une base de données sont appelées unités dans la définition ASCII. Nous les appeler le terrain maintenant. Le séparateur de l'unité sépare ces champs dans une série environnement de stockage des données. Le plus courant implémentations de bases de données exigent que domaines de la plupart des types ont un fixe longueur. Un espace suffisant dans le dossier est allouée pour stocker la plus grande membre possible de chaque champ, même si ce n'est pas nécessaire dans la plupart des cas. Cela coûte une grande quantité d'espace de nombreuses situations. Le code de contrôle américain permet à tous les champs d'avoir une variable longueur. Si l'espace de stockage de données est limitée, comme dans les années soixante-ce est un une bonne façon de préserver un espace précieux. D'un autre côté est le stockage de série beaucoup moins efficace que la table implémentations entraînées RAM et disque de les temps modernes. Je ne peux pas imaginer un situation dans laquelle les bases de données SQL modernes sont exécutés avec les données stockées sur le papier des bobines de bande ou magnétiques ...

2 commentaires

J'aime mieux cette réponse! Cela me sauve beaucoup de lecture et répond directement à la question.

Bien que cela bénéficierait juste d'ajouter les codes décimaux ASCII donnés dans la réponse choisie. De plus, depuis que je suis venu ici pour m'aider à me débarrasser de ces codes à partir d'un fichier texte que j'ai enregistré à partir d'une application de discussion, ce qui donne aux codes hexagonaux serait bien aussi: 1c, 1d et 1f. Pour comment écrire dans regex, btw, voir ici: Stackoverflow.com/ Questions / 3203190 / Regex-Any-ASCII-CHARACTE R

2
votes

Les caractères de contrôle ASCII vont de 28-31. (0x1c à 0x1f) xxx

Invocation de l'échantillon: xxx

0 commentaires