Qu'est-ce que le texte ASCII et comment est-il utilisé ?

Qu'est-ce que le texte ASCII et comment est-il utilisé ?

ASCII est un acronyme que vous avez peut-être entendu en rapport avec le texte informatique, mais c'est un terme qui tombe rapidement en désuétude grâce à un nouveau venu plus puissant. Mais qu'est-ce que l'ASCII et à quoi sert-il ?





Que signifie ASCII ?

Peut-être que l'endroit le plus simple pour commencer est l'acronyme lui-même, alors développons-le :





À américain S standard C ode à je informations je nterchange





Cette bouchée d'une phrase ne donne pas vraiment une image complète, mais certaines parties offrent immédiatement des indices, notamment les deux premiers mots. L'ASCII est une norme américaine dont la signification deviendra bientôt évidente.

Le code pour l'échange d'informations suggère que nous parlons d'un format pour le transfert de données dans les deux sens. Plus précisément, l'ASCII traite des données textuelles : des caractères constituant des mots dans un langage typiquement lisible par l'homme.



L'ASCII résout le problème de l'attribution de valeurs aux lettres et autres caractères afin que, lorsqu'ils sont stockés sous forme de uns et de zéros dans un fichier, ils puissent être retransformés en lettres lors de la lecture ultérieure du fichier. Si différents systèmes informatiques s'entendent sur le même code à utiliser, ces informations peuvent être échangées de manière fiable.

comment ouvrir des fichiers avec java

En rapport: Comment trouver des symboles et rechercher leur signification





L'histoire de l'ASCII

Parfois appelé US-ASCII, l'ASCII était une innovation américaine développée dans les années 1960. La norme a subi de nombreuses révisions depuis, principalement en 1977 et 1986, lorsque l'ASCII a été mis à jour pour la dernière fois.

Les extensions et les variations se sont appuyées sur l'ASCII au fil des ans, principalement pour tenir compte du fait que l'ASCII omet de nombreux caractères utilisés, voire requis, par des langues autres que l'anglais américain. L'ASCII ne prend même pas en charge le symbole monétaire britannique (£), bien que la livre sterling soit présente dans Latin-1, une extension 8 bits développée dans les années 1980, qui code également plusieurs autres devises.





ASCII a été considérablement étendu et remplacé par Unicode, une norme beaucoup plus complète et ambitieuse, qui est discutée ci-dessous. En 2008, Unicode a dépassé ASCII en popularité pour l'utilisation en ligne.

Quels caractères l'ASCII représente-t-il ?

Pour un ordinateur, la lettre A est tout aussi inconnue que la couleur violette ou le sentiment de jalousie. Les ordinateurs traitent des uns et des zéros, et c'est aux humains de décider comment utiliser ces uns et ces zéros pour représenter des nombres, des mots, des images et tout le reste.

Vous pouvez considérer l'ASCII comme le code Morse du monde numérique – la première tentative, en tout cas. Alors que le code Morse est utilisé pour représenter seulement 36 caractères différents (26 lettres et 10 chiffres), l'ASCII a été conçu pour représenter jusqu'à 128 caractères différents dans 7 bits de données.

L'ASCII est sensible à la casse, ce qui signifie qu'il représente 52 lettres majuscules et minuscules de l'alphabet anglais. Avec les mêmes 10 chiffres, c'est environ la moitié de l'espace utilisé.

La ponctuation, les symboles mathématiques et typographiques occupent le reste et une collection de caractères de contrôle, qui sont des codes spéciaux non imprimables avec des significations fonctionnelles - voir ci-dessous pour plus d'informations.

Voici quelques caractères typiques codés en ASCII :

BinaireDécimalPersonnage
010 000133!
011 0000480
011 1001579
011 101159;
100 000165À
100 001066B
101 101090AVEC
101 101191[
110 000197à
110 001098b
111 1101125}

A noter que les valeurs choisies ont quelques propriétés utiles, notamment :

  • Les lettres d'une même casse peuvent toujours être triées numériquement puisqu'elles sont dans l'ordre. Par exemple, A a une valeur inférieure à B, qui a une valeur inférieure à Z.
  • Les lettres de différentes casses sont décalées d'exactement 32. Cela rend très facile la traduction entre les minuscules et les majuscules puisqu'un seul bit doit être commuté pour chaque lettre, de toute façon.

Caractères de contrôle

Outre les lettres, la ponctuation et les chiffres, l'ASCII peut représenter un certain nombre de caractères de contrôle, des points de code spéciaux qui ne produisent pas de sortie à un seul caractère mais fournissent à la place des significations alternatives sur les données à tout ce qui pourrait les consommer.

l'écran tactile android ne fonctionne pas ne peut pas déverrouiller

Par exemple, ASCII 000 1001 est le caractère de tabulation horizontale. Il représente l'espace que vous obtiendrez lorsque vous appuyez sur la touche TAB. Vous ne verrez généralement pas ces personnages directement, mais leur effet sera souvent affiché. Voici d'autres exemples :

BinaireDécimalPersonnage
000 10019Onglet horizontal
000 1010dixSaut de ligne
001 01112. 3Bloc de fin de transmission

Et les autres personnages ?

L'ASCII a connu un énorme succès au début de l'informatique car il était simple et largement adopté. Cependant, dans un monde avec une perspective plus internationale, un seul système d'écriture ne suffira pas. Les communications modernes doivent être possibles en français, en japonais - en fait, dans n'importe quelle langue dans laquelle nous pourrions vouloir stocker du texte.

Le jeu de caractères Unicode peut traiter un total de 1 112 064 caractères différents, bien que seulement environ un dixième de ceux-ci soient actuellement définis. Cela peut sembler beaucoup, mais l'encodage vise non seulement à prendre en charge des dizaines de milliers de caractères chinois, mais également des emoji (près d'un millier et demi) et même des systèmes d'écriture éteints tels que Jurchen.

En rapport: Les 100 emojis les plus populaires expliqués

Unicode a reconnu la prédominance de l'ASCII dans son choix des 128 premiers caractères : ils sont exactement les mêmes que l'ASCII. Cela permet aux fichiers codés ASCII d'être utilisés dans des situations où Unicode est attendu, offrant une compatibilité descendante.

Sommaire

Le texte ASCII représente les 26 lettres de l'alphabet anglais, avec des chiffres, des signes de ponctuation et quelques autres symboles. Il a très bien rempli son rôle pendant presque un demi-siècle,

Il a maintenant été remplacé par Unicode, qui prend en charge un grand nombre de langues et d'autres symboles, y compris les emoji. UTF-8 est, à toutes fins utiles, l'encodage qui doit être utilisé pour représenter les caractères Unicode en ligne.

Partager Partager Tweeter E-mail Cela vaut-il la peine de passer à Windows 11 ?

Windows a été repensé. Mais est-ce suffisant pour vous convaincre de passer de Windows 10 à Windows 11 ?

vous avez récemment été appelé pour résoudre des problèmes de connectivité réseau sur le poste de travail d'un utilisateur
Lire la suite Rubriques connexes
  • La technologie expliquée
  • Jargon
  • Culture Web
  • Unicode
A propos de l'auteur Bobby Jack(58 articles publiés)

Bobby est un passionné de technologie qui a travaillé comme développeur de logiciels pendant près de deux décennies. Il est passionné par les jeux, travaillant comme rédacteur de critiques au Switch Player Magazine, et est immergé dans tous les aspects de la publication en ligne et du développement Web.

Plus de Bobby Jack

Abonnez-vous à notre newsletter

Rejoignez notre newsletter pour des conseils techniques, des critiques, des ebooks gratuits et des offres exclusives !

Cliquez ici pour vous abonner