Présentation

Article

1 - ÉCHANGE ET RESTITUTION DE CARACTÈRES

2 - CODAGES À MOINS DE 7 MOMENTS

3 - CODAGE À 7 BITS : ASCII OU ISO 646

4 - CODAGES À 8 BITS

5 - CODAGE 16 OU 32 BITS : UNICODE ET ISO 10646

6 - ÉCHANGE DE CARACTÈRES SUR INTERNET

7 - OUTILS DE TRANSCODAGE

8 - CONCLUSION

Article de référence | Réf : H7008 v1

Outils de transcodage
Codage des caractères

Auteur(s) : Jacques ANDRÉ

Date de publication : 10 nov. 2001

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Un codage de caractère est un ensemble de couples associant à chaque caractère un nom et une valeur numérique. Après avoir explicité le concept de caractère (entité abstraite) et celui de glyphe (forme graphique), on présente les divers standards ou normes d’échange de caractères en fonction de la taille des répertoires. On présente notamment les codages Ascii (7 bits, utilisé pour l’américain), Latin-1 (8 bits, utilisé pour les langues de l’Europe de l’ouest) et le nouveau codage universel Unicode (16 bits, couvrant toutes les langues du monde). On montre enfin l’utilisation de ces normes dans le cadre de l’échange d’information sur le web, en particulier pour le courrier électronique (RFC, MIME) et par le biais d’HTML et de XML.

Cet article est essentiellement consacré aux normes d’échanges de caractères, un second article [H 7 012] devant traiter des problèmes d’impression ou d’affichage de ces caractères (c’est-à-dire de ce que l’on nomme souvent les « fontes »). Dans l’introduction du présent article, nous expliquons la différence entre ces domaines et en précisons les limites. Un troisième article [H 7 014] traitera de saisie et notamment des claviers et enfin un quatrième [H 7 358] de multilinguisme.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7008


Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

7. Outils de transcodage

Il existe de nombreux traducteurs ou passerelles permettant de passer d’un de ces codages à un autre. Par exemple :

  • la majorité des logiciels de Microsoft ont leurs propres traducteurs internes. Ainsi avec Word peut-on sauver un fichier avec le codage MS-DOS, ou Unicode, ou HTML (avec charset=windows- 1252), ou Apple, etc ;

  • les Macintosch disposent de l’Apple file exchange ;

  • dans le monde Unix/Linux, recode [13] offre un grand nombre de conversions ;

  • les routeurs de courriers électroniques permettent de transmettre et afficher des messages dans les divers formats cités dans le paragraphe 6.3).

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Outils de transcodage
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - AKIRA (M.) -   Writing Systems of the World : Alphabets, Syllabaries, Pictograms,  -  Charles E Tuttle Co ; ISBN : 0804816549, octobre 1990.

  • (2) - ANDRÉ (J.) -   IsoLatin-1, une norme de codage de caractères européens ? trois caractères français en sont absent !  -  Cahier GUTenberg, no 25, p. 65-77. Voir [18], novembre 1996.

  • (3) - ANDRÉ (J.) -   Iso-Latin-9, euro et typographie française.  -  Document numérique, vol. 2, no 2, p. 231-240 (1998).

  • (4) - AUMONT (S.), DIRLEWANGER (R.) -   Recevoir les accents dans votre messagerie, c’est possible...  -  Document numérique, vol. 2, no 1, p. 93-101 (1998). http://www.cru.fr/listes/apropos/accents.html

  • (5) - BEEBE (N.) -   Fonts for the Unicode Character Set.  -  http://www.math.utah.edu/~beebe/fonts/unicode.html

  • (6) - BIGELOW...

1 Sites Internet

HAUT DE PAGE

1.1 Normes et standards de codage de caractères

Alphabet phonétique international/IPA : http://www.arts.gla.ac.uk/IPA/ipa.html

EBCDIC : http://www4.ibm.com/software/ts/mqseries/support/faqs/conver16.html/ http://anubis.dkuug.dk/i18n/charmaps/

ISO 2022 : http://www.iso.ch/catf/d22747.html

ISO 8859 : http://babel.alis.com/codage/iso8859/

Latin-9 : LABONTÉ (A.) et EVERSON (M.). – Épreuve finale pour l’alphabet latin no 9 : http://www.indigo.ie/egt/standards/iso8859/8859-15-fr.pdf

Latin-10 : EVERSON (M.), CD pour l’alphabet latin no 10 : http://www.indigo.ie/egt/standards/iso8859/cd8859-16-fr.pdf

Standard Roman Character Set d’Apple : http://developer.apple.com/techpubs/mac/Text/Text-30.htmlMARKER-9-69

STIX : Proposition pour le codage des caractères MathML : http://www.ams.org/STIX/

UNICODE :...

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS