Codage des caractères spéciaux


Depuis 1970, tous les informaticiens utilisent le même codage pour représenter les lettres de l'alphabet et d'autres signes qui servent à la communication entre les hommes et les ordinateurs. C'est le code ASCII.
A chaque lettre correspond un nombre qui peut s'écrire dans le système binaire ou décimal. L'ASCII codant chaque caractères sur 7 bits, il ne permets d'utiliser que 128 caractères différents ou plus exactements 96 car 32 sont des caractères de contrôle non imprimables.

Ce n'est cependant pas suffisants pour afficher tout les caractères existants tel que les caractères accentués, mathématiques, grecs,... Alors de nombreuse extensions ont été faites au code ASCII pour avoir des caractéres spéciaux. Mais aucune norme ne s'est véritablement imposée et un document créé sur un type de machine ne pouvait être relu sur une autre car la plupart des caractères ne correspondaient plus.

Sur Internet, la quasi-totalité des documents textes qui circulent sont codés en ASCII. on peut donc utiliser 96 caractéres différents et ils sont lisibles quelquesoit la plate-forme de destination. Pour pouvoir transmettre les caractères spéciaux il fallait un codage reconnus par tous. Le code ISO-8859-1 et les entités ISO Latin-1 répondent à ces besoins.

D'autres systèmes de codages existe. Notamment pour les alphabets d'Europe centrale (ISO 8859-2), cyrilliques (ISO 8859-5), grecs (ISO 8859-7), turcs (ISO 8859-9), japonais, chinois traditionnel et simplifié, coréens,... et Unicode UTF-7 et UTF-8.

Code ASCII

En HTML, les caractères courants utilisés sont ceux du code ASCII. Ils sont accessibles directements au clavier et n'ont pas besoin d'être codés ormis ceux qui ont un rôle dans le formatage du texte comme < > " et &. Dans la pratique seul < (&lt; ou &#60;) et & (&amp; ou &#38;) ont réellement besoin d'être codées.

&#0; ...&#32; caractéres de contrôle non imprimables

&#32; &sp; &sp; espace ( )
&#33; &excl; ! point d'exclamation (!)
&#34; &quot; " guillemet "
&#35; &num; # symbole numéro #
&#36; &dollar; $ symbole dollar $
&#37; &percent; &percent; symbole pourcent %
&#38; &amp; & perluète &
&#39; &apos; ' apostrophe '
&#40; &lpar; ( parenthèse gauche (
&#41; &rpar; ) parenthèse droite )
&#42; &ast; * astérisque *
&#43; &plus; + signe plus +
&#44; &comma; , virgule ,
&#45; &hyphen; ‐ tiret, signe moins -
&#46; &period; . point .
&#47; &slash; &slash; barre oblique /

&#48;...&#57; chiffres 0 ...9

&#58; &colon; : deux points :
&#59; &semi; ; point virgule ;
&#60; &lt; < inférieur à
&#61; &equal; &equal; signe égal à =
&#62; &gt; < supérieur à
&#63; &amp; & point d'interrogation ?
&#64; &at; &at; à commercial @

&#65;...&#90; lettres A ... Z

&#91; &lsqb; [ crochet gauche [
&#92; &bsol; \ barre oblique inversée \
&#93; &rsqb; ] crochet droit ]
&#94; &circ; ˆ accent circonflexe ^
&#95; &lowbar; _ trait bas _
&#96; &grave; ` accent grave `

&#97;...&#122; lettres a ... z

&#123; &lcub; { accolade gauche {
&#124; &verbar; | barre verticale |
&#125; &rcub; } accolade droite }
&#126; &tilde; ˜ tilde ~

Code ISO-8859-1 (Latin-1)

Les caractères spéciaux, accentués, et les symboles qui n'appartiennent pas au code ASCII peuvent être affichés dans une page HTML en utilisant les codes de la table d'entités ISO Latin-1 :

Entités ISO Latin-1

Les entités ISO Latin-1 définissent la façon de coder les caractères spéciaux en ASCII.
Les caractères #128 à #160 ne sont pas définis dans le code ISO Latin-1
82 de ces caractéres existent dans le code Macintosh.
6 existent seulement sur les systèmes Macintosh islandais (Mac isl)
8 caractéres n'existent pas dans le code Macintosh (/Mac)

&#160; &nbsp; espace insécable
&#161; &iexcl; ¡ point d'exlamation inversé
&#162; &cent; ¢ symbole centime
&#163; &pound; £ symbole livre sterling
&#164: &curren; ¤ symbole monétaire
&#165; &yen; ¥ symbole yen
&#166; &brvbar; ¦ barre vertical interrompu (/Mac)
&#167; &sect; § signe section
&#168; &uml; ¨ accent tréma
&#169; &copy; © symbole copyright
&#170; &ordf; ª indicateur ordinal féminin
&#171; &laquo; « guillemet angulaire gauche
&#172; &not; ¬ symbole negation
&#173; &shy; ­ hyphenation tiret temporaire;
&#174; &reg; ® registered
&#175; &macr; ¯ macron
&#176; &deg; ° degré
&#178; &plusmn; ± plus-moins
&#179; &sup2; ² exposant 2 (/Mac)
&#180; &sup3; ³ exposant 3 (/Mac)
&#181; &micro; µ micron
&#182; &para; ¶ paragraphe
&#183; &middot; · point central
&#184; &ccedil; ç c cedille
&#185; &sup1; ¹ exposant 1 (/Mac)
&#186; &ordm; º indicateur ordinal masculin
&#187; &raquo; » guillemet angulaire droit
&#188; &frac14; ¼ fraction un-quart (/Mac)
&#189; &frac12; ½ fraction un-demi (/Mac)
&#190; &frac34; ¾ fraction trois-quart (/Mac)
&#191; &iquest; ¿ point d'interrogation inversé
&#192; &Agrave; À A accent grave
&#193; &Aacute; Á A accent aigu
&#194; &Acirc; Â A accent circonflexe
&#195; &Atilde; Ã A tilde
&#196; &Auml; Ä A tréma
&#197; &Aring; Å A accent rond
&#198; &AElig; Æ AE diphtongue
&#199; &Ccedil; Ç C cedille
&#200; &Egrave; È E accent grave
&#201; &Eacute; É E accent aigu
&#202; &Ecirc; Ê E accent circonflexe
&#203; &Euml; Ë E tréma
&#204; &Igrave; Ì I accent grave
&#205; &Iacute; Í I accent aigu
&#206; &Icirc; Î I accent circonflexe
&#207; &Iuml; Ï I tréma
&#208; &ETH; Ð ETH islandais (Mac isl)
&#209; &Ntilde; Ñ N tilde
&#210; &Ograve; Ò O accent grave
&#211; &Oacute; Ó O accent aigu
&#212; &Ocirc; Ô O accent circonflexe
&#213; &Otilde; Õ O tilde
&#214; &Ouml; Ö O trema
&#215; &times; × signe multiplication (/Mac)
&#216; &Oslash; Ø O barré oblique
&#217; &Ugrave; Ù U accent grave
&#218; &Uacute; Ú U accent aigu
&#219; &Ucirc; Û U accent circonflexe
&#220; &Uuml; Ü U trema
&#221; &Yacute; Ý Y accent aigu (Mac isl)
&#222; &THORN; Þ THORN (Mac isl)
&#223; &szlig; ß double s allemand
&#224; &agrave; à a accent grave
&#225; &aacute; á a accent aigü
&#226; &acirc; â a accent circonflexe
&#227; &atilde; ã a tilde
&#228; &auml; ä a tréma
&#229; &aring; å a accent rond spérieur
&#230; &aelig; æ ae diphtongue
&#231; &ccedil; ç c cedille
&#232; &egrave; è e accent grave
&#233; &eacute; é e accent aigü
&#234; &ecirc; ê e accent circonflexe
&#235; &euml; ë e tréma
&#236; &igrave; ì i accent grave
&#237; &iacute; í i accent aigü
&#238; &icirc; î i accent circonflexe
&#239; &iuml; ï i tréma
&#240; &eth; ð eth islandais (Mac isl)
&#241; &ntilde; ñ n tilde
&#242; &ograve; ò o accent grave
&#243; &oacute; ó o accent aigu;
&#244; &ocirc; ô o accent circonflexe
&#245; &otilde; õ o tilde
&#246; &ouml; ö o tréma
&#247; &divide; ÷ division
&#248; &oslash; ø o barré oblique
&#249; &ugrave; ù u accent grave
&#250; &uacute; ú u accent aigü
&#251; &ucirc; û u accent circonflexe
&#252; &uuml; ü u tréma
&#253; &yacute; ý y accent aigü (Mac isl)
&#254; &thorn; þ (Mac isl)
&#255; yuml; ÿ y tréma

Caractères indéfinis

Il existe, dans le code Macintosh, 32 caractères indéfinis dans le code ISO 8859-1. Pour assurer la correspondance, il est généralement fait usage des positions #128 à #159 du code ISO 8859-1. Ces positions n'ont pas de codes de caractère définis et un choix arbitraire a été fait.
Ces conventions sont suivis par la plupart des applications Internet Macintosh. Il s'agit des caractères suivants :

ISO 8859-1| Code Mac | Caractère Mac
&#128; 0xA5 € balle
&#129; 0xAA  symbole marque de fabrique trademark
&#130; 0xAD ‚ signe non égal à
&#131; 0xB0 ƒ symbole infini
&#132; 0xB3 „ signe supérieur ou égal à,
&#133; 0xB7 … symbole sommation, point de suspension
&#134; 0xBA † symbole intégrale
&#135; 0xBD ‡ majuscule grecque oméga
&#136; 0xC3 ˆ signe racine carrée
&#137; 0xC5 ‰ signe approximativement égal à
&#138; 0xC9 Š point de suspension
&#139; 0xD1 ‹ tiret long
&#140; 0xD4 Πapostrophe gauche
&#141; 0xD9  Y tréma
&#142; 0xDA Ž signe division barre oblique
&#143; 0xB6  symbole dérivée partielle
&#144; 0xC6  majuscule grecque delta
&#145; 0xCE ‘ OE diphtongue
&#146; 0xE2 ’ apostrophe basse
&#147; 0xE3 “ guillemet bas
&#148; 0xE4 ” symbole pour-mille
&#149; 0xF0 • pomme
&#150; 0xF6 – accent circonflexe Macintosh
&#151; 0xF7 — tilde Macintosh
&#152; 0xF9 ˜ accent brève
&#153; 0xFA ™ accent point
&#154; 0xFB š accent rond
&#155; 0xFD › umlaut hongrois
&#156; 0xFE œ ogonek
&#157; 0xFF  caron
&#158; 0xF5 ž lettre i sans point
&#159; 0xC4 Ÿ symbole florin


Christophe Merlet
redfox@redfoxcenter.org
©Tous droits réservés
11 avril 1997