Unicode (4 & fin). - CHOMOLANGMA

Plan multilingue complémentaire (PMC, 10000 à 1FFFF)

Points de code		Nom officiel du bloc	Commentaires
Début	Fin	Nom officiel du bloc	Commentaires
10000	1007F	Syllabaire linéaire B ou syllabaire mycénien
10080	100FF	Idéogrammes du linéaire B
10100	1013F	Nombres égéens
10300	1032F	Alphabet italique
10330	1034F	Gotique	voir langue Gotique
10380	1039F	Ougaritique	voir langue Ougaritique
10400	1044F	Déséret
10450	1047F	Shavien
10480	104AF	Osmanya
10800	1083F	Syllabaire chypriote
1D000	1D0FF	Symboles musicaux byzantins
1D100	1D1FF	Symboles musicaux occidentaux
1D300	1D35F	Symboles du Classique du mystère suprême
1D400	1D7FF	Symboles mathématiques alphanumériques
1FFFE	1FFFF		non-caractères

Plan idéographique complémentaire (PIC, 20000 à 2FFFF)

Points de code		Nom officiel du bloc	Commentaires
Début	Fin	Nom officiel du bloc	Commentaires
20000	2A6D6	Supplément B aux idéogrammes unifiés CJC
2F800	2FA1F	Supplément aux idéogrammes de compatibilité CJC
2FFFE	2FFFF		non-caractères

Plans complémentaires réservés (30000 à DFFFF)

Points de code		Nom officiel du bloc	Commentaires
Début	Fin	Nom officiel du bloc	Commentaires
3FFFE	3FFFF		non-caractères
4FFFE	4FFFF		non-caractères
5FFFE	5FFFF		non-caractères
6FFFE	6FFFF		non-caractères
7FFFE	7FFFF		non-caractères
8FFFE	8FFFF		non-caractères
9FFFE	9FFFF		non-caractères
AFFFE	AFFFF		non-caractères
BFFFE	BFFFF		non-caractères
CFFFE	CFFFF		non-caractères
DFFFE	DFFFF		non-caractères

Plan complémentaire spécialisé (PCS, E0000 à EFFFF)

Points de code		Nom officiel du bloc	Commentaires
Début	Fin	Nom officiel du bloc	Commentaires
E0000	E007F	Étiquettes
E0100	E01EF	Supplément de sélecteurs de variante
EFFFE	EFFFF		non-caractères

Plans complémentaires à usage privé (F0000 à 10FFFF)

Points de code		Nom officiel du bloc	Commentaires
Début	Fin	Nom officiel du bloc	Commentaires
☒F0000	FFFFD	Zone supplémentaire A à usage privé
FFFFE	FFFFF		non-caractères
☒100000	10FFFD	Zone supplémentaire B à usage privé
10FFFE	10FFFF		non-caractères

Les zones à usage privé indiquées par le symbole ☒ ne contiennent pas les mêmes œils d’une police à l’autre et doivent donc être évités pour le codage de textes destinés aux échanges entre systèmes hétérogènes. Toutefois ces points de codes à usage privé sont valides et peuvent être utilisés dans tout traitement automatisé conforme aux normes Unicode et ISO 10646, y compris entre systèmes différents s’il existe un accord mutuel privé concernant leur usage.

En l’absence d’accord entre les deux parties, des systèmes utilisant ces caractères peuvent rejeter les textes les contenant, car les traitements qu’ils leur font subir pourraient ne pas fonctionner correctement ou causer des problèmes de sécurité; les autres systèmes qui n’attribuent aucune fonction spéciale à ces caractères doivent en revanche les accepter comme valides et les conserver comme partie intégrante des textes, comme s’il s’agissait de symboles graphiques, même s’ils ne savent pas les afficher correctement.

Les non-caractères listés sont des points de code valides, mais ils ne sont pas (et ne seront jamais) assignés à des caractères normalisés. Leur usage dans le codage de textes transmis entre systèmes (même si identiques) est interdit, car il est impossible de les rendre compatibles avec les formes de transformation universelles normalisées (dont UTF-8, UTF-16, UTF-32) les schémas de codage correspondants, et les autres codages normalisés compatibles avec Unicode et ISO 10646 (BOCU-1, SCSU, différentes versions de la norme chinoise GB18030, etc.). Toutefois certains systèmes les génèrent et les utilisent localement, mais pour un traitement strictement interne destiné à faciliter l’implémentation des algorithmes de traitement de textes utilisant les autres caractères normalisés.

Parmi ces derniers non-caractères figurent les points de code valides mais réservés aux demi-zones (privées ou non). Ces points de code ne peuvent pas être utilisés individuellement pour coder un caractère. Ils servent uniquement pour la forme de transformation universelle UTF-16 (et les schémas de codage correspondants) pour représenter sur deux codets (à 16 bits chacun) des points de code valides dans un des 16 plans complémentaires (certaines combinaisons de codets correspondent à des caractères valides de ces plans, standards ou privés, d’autres combinaisons peuvent ne représenter aucun caractère valide car elles correspondraient à des non-caractères de ces plans complémentaires, et sont donc interdites dans les textes conformes à la norme).

Les autres zones libres (non assignées à un bloc nommé normalisé, ou les points de code laissés libres et réservés dans les blocs nommés existants) sont réservés pour un usage ultérieur dans des versions futures d’Unicode et ISO 10646, mais sont valides. Tout système traitant des textes contenant ces points de code réservés doivent les accepter sans les filtrer. Unicode définit des propriétés par défaut pour les hypothétiques caractères correspondants, afin de préserver la compatibilité des systèmes (conformes à la norme Unicode) avec les futurs textes conformes qui les contiendraient. Aucune application conforme ne doit leur assigner un caractère ou une sémantique spéciale (les zones privées sont destinées à cet usage).