ISO 15924, Коды для обозначения названий письменностей, определяет два набора кодов для ряда письменностей. Каждой письменности присваивается два кода — числовой и содержащий четыре буквы.
Письменностью считается «набор графических символов, используемых для письменной формы одного или более языков». Поэтому письменности, которые (пока) не «используются для письменной формы языка» недвусмысленно исключены.
Там где это возможно коды получают из ISO 639-2, в котором название письменности и имя использующего её языка совпадают (пример: Гуджарати ISO 639 guj, ISO 15924 Gujr) [1]. Предпочтение отдаётся Библиографическим кодам из 639-2, отличающихся от Терминологических кодов, которые в других случаях используются чаще.
Коды ISO 15924, состоящие из 4 букв включены в реестр меток языков IETF меток языков и поэтому могут быть использованы в файловых форматах, использующих такие метки. Например, они могут быть использованы в HTML и XML чтобы помочь браузерам определить какой шрифт использовать для инородного текста. Таким образом, можно различать, например, Сербский язык написанный кириллицей (sr-Cyrl) или латиницей (sr-Latn), или помечать романизированный текст как таковой.
Поддержка
ISO назначило регистрирующим органом стандарта Unicode Consortium. В 2004 году регистратором был назначен Майкл Эверсон.[2]
Коды письменностей
Численные диапазоны
- 000-099 Иероглифические и клинописные письменности
- 100-199 Алфавитные письменности, читаемые справа налево
- 200-299 Алфавитные письменности, читаемые слева направо
- 300-399 Алфавитно-слоговые письменности
- 400-499 Слоговые письменности
- 500-599 Идеографические письменности
- 600-699 Нерасшифрованные письменности
- 700-799 (не присвоены)
- 800-899 (не присвоены)
- 900-999 Коды для частного и специального использования, псевдонимы
Специальные коды
- Qaaa 900 Зарезервирован для частного использования (начало) (2004-05-29)
- Qabx 949 Зарезервирован для частного использования (конец) (2004-05-29)
- Zinh 994 Код для унаследованной письменности
- Zmth 995 Математические обозначения (2007-11-26)
- Zsym 996 Символы (2007-11-26)
- Zxxx 997 Код для бесписьменных языков
- Zyyy 998 Код для неопределенной письменности
- Zzzz 999 Код для некодированной письменности
Qaaa-Qabx — 50 кодов для частного использования. Диапазон Qaaa-Qabx упоминается не в самом стандарте, а в списке кодов.
Список кодов
Код | № | Название | Псевдоним | Версия | Символы | Примечание |
---|---|---|---|---|---|---|
Adlm | 166 | Адлам (англ.)русск. | нет в Unicode | |||
Afak | 439 | Афака | нет в Unicode | |||
Aghb | 239 | Агванское письмо | 7.0 | 53 | Древняя/историческая | |
Ahom | 338 | Ахом (письмо) | нет в Unicode | |||
Arab | 160 | Арабское письмо | Arabic | 1.0 | 1,051 | |
Aran | 161 | Арабское письмо (насталик) | ||||
Armi | 124 | Арамейское письмо | Imperial_Aramaic | 5.2 | 31 | Древняя/историческая |
Armn | 230 | Армянское письмо | Armenian | 1.0 | 90 | |
Avst | 134 | Авестийский алфавит | Avestan | 5.2 | 61 | Древняя/историческая |
Bali | 360 | Балийское письмо | Balinese | 5.0 | 121 | |
Bamu | 435 | Бамум | Bamum | 5.2 | 657 | |
Bass | 259 | Басса Вах | нет в Unicode | |||
Batk | 365 | Батакское письмо | Batak | 6.0 | 56 | |
Beng | 325 | Бенгальское письмо | Bengali | 1.0 | 92 | |
Blis | 550 | Блиссимволика | нет в Unicode | |||
Bopo | 285 | Чжуинь (Бопомофо) | Bopomofo | 1.0 | 70 | |
Brah | 300 | Брахми | Brahmi | 6.0 | 108 | |
Brai | 570 | Шрифт Брайля | Braille | 3.0 | 256 | |
Bugi | 367 | Лонтара (Бугийское письмо) | Buginese | 4.1 | 30 | |
Buhd | 372 | Бухид | Buhid | 3.2 | 20 | |
Cakm | 349 | Чакма[убрать шаблон] | нет в Unicode | |||
Cans | 440 | Унифицированные Символы Канадских Аборигенов | Canadian_Aboriginal | 3.0 | 710 | |
Cari | 201 | Карийское письмо | Carian | 5.1 | 49 | Древняя/историческая |
Cham | 358 | Чамское письмо | Cham | 5.1 | 83 | |
Cher | 445 | Чероки | Cherokee | 3.0 | 85 | |
Cirt | 291 | Кирт | нет в Unicode | |||
Copt | 204 | Коптское письмо | Coptic | 1.0 | 135 | (отделена от греческой в версии 4.1) Древняя/историческая |
Cprt | 403 | Кипрское письмо | Cypriot | 4.0 | 55 | Древняя/историческая |
Cyrl | 220 | Кириллица | Cyrillic | 1.0 | 408 | |
Cyrs | 221 | Кириллица (старославянский вариант) | нет в Unicode | |||
Deva | 315 | Деванагари (Нагари) | Devanagari | 1.0 | 150 | |
Dsrt | 250 | Дезерет | Deseret | 3.1 | 80 | |
Dupl | 755 | Дуплоянская скоропись | нет в Unicode | |||
Egyd | 70 | Демотическое письмо | нет в Unicode | |||
Egyh | 60 | Иератическое письмо | нет в Unicode | |||
Egyp | 50 | Египетское иероглифическое письмо | Egyptian_Hierogyphs | 5.2 | 1,071 | Древняя/историческая |
Elba | 226 | Эльбасанское письмо | нет в Unicode | |||
Ethi | 430 | Эфиопское письмо (геэз) | Ethiopic | 3.0 | 495 | |
Geok | 241 | Хуцури (асомтаврули и нусхури) | нет в Unicode | |||
Geor | 240 | Грузинское письмо (Мхведрули) | Georgian | 1.0 | 120 | |
Glag | 225 | Глаголица | Glagolitic | 4.1 | 94 | Древняя/историческая |
Goth | 206 | Готское письмо | Gothic | 3.1 | 27 | Древняя/историческая |
Gran | 343 | Грантха | нет в Unicode | |||
Grek | 200 | Греческий алфавит | Greek | 1.0 | 511 | |
Gujr | 320 | Гуджарати | Gujarati | 1.0 | 83 | |
Guru | 310 | Гурмукхи | Gurmukhi | 1.0 | 79 | |
Hang | 286 | Хангыль (Hangŭl, Hangeul) | Hangul | 1.0 | 11,739 | (Хангыльские слоги перемещены в версии 2.0) |
Hani | 500 | Китайские иероглифы (Упрощённые и традиционные) | Han | 1.0 | 75,960 | |
Hano | 371 | Хануноо | Hanunoo | 3.2 | 21 | |
Hans | 501 | Китайские иероглифы (Упрощённые) | нет в Unicode | |||
Hant | 502 | Китайские иероглифы (Традиционные) | нет в Unicode | |||
Hebr | 125 | Еврейский алфавит | Hebrew | 1.0 | 133 | |
Hira | 410 | Хирагана | Hiragana | 1.0 | 91 | |
Hmng | 450 | Пахао мяо | нет в Unicode | |||
Hrkt | 412 | (псевдоним для хираганы + катаканы) | Katakana_Or_Hiragana | нет в Unicode (см. раздельные письменности) | ||
Hung | 176 | Венгерские руны | нет в Unicode | |||
Inds | 610 | Хараппская | нет в Unicode | |||
Ital | 210 | Староитальянская | Old_Italic | 3.1 | 35 | Древняя/историческая |
Java | 361 | Яванская | Javanese | 5.2 | 91 | |
Jpan | 413 | Японская (псевдоним для кандзи + хирагана + катакана) | нет в Unicode | |||
Jurc | 510 | Чжурчжэньское письмо | нет в Unicode | |||
Kali | 357 | Кая ли | Kayah_Li | 5.1 | 48 | |
Kana | 411 | Катакана | Katakana | 1.0 | 300 | |
Khar | 305 | Кхароштхи | Kharoshthi | 4.1 | 65 | Древняя/историческая |
Khmr | 355 | Кхмерское письмо | Khmer | 3.0 | 146 | |
Knda | 345 | Каннада (письмо) | Kannada | 1.0 | 86 | |
Kore | 287 | Корейское письмо (хангыль + ханча) | нет в Unicode | |||
Kpel | 436 | Кпелле | нет в Unicode | |||
Kthi | 317 | Кайтхи | Kaithi | 5.2 | 66 | Древняя/историческая |
Lana | 351 | Тай Тхам (Ланна) | Tai_Tham | 5.2 | 127 | |
Laoo | 356 | Лаосское письмо | Lao | 1.0 | 65 | |
Latf | 217 | Латинская фрактура | нет в Unicode | |||
Latg | 216 | Латинская (гэльский вариант) | нет в Unicode | |||
Latn | 215 | Латинская | Latin | 1.0 | 1,267 | |
Lepc | 335 | Лепча (Ронг) | Lepcha | 5.1 | 74 | |
Limb | 336 | Лимбу | Limbu | 4.0 | 66 | |
Lina | 400 | Линейное письмо А | нет в Unicode | |||
Linb | 401 | Линейное письмо Б | Linear_B | 4.0 | 211 | Древняя/историческая |
Lisu | 399 | Лису (Алфавит Фрейзера) | Lisu | 5.2 | 48 | |
Loma | 437 | Лома | нет в Unicode | |||
Lyci | 202 | Ликийский алфавит | Lycian | 5.1 | 29 | Древняя/историческая |
Lydi | 116 | Лидийский алфавит | Lydian | 5.1 | 27 | Древняя/историческая |
Mand | 140 | Мандейский алфавит, Mandaean | Mandaic | 6.0 | 29 | |
Mani | 139 | Манихейское письмо | нет в Unicode | |||
Maya | 90 | Майя | нет в Unicode | |||
Mend | 438 | Менде | нет в Unicode | |||
Merc | 101 | Мероитское письмо (курсивное) | нет в Unicode | |||
Mero | 100 | Мероитское письмо (иероглифическое) | нет в Unicode | |||
Mlym | 347 | Малаялам | Malayalam | 1.0 | 98 | |
Mong | 145 | Старомонгольское письмо | Mongolian | 3.0 | 153 | Включает Тодо-бичиг, маньчжурскую письменности |
Moon | 218 | Шрифт Муна | нет в Unicode | |||
Mroo | 199 | Мро | нет в Unicode | |||
Mtei | 337 | Мейтей маек | Meetei_Mayek | 5.2 | 56 | |
Mymr | 350 | Мъянмар (Бирманское письмо) | Myanmar | 3.0 | 188 | |
Narb | 106 | Ранне-североаравийская (древне-североаравийская) | нет в Unicode | |||
Nbat | 159 | Набатейский алфавит | нет в Unicode | |||
Nkgb | 420 | Накхи Геба | нет в Unicode | |||
Nkoo | 165 | Н’Ко | Nko | 5.0 | 59 | |
Nshu | 499 | Нюй-шу | нет в Unicode | |||
Ogam | 212 | Огамическое письмо | Ogham | 3.0 | 29 | Древняя/историческая |
Olck | 261 | Ол-чики (Ol Cemet’, Ol, Santali) | Ol_Chiki | 5.1 | 48 | |
Orkh | 175 | Древнетюркское руническое письмо | Old_Turkic | 5.2 | 73 | Древняя/историческая |
Orya | 327 | Ория | Oriya | 1.0 | 90 | |
Osma | 260 | Сомалийское письмо | Osmanya | 4.0 | 40 | |
Palm | 126 | Пальмирское письмо | нет в Unicode | |||
Perm | 227 | Древнепермское письмо | нет в Unicode | |||
Phag | 331 | Монгольское квадратное письмо (Письмо Пагба-ламы) | Phags_Pa | 5.0 | 56 | Древняя/историческая |
Phli | 131 | Вырезная пехлевийская | Inscriptional_Pahlavi | 5.2 | 27 | Древняя/историческая |
Phlp | 132 | Псалтырная пехлевийская | нет в Unicode | |||
Phlv | 133 | Книжная пехлевийская | нет в Unicode | |||
Phnx | 115 | Финикийское письмо | Phoenician | 5.0 | 29 | Древняя/историческая |
Plrd | 282 | Мяо (Поллард) | нет в Unicode | |||
Prti | 130 | Вырезная парфянская | Inscriptional_Parthian | 5.2 | 30 | Древняя/историческая |
Qaaa | 900 | Зарезервировано для частного использования (начало) | нет в Unicode | |||
Qaai | 908 | (Для частного использования) | Inherited | 523 | В версиях до 5.2 (начиная с 5.2: ‘Zinh’) | |
Qabx | 949 | Зарезервировано для частного использования (конец) | нет в Unicode | |||
Rjng | 363 | Реджангское письмо (Redjang, Kaganga) | Rejang | 5.1 | 37 | |
Roro | 620 | Ронго-ронго | нет в Unicode | |||
Runr | 211 | Руническое письмо | Runic | 3.0 | 78 | Древняя/историческая |
Samr | 123 | Самаритянское письмо | Samaritan | 5.2 | 61 | |
Sara | 292 | Сарати | нет в Unicode | |||
Sarb | 105 | Южноаравийское письмо | Old_South_Arabian | 5.2 | 32 | Древняя/историческая |
Saur | 344 | Саураштра | Saurashtra | 5.1 | 81 | |
Sgnw | 95 | SignWriting | нет в Unicode | |||
Shaw | 281 | Шавианский алфавит (Шоу) | Shavian | 4.0 | 48 | |
Shrd | 319 | Шарада | нет в Unicode | |||
Sind | 318 | Синдхи, Кхудавади | нет в Unicode | |||
Sinh | 348 | Сингальское письмо | Sinhala | 3.0 | 80 | |
Sora | 398 | Сора сонпенг | нет в Unicode | |||
Sund | 362 | Сунданское письмо | Sundanese | 5.1 | 55 | |
Sylo | 316 | Силоти нагри | Syloti_Nagri | 4.1 | 44 | |
Syrc | 135 | Сирийское письмо | Syriac | 3.0 | 77 | |
Syre | 138 | Сирийское письмо (Эстрангело) | нет в Unicode | |||
Syrj | 137 | Сирийское письмо (Западный вариант) | нет в Unicode | |||
Syrn | 136 | Сирийское письмо (Восточный вариант) | нет в Unicode | |||
Tagb | 373 | Тагбанва | Tagbanwa | 3.2 | 18 | |
Takr | 321 | Такри | нет в Unicode | |||
Tale | 353 | Тай лы | Tai_Le | 4.0 | 35 | |
Talu | 354 | Новый тай лы | New_Tai_Lue | 4.1 | 83 | |
Taml | 346 | Тамильское письмо | Tamil | 1.0 | 72 | |
Tang | 520 | Тангутское письмо | нет в Unicode | |||
Tavt | 359 | Тай виет | Tai_Viet | 5.2 | 72 | |
Telu | 340 | Телугу | Telugu | 1.0 | 93 | |
Teng | 290 | Тенгвар | нет в Unicode | |||
Tfng | 120 | Тифинаг (Бербер) | Tifinagh | 4.1 | 57 | |
Tglg | 370 | Тагалог (Байбайин, Алибата) | Tagalog | 3.2 | 20 | |
Thaa | 170 | Тана | Thaana | 3.0 | 50 | |
Thai | 352 | Тайское письмо | Thai | 1.0 | 86 | |
Tibt | 330 | Тибетское письмо | Tibetan | 1.0 | 207 | (удалена в версии 1.1 и вновь включена в 2.0) |
Ugar | 40 | Угаритское письмо | Ugaritic | 4.0 | 31 | Древняя/историческая |
Vaii | 470 | Ваи | Vai | 5.1 | 300 | |
Visp | 280 | Видимая речь | нет в Unicode | |||
Wara | 262 | Варанг-кшити | нет в Unicode | |||
Wole | 480 | Волеаи | нет в Unicode | |||
Xpeo | 30 | Древнеперсидская клинопись | Old_Persian | 4.1 | 50 | Древняя/историческая |
Xsux | 20 | Клинопись (шумеро-аккадская) | Cuneiform | 5.0 | 982 | Древняя/историческая |
Yiii | 460 | И | Yi | 3.0 | 1,220 | |
Zinh | 994 | Код для унаследованной письменности | Inherited | В версии 5.2 (в предыдущих версиях: ‘Qaai’) | ||
Zmth | 995 | Математические обозначения | не ‘письменность’ в Unicode | |||
Zsym | 996 | Символы | не ‘письменность’ в Unicode | |||
Zxxx | 997 | Код для бесписьменных языков | нет в Unicode | |||
Zyyy | 998 | Код для неопределенной письменности | Common | 6,379 | ||
Zzzz | 999 | Код для некодированной письменности | Unknown | все остальные коды |
Связи с другими стандартами
ISO 15924 ссылается на следующие стандарты как на незаменимые:
- ISO 639-2:1998 Коды для обозначения названий языков — Часть 2: Alpha-3 код
- ISO/IEC 9541-1:1991 Информационная технология — Обмен информацией о шрифтах — Часть 1: Архитектура
- ISO/IEC 10646-1:2000 Информационная технология — Универсальный много-октетный набор символов (UCS)
За определением шрифта и глифа стандарт ссылается на
- ISO/IEC 9541-1:1991