639-1 | 639-2 | |
---|---|---|
Английский язык | en | eng |
Русский язык | ru | rus |
Украинский язык | uk | ukr |
Французский язык | fr | fra |
ISO 639 — набор стандартов Международной организации по стандартизации, связанный со стандартизацией названий языков и языковых групп.
Название ISO 639 является также наименованием оригинального стандарта, утверждённого в 1967 году (как ISO 639/R)[1] и выведенного из применения в 2002 году.[2] ISO 639 состоит из шести частей.
Языковые коды, установленные в разделах ISO 639, используется для библиографических целей, как ключевые элементы языковых данных в компьютерных и интернет средах. Коды также нашли своё применение в различных приложениях, таких как Википедия, Единый указатель ресурсов (URL).
На базе ISO 639 основывается стандарт RFC 3066, описывающий использование кодов языков в Интернете.
Многоязычные страницы содержатся в «многоязычном» CSS-классе, поддерживающем текст на любом языке, при этом используется класс «lang-xx», где «xx» — строчный код по ISO 639, представляющий собой двух- или трёхбуквенный код языка и языкового атрибута. Атрибут языка представляется контекстуально более правильным, однако возможность подключения CSS поддерживается не всеми браузерами. Если не применяется двухбуквенный код, используется строчный трёхбуквенный. Для работы с текстом на незнакомом языке применяется код und
(англ. undetermined [language] — неустановленный язык).
Стандарт | Наименование | Первая редакция | Текущая редакция | Позиций в списке |
---|---|---|---|---|
ISO 639-1 | Часть 1: коды Альфа-2 | 1967 (как ISO 639) | 2002 | 184 |
ISO 639-2 | Часть 2: коды Альфа-3 | 1998 | 1998 | >450 |
ISO 639-3 | Часть 3: коды Альфа-3 для всеобъемлющего охвата языков | 2007 | 2007 | 7704 + локальный диапазон |
ISO 639-4 | Часть 4: Руководства и общие принципы языкового кодирования | 2010-07-16 | 2010-07-16 | (без списка) |
ISO 639-5 | Часть 5: коды Альфа-3 для языковых семей и групп | 2008-05-15 | 2008-05-15 | 114 |
ISO 639-6 | Часть 6: коды Альфа-4 используется для всеобъемлющего охвата вариантов языков | 2009-11-17 | 2009-11-17 | ? |
Языковые стандарты ISO 639 открытые, то есть могут постоянно дополняться. Каждая часть стандарта сопровождается Агентством по техническому обеспечению, которая в случае необходимости и добавляет коды или меняет статусы кодов.
Области применения:
bh
, большинство языковых групп кодифицировано в части 2 и несколько было добавлено в часть 5)Виды (для отдельных языков):
chb
, chg
, cop
, sam
, ни одного в части 1)ave
, chu
, lat
, pli
и san
— также имеют соответствующий код в части 1: ae
, cu
, la
, pi
, sa
)epo
, ina
, ile
, ido
, vol
, afh
, jbo
, tlh
, zbl
, пять в части 1: eo
, ia
, ie
, io
, vo
)Библиографические и терминологические коды:
Коды «Альфа-2» (коды состоят из 2 букв современного базового латинского алфавита) используются в ISO 639-1. Однако двухбуквенными комбинациями даже при большом желании невозможно охватить весь широкий спектр языков, комбинаций букв может быть максимум 262=676).
Коды «Альфа-3» (коды состоят из 3 букв современного базового латинского алфавита) используются в ISO 639-2, ISO 639-3 и ISO 639-5. Математически, верхний предел для числа языков и языковых коллекций, которые могут быть кодифицированы, следующий 263=17576.
Совместное использование кодов Альфа-3 в трёх частях ISO 639 требует координации в рамках более крупной системы.
ISO 639-2 в том числе включает в себя четыре специальных кода mul
, und
, mis
, zxx
, зарезервированный диапазон qaa-qtz
(20×26=520 кодов) и двадцать три дублирующие записи («B/T» — библиографические и терминологические (лексикографические) — коды). Это составляет 520+23+4=547 кодов, которые не могут быть использованы в части 3 для кодификации языков или же в части 5 для кодификации языковых семей и групп. В остатке 17576-547=17029.
ISO 639-2 содержит все языки, включённые в ISO 639-1 (за исключением сербохорватского и молдавского), и коды для языковых вариантов. Например, в ISO 639-1 для французского языка есть только один код — fr
, тогда как в ISO 639-2 для него есть четыре кода: fre
/fra
для современного французского, frm
для средневекового французского (англ. French, Medieval; 1400—1800 годы) и fro
для старофранцузского (англ. French, Old; 842—1400 годы).
На сегодняшний день насчитывается около шести или семи тысяч языков на Земле[8]. В связи с этим, 17029 кодов вполне позволяют присвоить каждому языку свой уникальный код, однако это в конечном итоге может привести к тому, что некоторым языкам будут присваиваться произвольные коды, комбинация букв которых не будет соответствовать традиционному названию такого языка.
Коды «Альфа-4» (коды состоят из 4 букв современного базового латинского алфавита) используются в ISO 639-6. Верхняя граница для числа языков и диалектов — 264=456976.