Common Locale Data Repository

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Common Locale Data Repository
Разработчик Unicode Consortium
Опубликован 19 декабря 2003; 20 лет назад (2003-12-19)[1]
Последний выпуск CLDR 34 (15 октября 2018; 5 лет назад (2018-10-15)[2])
Тип формата проект и набор данных
Содержит XML[3]
Сайт cldr.unicode.org (англ.)

Проект Common Locale Data Repository (Общий репозиторий языковых данных), часто сокращаемый как CLDR — это проект консорциума Юникод, призванный обеспечить языковые настройки данных в формате XML для использования в программном обеспечении. Репозиторий CLDR содержит сведения о специфических особенностях каждого языка, которые операционная система обычно предоставляет приложениям. CLDR написано на LDML (Locale Data Markup Language). Информация в настоящее время используется в ряде приложений и операционных систем, в частности, в Международных компонентах Юникода[англ.], ОС MacOS, LibreOffice, MediaWiki и AIX.

Среди типов данных, включаемых в CLDR, находятся:

  • Переводы названий языков.
  • Переводы названий территорий и стран.
  • Переводы названий валют, в том числе модификации для форм единственного/множественного числа.
  • Переводы таких терминов, как рабочая неделя, месяц, эра, часть дня, в полной и сокращённой форме.
  • Переводы названий часовых поясов и примеры городов (или аналогичные) для часовых поясов.
  • Переводы для полей календаря.
  • Шаблоны для форматирования/парсинга дат или времени суток.
  • Наборы образцов символов, используемых для написания на каждом языке.
  • Шаблоны для форматирования/парсинга чисел.
  • Правила сортировки[англ.], адаптированные к каждому языку.
  • Правила для форматирования чисел в традиционных системах счисления (например, римские цифры, армянские цифры, ...).
  • Правила записи числа прописью.
  • Правила транслитерации между системами письма. Многое из этого базируется на системе транслитерации BGN/PCGN[англ.].

Этот проект несколько пересекается с ISO/IEC 15897[англ.] (языковые настройки POSIX). Языковая информация POSIX может быть получена из CLDR, используя некоторые из инструментов преобразования CLDR.

CLDR поддерживается техническим комитетом CLDR, включающим сотрудников из компаний IBM, Apple, Google, Microsoft и некоторых правительственных организаций. В настоящее время комитет работает под председательством Джона Эммонса (IBM), с Марком Дэвисом[англ.] (Google) в качестве заместителя председателя.[4]

Примечания[править | править код]

  1. CLDR Releases/Downloads. Дата обращения: 21 июня 2017. Архивировано 28 октября 2012 года.
  2. CLDR 34 Release Note - CLDR - Unicode Common Locale Data Repository. Дата обращения: 17 октября 2018. Архивировано 17 октября 2018 года.
  3. Updating DTDs Архивная копия от 10 октября 2012 на Wayback Machine, В CLDR реализуется специальное использование XML, поскольку он структурирован. В частности, XML-код разработан таким образом, что вы можете прочитать XML-файл CLDR и интерпретировать его как неупорядоченный список пар <путь,значение>, имеющий внутренне название «CLDRFile». Эти пары путей/значений могут быть добавлены к или удалены, а затем CLDRFile может быть записана обратно на диск, в результате чего получится корректный XML-файл. Это очень мощный механизм, благодаря которому также реализуется модель наследования CLDR
  4. CLDR Process - CLDR - Unicode Common Locale Data Repository. Дата обращения: 21 июня 2017. Архивировано 24 мая 2013 года.

Ссылки[править | править код]

Инструменты CLDR