Категории локалей и переменные окружения — КиберПедия 

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Категории локалей и переменные окружения

2021-01-29 79
Категории локалей и переменные окружения 0.00 из 5.00 0 оценок
Заказать работу

 

Заголовочный файл определяет функции и структуры локали. Категории локали определяют разновидности информации, которые будут для программы зависимы от локали. Категории доступны в виде набора именованных констант. Они перечислены в табл. 13.1.

 

Таблица 13.1. Константы категорий локалей ISO С, определенные в

 

 Категория Значение
  Эта категория включает всю возможную информацию локали. Она состоит из оставшейся части элементов этой таблицы
  Категория для сравнения строк (обсуждаемого ниже) и областей регулярных выражений
  Категория для классификации символов (заглавные, строчные и т.д.) Это влияет на сопоставление регулярных выражений и функции XXX в
  Категория для специфичных для локали сообщений. Эта категория вступает в игру с GNU, которая обсуждает далее в главе
  Категория для форматирования денежной информации, такой, как локальные и международные символы для местной валюты (например, $ против USD для доллара США), форматирования отрицательных величин и т.д.
  Категория для форматирования числовых значений
  Категория для форматирования дат и времени

Эти категории определены различными стандартами. Некоторые системы могут поддерживать дополнительные категории, такие, как или. Однако, они не стандартизованы; любой программе, которой нужно их использовать, но которая все равно должна быть переносимой, следует использовать для окружения соответствующих разделов.

По умолчанию, программы С и библиотека С ведут себя так, как если бы они находились в локали «С» или «POSIX» для обеспечения обратной совместимости со старыми системами. Однако, вызвав (как описано ниже), программа может включить действие локали. После того, как программа это сделала, пользователь может, установив переменные окружения, включать и выключать возможности локали, которые будет иметь программа.

Переменные окружения имеют те же самые имена, что и перечисленные в табл. 13.1 категории локалей. Таким образом, команда –

 

– определяет, что числа должны выводиться в соответствии с локалью '' (английский язык в Дании), но что значения даты и времени должны выводиться в соответствии с обычной локалью ''. (Этот пример просто иллюстрирует, что вы можете указывать для различных категорий различные локали; это не является чем‑то обязательным, что вы должны делать.)

Переменная окружения перекрывает все другие переменные xxx. Если не установлена, библиотека ищет определенные переменные (, и т.д.). Наконец, если ни одна из них не установлена, библиотека ищет переменную. Вот небольшая демонстрация с использованием:

unset LC_ALL LANG

export LС_NUMERIC=en_DK LC_TIME=C

 

gawk 'BEGIN { print 1.234; print strftime() }'

 

export LC_NUMERIC=it_IT LC_TIME=it_IT

 

gawk 'BEGIN { print 1.234; print strftime() }'

 

export LC_ALL=C

gawk 'BEGIN { print 1.234; print strftime() }'

 

Для стандарт POSIX констатирует, что числовые константы в исходном коде всегда используют в качестве десятичного разделителя '' тогда как числовой вывод следует правилам локали).

Почти все GNU версии стандартных утилит Unix могут использовать локали. Таким образом, особенно на системах GNU/Linux, установка этих переменных позволяет вам контролировать поведение системы[139].

 

Установка локали:

 

Как уже упоминалось, если вы ничего не делаете, программы на С и библиотека С ведет себя так, как если бы использовалась локаль «С». Функция устанавливает соответствующую локаль:

 

Аргумент является одной из категорий, описанных в разделе 13.2.1 «Категории локалей и переменные окружения». Аргумент является строкой, именующей используемую для этой категории локаль. Когда является пустой строкой (), проверяет соответствующие переменные окружения.

Если равно, сведения о локали не изменяются. Вместо этого функция возвращает строку, представляющую текущую локаль для данной категории.

Поскольку каждая категория может быть установлена индивидуально, автор приложения решает, насколько будет программа использовать локаль. Например, если делает лишь это –

 

 

– тогда, независимо от установленных в окружении других переменных xxx, локали подчиняются лишь функции времени и даты. Все остальные действуют так, как если бы программа по‑прежнему работала в локали «С». Сходным образом вызов:

 

заменяет переменную окружения (также, как), заставляя программу использовать для вычислений времени/даты данные для Италии. (Хотя Италия может быть прекрасным местом, программам лучше использовать, чтобы они могли корректно работать везде; этот пример предназначен лишь для объяснения того, как работает.)

Можно индивидуально вызывать для каждой категории, но простейшим способом является установка всего одним махом:

 

 

Возвращаемое значение является текущей установкой локали. Это либо строковое значение, переданное в предыдущем вызове, либо непрозрачное значение, представляющее используемую вначале локаль. Это самое значение может быть затем передано обратно. Для последующего использования возвращаемое значение должно быть скопировано в локальное хранилище, поскольку это указатель на внутренние данные.

 

 

Здесь мы сохранили копию, использовав функцию POSIX (см. раздел 3.2.2 «Копирование строк:»).

 

Сравнение строк: и ()

 

Знакомая функция сравнивает две строки, возвращая отрицательное, нулевое или положительное значения, если первая строка меньше, равна или больше второй. Это сравнение основано на числовых значениях символов в машинном наборе символов. Из‑за этого результаты   никогда не изменяются.

Однако, при наличии локалей простого числового сравнения недостаточно. Каждая локаль определяет для содержащихся в ней символов последовательность сортировки, другими словами, относительный порядок символов внутри локали. Например, в простом 7‑битном ASCII у двух символов '' и '' десятичные значения равны 65 и 97 соответственно. Соответственно, во фрагменте

 

 имеет отрицательное значение. Однако, в локали "" '' идет после '', а не перед ним. Таким образом, использование для приложений, использующих локаль, является плохой мыслью, мы могли бы сказать, что она возвращает игнорирующий локаль ответ.

Функция (string collate – сортировка строк) существует для сравнения строк с использованием локали:

 

Она возвращает такие же отрицательные/нулевые/положительные значения, что и. Следующая программа,, интерактивно демонстрирует разницу:

 

Программа читает входные строки, состоящие из двух сравниваемых слов и необязательной локали, использующейся для сравнения. Если локаль дана, она становится локалью для последующих элементов. Программа начинает с любой локалью, которая установлена в окружении.

Массив сохраняет текущую локаль для вывода результатов; и являются левым и правым сравниваемыми словами (строки 10–11). Основную часть программы составляет цикл (строки 19–36), который читает строки и выполняет работу. Строки 20–23 разделяют входную строку, инициализируется пустой строкой, если третья строка не предусмотрена.

Строки 25–28 устанавливают новую локаль, если она приведена. Строки 30–33 выводят результаты сравнения, а строка 35 приглашает для дальнейшего ввода. Вот демонстрация:

ch13‑compare

ABC abc

 

ABC abc en_US

 

ABC abc en_US.UTF‑8

 

 

Junk JUNK

 

 

Эта программа ясно показывает различие между и. Поскольку работает в соответствии с числовыми значениями символов, она всегда возвращает тот же самый результат, понимает проблемы сортировки, и ее результат меняется в соответствии с локалью. Мы видим, что в обеих локалях заглавные буквы идут после строчных.

 

ЗАМЕЧАНИЕ. Специфическая для локали сортировка строк является проблемой также и для сопоставления регулярных выражений. Регулярные выражения допускают диапазоны символов внутри выражений со скобками, такие, как '' или ''. Точное значение такой конструкции (символы, численно располагающиеся между начальной и конечной точками включительно) определено лишь для локалей «С» и «POSIX»

Для локалей, не являющихся ASCII, такие диапазоны как '' могут соответствовать также и заглавным буквам, а не только строчным! Диапазон '' действителен в ASCII, но не в "".

Долговременным наиболее переносимым решением является использование классов символов POSIX, таких, как '' и ''. Если вам кажется, что нужно использовать выражения с диапазонами на системах, использующих локали, и на более старых системах, не использующих их, без изменения своей программы, решение заключается в применении грубой силы и индивидуальном перечислении каждого символа внутри скобок. Это неприятно, но это работает.

 

Основанная на локалях сортировка потенциально дорогостоящая. Если вы ожидаете большого числа сравнений, где по крайней мере одна из строк не будет изменяться или где значения строк будут сравниваться друг с другом по несколько раз (как при сортировке списка), следует рассмотреть использование функции для преобразования своих строк для использования с. Функция объявлена следующим образом:

 

Идея в том, что преобразует первые n символов, помещая их в. Возвращаемое значение является числом символов, необходимых для сохранения преобразованных символов. Если она превышает n, содержимое «неопределенно».

Стандарт POSIX явным образом разрешает устанавливать в ноль, а в. В этом случае возвращает размер массива, необходимого для сохранения преобразованной версии (не включая завершающий символ ''). Предполагается, что это значение впоследствии будет использовано с для создания массива или для проверки размера предопределенных границ массива (При этом, очевидно, должен иметь завершающий нулевой байт.) Этот фрагмент иллюстрирует использование:

 

Для одноразовых сравнений, возможно, быстрее непосредственно использовать. Но если строки будут сравниваться несколько раз, более быстрым будет использование сначала, а затем с преобразованными значениями. Функций для локали, соответствующих или, нет.

 


Поделиться с друзьями:

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.027 с.