Управления исполнением заданий — КиберПедия 

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Управления исполнением заданий

2022-10-10 37
Управления исполнением заданий 0.00 из 5.00 0 оценок
Заказать работу

Информационный сервис

 

 Основным элементом системы информационного сервиса является подсистема обновления и

отыскания сервисов MDS (Monitoring and Discovery Service), в которой зарегистрированы все ре-

сурсы Грид. Информация о ресурсах может содержать, например, как данные о конфигурации или

состоянии как всей системы, так и отдельных ее ресурсов (тип ресурса, доступное дисковое про-

странство, количество процессоров, объем памяти, производительность и прочее). Вся информа-

ция логически организована в виде дерева, и доступ к ней осуществляется по стандартному прото-

колу LDAP (Lightweight Directory Access Protocol). Каждая запись в структуре LDAP содержит

свойства отдельного ресурса. Пользовательское приложение может запросить сервер для установ-

ления типа архитектуры, поддерживаемой операционной системы, сведений о менеджере задач,

которые доступны на заданном ресурсе. Каждый организационный домен, входящий в Грид, дол-

жен запустить сервис информации о ресурсах (GRIS). Функциональность данного сервиса вклю-

чает в себя:

• Просмотр и получение информации, которая может быть точно сопоставлена с конкретным

ресурсом или объектом.

• Возможность делать запросы и искать информацию для получения набора связанных ресур-

сов или объектов.

• Создание новой информации по запросу, которая не сохранена в системе. 120

• Переадресация событий для передачи информации основанной на динамических событиях

внутри нфраструктуры Grid.

• Сбор информации для тематического получения и организации информации.

• Фильтрация информации для уменьшения ее количества и увеличения производиельности.

• Хранение, резервное копирование, кеширование информации для болеепростогопоследую-

щего доступа к ней и для увеличения производительности.

• Безопасность, защита и шифрование для обеспечения работы важных задач, таких каккон-

троль доступа, аутентификация.

• Для поддержки данной функциональности пользователями Grid системы могут быть

использованы несколько сервисов.

 

MDS имеет децентрализованную, легко масштабируемую структуру и работает как со стати-

ческими, так и с динамически меняющимися данными, необходимыми пользовательским прило-

жениям и различным сервисам Грид-системы. Иерархическая структура MDS представлена на

рис. 15.7.

 

 

MDS состоит из трех основных компонент:

1. IP (Information Provider) – является источником информации о конкретном ресурсе.

2. GRIS (Grid Resource Information Service) – предоставляет информацию об узле Грид-системы,

который может быть как вычислительным узлом, так и каким-либо другим ресурсом. GRIS оп-

рашивает индивидуальные IP и объединяет полученную от них информацию в рамках единой

информационной схемы;

 

СХЕМА ОПЕРЕЖАЮЩЕГО ПЛАНИРОВАНИЯ

Представим схему опережающего планирования следующим псевдокодом.

 

1. Цикл планирования:

{

2. Получение стоящих в очереди заданий грид;

3. Получение расписаний всех кластеров;

4. Цикл размещения заданий:

{

5. Построение аллокации для задания;

6. Если время начала аллокации близко:

7. { резервирование; доставка задания в кластер;}

}

}

 

Планирование представляет собой циклический процесс, в каждом цикле которого строится ориентировочное распределение заданий грид по ресурсам и определяется подмножество заданий, для которых начало выполнения достаточно близко. Для этих заданий выполняется резервирование ресурсов, гарантирующие их выделение в соответствии с построенной планировщиком аллокацией, и инициируется доставка заданий в кластеры.

Первые два оператора цикла планирования получают из информационной базы стоящие в глобальной очереди задания (оператор 2) и множество локальных расписаний (3). Заполнение информационной базы осуществляется отдельным процессом, который может работать параллельно с процессом планирования. Каждый цикл планирования, однако, происходит при фиксированном состоянии информационной базы, а происходящие за время одного цикла изменения состояния учитываются на следующем. Локальные расписания объединяются в общий массив слотов, по которому ведется планирование глобальных заданий.

Собственно планирование заключается в построении аллокаций для заданий в порядке их приоритетов. Обозначим N требуемое заданию количество процессорных узлов, и T - длительность выполнения задания. Задача построения аллокации (5) состоит в том, чтобы найти такие N процессорных узлов и такой интервал времени [t0, t0+T], на котором ресурсы этих процессорных узлов могут быть выделены данному заданию. Возможность выделения определяется следующими условиями:

- характеристики ресурсов каждого процессорного узла соответствуют ресурсному запросу задания,

- суммарная стоимость ресурсов, вычисляемая по слотам, попадающим в интервал действия аллокации, не превышает платы за ресурсы, назначенной пользователем.

После построения аллокации могут быть инициированы действия (7) по обеспечению запуска задания: предварительное резервирование ресурсов и передача задания в кластеры. Эти действия выполняются только для заданий, время начала аллокаций которых достаточно близко к моменту планирования. Для остальных заданий эффект построения аллокации сводится к тому, что слоты, по которым она построена, становятся полностью или частично недоступными на протяжении того же шага планирования для других глобальных заданий. Заметим, что на последующих шагах такие задания могут получить совсем другие ресурсы.

Способ отбора аллокаций (6), для которых необходимо инициировать запуск заданий, иллюстрирует рис. 3.

 

Рис. 3. Выбор времени запуска задания.

 

Выбор момента резервирования отражает компромисс между стремлением основывать реальное выделение ресурсов на оперативной информации о состоянии грид и необходимостью гарантировать запуск заданий. Если резервирования делаются рано, например, непосредственно в момент поступления заданий в глобальную очередь, то изменения состояния (появление новых заданий, отклонение хода обработки заданий от первоначального прогноза) за все время их нахождения в очереди никак не будут отражаться, например, на порядке получения ресурсов, то есть не будет работать механизм приоритетов.

Что же касается минимального упреждения, необходимого для обеспечения запуска задания, то оно определяется двумя условиями. Первое условие: упреждение должно быть таким, чтобы ресурсы аллокации не оказались занятыми локальными заданиями. При этом надо учесть, что эти ресурсы могут освободиться раньше прогнозируемого в расписании времени. Если происходит такое “преждевременное” освобождение ресурсов, на них может начать выполняться локальное задание, окончание которого происходит после начала аллокации. В связи с этим, первое условие начала доставки задания задается неравенством: Tпс>Tц, где Tпс – начало слота, непосредственно предшествующего аллокации на тех же ресурсах, Tц – время начала цикла планирования.

Второе условие заключается в том, что должно хватать времени для передачи задания на исполнительные ресурсы. Процесс передачи включает пересылку всех его входных файлов, так что время передачи может быть значительным. Это условие можно записать в виде: (Tа-Tц)>Tпз, где Tа – время начала аллокации, Tпз – время передачи задания.

Первое из сформулированных условийпозволяет с высокой вероятностью рассчитывать, что ресурсы для построенных планировщиком аллокаций будут выделены в кластере. Тем не менее, отказы в резервировании возможны: ресурсы все же могут оказаться занятыми локальным заданием. Такое, однако, может произойти лишь в том случае, когда в промежуток между построением аллокации и резервированием аварийно (в момент старта) завершается несколько заданий, предшествующих началу аллокации. Эта ситуация рассматривается как исключительная, а задание поступает на перепланирование.

СРАВНЕНИЕ С СОВРЕМЕННЫМИ ПЛАНИРОВЩИКАМИ

Не претендуя на полный обзор довольно многочисленных реализаций систем управления заданиями в грид, появившихся в последнее время, рассмотрим их возможности планирования.

Большинство разработок предназначены для обслуживания кластеризованных ресурсов, в том числе система WMS [8] наиболее крупного на сегодняшний день грид проекта EGEE [44], имеющего мировой масштаб. Брокер системы WMS реализует централизованную схему планирования, работающую в двух режимах распределения заданий: жадного и ленивого (ленивый режим был впервые реализован в проекте Alien [45]). В жадном режиме распределение заданий происходит без глобальной очереди: поступившее в брокер задание сразу же отправляется в некоторый кластер. Для выбора кластера используется информационная база, содержащая данные о текущем состоянии всех ресурсов грид. Задания, запускаемые пользователями в ленивом режиме поступают в глобальную очередь. Кластеры, имеющие свободные ресурсы, информируют брокер о характеристиках свободных ресурсов, а тот, выбирая из очереди подходящее задание, передает его в кластер.

В обоих режимах происходит сопоставление характеристик ресурсов и заданий на предмет выяснения возможности выполнения. Информационная база жадного режима, построенная на информационной службе MDS [19] системы Globus Toolkit [14], недостаточно полна: она не содержит данных, описывающих процессорные узлы, так что этот режим может использоваться только в грид с однородными ресурсами. Сопоставление характеристик ресурсов и заданий в ленивом режиме производится на основе метода matchmaking [15] и не имеет такого недостатка.

Основное решение планирования – выбор исполнительных ресурсов – в жадном режиме делается по интегральной характеристике состояния кластера: выбирается тот, у которого в локальной очереди меньше всего заданий. Как было показано, это потенциально ведет к зависанию заданий, тем более, что глобальная очередь в этом режиме не поддерживается и распределение происходит в момент поступления задания в брокер. Подход ленивого режима более аккуратный – задания грид находятся в очереди, а кластер запрашивает у брокера новое задание в моменты времени, определяемые политикой, заданной администратором. Однако, вопрос о том, какой должна быть эта политика, остается открытым. Простейший подход – запрашивать задание при пустой локальной очереди – не разрешает проблем неоднородного кластера и неотчуждаемых ресурсов.

Система управления заданиями ARC [27] проекта NorduGrid представляет интерес как пример децентрализованной архитектуры планирования. В целом, схема планирования в ARC аналогична жадному режиму брокера WMS, однако планировщик здесь входит в состав программного обеспечения каждого рабочего места пользователя, а планирование и передача задания в кластер, выполняется непосредственно с места выдачи запроса. Преимущества децентрализованной архитектуры известны – это отсутствие “критической точки”, живучесть и масштабируемость. Отметим также, что в данной архитектуре планирование производится отдельно для каждого задания и принимаемые решения могут оказаться не согласованными друг с другом.

В некоторых системах находят применение два новых механизма – резервирование и миграция. Сценарий Moab Grid Scheduler [40] выглядит следующим образом:

- задания грид поступают в глобальную очередь,

- планировщик посылает запросы в кластеры и получает от них время возможных аллокаций,

- исходя из полученной информации, выбирается кластер, производится резервирование ресурсов, задание отправляется в кластер.

Moab, также как и CSF (Community Scheduler Framework) [46], который также поддерживает резервирование в службе планирования, не дает все-таки полного решения, предполагая, что кластерное обеспечение имеет средства для принятия решений о том, когда могут быть отведены ресурсы для резервирования. В стандартных СПО таких средств нет, и их создание составляет отдельную задачу.

Системы GridWay [47] и GridLab Resource Management System (GRMS) [48] используют механизм перераспределения заданий - миграцию. В GridWay после того как глобальное задание отправлено в кластер, специальная служба осуществляет его мониторинг. В случае, если задание не запущено на счет в локальном менеджере ресурсов за некий интервал времени, происходит перепланирование данного глобального задания, и оно перемещается на другие ресурсы.

Миграция представляет собой мощный механизм, который способен расширить возможности планирования. Однако, его применение сопряжено с большими временными затратами на перемещение файлов заданий, так что миграция, по-видимому, может рассматриваться как дополнение к качественному способу планирования.

 

Информационный сервис

 

 Основным элементом системы информационного сервиса является подсистема обновления и

отыскания сервисов MDS (Monitoring and Discovery Service), в которой зарегистрированы все ре-

сурсы Грид. Информация о ресурсах может содержать, например, как данные о конфигурации или

состоянии как всей системы, так и отдельных ее ресурсов (тип ресурса, доступное дисковое про-

странство, количество процессоров, объем памяти, производительность и прочее). Вся информа-

ция логически организована в виде дерева, и доступ к ней осуществляется по стандартному прото-

колу LDAP (Lightweight Directory Access Protocol). Каждая запись в структуре LDAP содержит

свойства отдельного ресурса. Пользовательское приложение может запросить сервер для установ-

ления типа архитектуры, поддерживаемой операционной системы, сведений о менеджере задач,

которые доступны на заданном ресурсе. Каждый организационный домен, входящий в Грид, дол-

жен запустить сервис информации о ресурсах (GRIS). Функциональность данного сервиса вклю-

чает в себя:

• Просмотр и получение информации, которая может быть точно сопоставлена с конкретным

ресурсом или объектом.

• Возможность делать запросы и искать информацию для получения набора связанных ресур-

сов или объектов.

• Создание новой информации по запросу, которая не сохранена в системе. 120

• Переадресация событий для передачи информации основанной на динамических событиях

внутри нфраструктуры Grid.

• Сбор информации для тематического получения и организации информации.

• Фильтрация информации для уменьшения ее количества и увеличения производиельности.

• Хранение, резервное копирование, кеширование информации для болеепростогопоследую-

щего доступа к ней и для увеличения производительности.

• Безопасность, защита и шифрование для обеспечения работы важных задач, таких каккон-

троль доступа, аутентификация.

• Для поддержки данной функциональности пользователями Grid системы могут быть

использованы несколько сервисов.

 

MDS имеет децентрализованную, легко масштабируемую структуру и работает как со стати-

ческими, так и с динамически меняющимися данными, необходимыми пользовательским прило-

жениям и различным сервисам Грид-системы. Иерархическая структура MDS представлена на

рис. 15.7.

 

 

MDS состоит из трех основных компонент:

1. IP (Information Provider) – является источником информации о конкретном ресурсе.

2. GRIS (Grid Resource Information Service) – предоставляет информацию об узле Грид-системы,

который может быть как вычислительным узлом, так и каким-либо другим ресурсом. GRIS оп-

рашивает индивидуальные IP и объединяет полученную от них информацию в рамках единой

информационной схемы;

 

Управления исполнением заданий

 

 Основная и наиболее развитая часть в составе комплекса gLite – это система управления зада-

ниями (Workload Management System, WMS), представленная на рис.16.1. Ее назначение – под-

держка выполнения программ на распределенных и организованных в виде грида компьютерах

 Для пользователя грида вычислительная деятельность выглядит таким образом: он запускает

задание, которое доставляется на один или, в случае многопроцессорных заданий, несколько ком-

пьютеров из общего ресурсного пула грид, задание выполняется, а результаты могут быть получе-

ны на рабочее место, с которого осуществлялся запуск. Реализованные в WMS технологии под-

держивает распределенную обработку такого рода, обеспечивая: автоматическое выделение под-

ходящих исполнительных компьютеров (это основное отличие WMS от базовых средств управле-

ния заданиями, в которых требуется явное указание исполнительных ресурсов); перемещение про-

граммы, входных и диагностических файлов; создание среды выполнения, в том числе домашней

директории, на исполнительном компьютере.

 Формы пользовательской деятельности в гриде и на отдельном компьютере отличаются в не-

скольких отношениях:

• Программный код задания выполняется на исполнительном компьютере без участия пользова-

теля (в пакетном режиме). Сам код в рядовом случае не требует адаптации к условиям Грид. В

некоторых случаях может потребоваться его дополнение прологом/эпилогом, которые выпол-

няют подготовительные/завершающие операции, например, доставку обрабатываемых данных.

• Задание представляется WMS в виде формализованного описания, составленного на языке JDL

(Job Description Language). Способы описания заданий подробно обсуждаются далее. 123

• Ресурсы Грид используются коллективно множеством пользователей, поэтому задание не обяза-

тельно начинает выполняться сразу после запуска: оно может ждать освобождения ресурсов,

занятых другими заданиями. Ожидающие ресурсов задания хранятся в очередях (WMS или ре-

сурсных центров CE).

• Вопросы безопасности в гриде gLite решаются на основе принципов GSI. Перед тем как начать

работать с WMS (или любой другой системой gLite), пользователь должен сгенерировать вре-

менный прокси-сертификат с помощью команд grid-proxy-init или voms-proxy-init.

 

 


Поделиться с друзьями:

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.081 с.