Опыт работы с системами управления и мониторинга используемых вычислительных ресурсов корпоративных высокопроизводительных вычислительных кластеров. А. А. Катаев

Опыт работы с системами управления и мониторинга используемых вычислительных ресурсов корпоративных высокопроизводительных вычислительных кластеров

Год выпуска: 2021

Автор произведения: А. А. Катаев

Серия: Прикладная информатика. Научные статьи

Жанр: Техническая литература

Издательство: Синергия

isbn:

Краткое описание:

В представленной статье рассматриваются современные системы мониторинга серверов. Обозреваемая предметная область касается контроля и управления высокопроизводительными вычислительными комплексами (ВВК). Данные системы применяются в различных отраслях науки и промышленности для проведения моделирования систем и их поведения в различных условиях. Скорость проведения моделирования зависит от применяемых технических решений в составе вычислительного комплекса. К ним относят тип внутренней сети, количество и разновидности вычислительных узлов. Для вычислительных узлов рассматривают такие параметры, как архитектура и модель процессора, количество оперативной памяти. Особенности, связанные с реализацией конкретных математических моделей, влияющие на скорость расчетов, в данной статье не рассматриваются. В работе проведен анализ существующих рыночных решений и основных применяемых концепций для систем управления и мониторинга подобных комплексов. Рассматриваемые системы оцениваются с экономической и технической точек зрения. Для доступных систем проводится натурное исследование способностей по управлению кластером и мониторингу состояния. Фиксируемый системой мониторинга набор параметров берется исходя из общей архитектуры ВВК и подхода к администрированию серверных систем. Практическая часть описывает опыт проектирования и реализации перспективной системы управления. В создаваемой системе основное внимание сосредоточено на создании системы управления. Обоснование необходимости отдельного программного продукта приведено по тексту статьи. Вопросы реализации в конкретном программном коде и системной среде опущены как зависимые от конкретного исполнения системы. Задача создания собственной системы мониторинга принята ничтожной при условии наличия существующих решений.