Опыт работы с системами управления и мониторинга используемых вычислительных ресурсов корпоративных высокопроизводительных вычислительных кластеров. А. А. Катаев
Опыт работы с системами управления и мониторинга используемых вычислительных ресурсов корпоративных высокопроизводительных вычислительных кластеров
Год выпуска: 2021
Автор произведения: А. А. Катаев
Серия: Прикладная информатика. Научные статьи
Жанр: Техническая литература
Издательство: Синергия
isbn:
Краткое описание:
В представленной статье рассматриваются современные системы мониторинга серверов. Обозреваемая предметная область касается контроля и управления высокопроизводительными вычислительными комплексами (ВВК). Данные системы применяются в различных отраслях науки и промышленности для проведения моделирования систем и их поведения в различных условиях. Скорость проведения моделирования зависит от применяемых технических решений в составе вычислительного комплекса. К ним относят тип внутренней сети, количество и разновидности вычислительных узлов. Для вычислительных узлов рассматривают такие параметры, как архитектура и модель процессора, количество оперативной памяти. Особенности, связанные с реализацией конкретных математических моделей, влияющие на скорость расчетов, в данной статье не рассматриваются. В работе проведен анализ существующих рыночных решений и основных применяемых концепций для систем управления и мониторинга подобных комплексов. Рассматриваемые системы оцениваются с экономической и технической точек зрения. Для доступных систем проводится натурное исследование способностей по управлению кластером и мониторингу состояния. Фиксируемый системой мониторинга набор параметров берется исходя из общей архитектуры ВВК и подхода к администрированию серверных систем. Практическая часть описывает опыт проектирования и реализации перспективной системы управления. В создаваемой системе основное внимание сосредоточено на создании системы управления. Обоснование необходимости отдельного программного продукта приведено по тексту статьи. Вопросы реализации в конкретном программном коде и системной среде опущены как зависимые от конкретного исполнения системы. Задача создания собственной системы мониторинга принята ничтожной при условии наличия существующих решений.