Обзор структуры суперкомпьютерных центров

Михаил Крутиков
Суперкомпьютерные центры прошли несколько исторических ступеней развития, которые отражают, с одной сторны, изменения базовых технологий вычислительной техники, а, с другой стороны - изменение внутренней организации центров, номенклатуры функциональных узлов, и технологий сетевой организации.

До 1975 года, типичный суперкомпьютерный центр представлял собой комплекс из одной или нескольких отдельно-стоящих мощных (иногда - многопроцессорных) систем (мейнфрейм). Доступ к системам осуществлялся непосредственно с терминалов, а также в пакетном режиме с выводом информации на магнитные или бумажные носители.

С 1975 по 1985 произошел качественный скачок в организации центров, вызванный внедрением и широким распространением технологии TCP/IP как средства объединения вычислительных систем между собой и как средства осуществления доступа пользователей к вычислительным и информационным ресурсам. Началась разработка программных средств интеграции отдельных систем в единую вычислительную машину. Появляются кластеры однородных систем и широкое распространение получает кластерная модель центра, в котором в рамках нескольких вычислительных систем однородной архитектуры действуют распределенные вычислительные службы, службы удаленного вызова процедур, сетевая файловая система (NFS - Network File System), система распределенной пакетной обработки заданий. Решается вопрос о централизованном механизме управления кластером (Kerberous). Вместе с тем, разрабатывается математическое обеспечение для интеграции бинарно-несовместимых архитектур. Наиболее известное окружение такого типа - это система виртуальных параллельных машин (PVM - Parallel Virtual Machine), разработанное в Национальной лаборатории Оак Ридж, США.

Сетевые технологии дали толчок развитию параллельных архитектур с разделенной памятью. В структуре компьютерных центров на первый план выходят массивно-параллельные системы, которые частично вытясняют векторные машины.

Период с 1985 по 1992 год был периодом триумфа массивно-параллельных вычислительных систем, которые становятся центральным и наиболее мощным элементом суперкомпьютерного центра. Параллельно начинаются работы по интеграции суперкомпьютерных центров между собой, появляются прототипы мета-центров. Вместе с тем, серьезный упор делается на вопросы защиты информационных и вычислительных ресурсов от несанкционированного использования. Полностью пересматривается концепция безопасности. Становится обязательным использовать матобеспечение уровня C-2 и выше, изоляция опорной сети центра от периферийных сетей с помощью firewall. Используются алгоритмы шифрования для защиты критического трафика. Механизмы сертификации и электронной подписи используются для аутентификации и авторизации пользователей.

После 1992 года наряду с массивно-параллельными системами появляются мощные параллельные системы с общей памятью. Как известно, пиковая мощность таких систем ограничена спецификой коммуникационной среды (шина или матричный коммутатор), кроме того аппаратная реализация когерентной памяти требует дополнительных затрат и, как следствие, отношение цены к производительности для таких систем значительно хуже, чем в системах MPP (массивно-параллельные процессоры). Популярность эти системы завоевали вследствие своей универсальности, поскольку аппаратура берет на себя значительную часть задач диспетчеризации параллельных процессов, снимая их с программиста.

В более общем плане, подъем систем с общей памятью (SMP - Symmetric Mutli-Processor) объясняется наметившейся четкой тенденции к универсализации. Другим толчком явилось то, что вычислительная производительность компьютеров растет очень быстрыми темпами (демонстрируя в последнее десятилетие экспоненциальных характер - мощность процессоров удваивается каждые 16-18 месяцев), а производительность труда программистов растет довольно медленно. В связи с этим, возрастает доля затрат, приходящихся на математическое обеспечение в общем объеме затрат на создание и поддержание функционирования суперкомпьютерного центра. Выгодным оказывается использовать универсальные архитектуры и универсальные технологии построения параллельных приложений, что позволяет использовать ранее наработанное математическое обеспечение и математическое обеспечение третьих фирм.

Начиная с 1996 года прослеживается новая тенденция в архитектурном составе компьютерных центров - появляются гибридные вычислительные системы. Эти системы, являясь по сути системами с общей памятью, позволяют преодолеть ограничение масштабируемости при умеренных финансовых затратах путем введения концепции двухуровневой памяти. Физически такие системы представляют собой решетку, узлом которой является традиционный SMP. Узлы между собой объединяются в единую систему. При этом пользовательское приложение может использовать не только оперативную память локального мультипроцессорного узла, но и общую память объединенной системы. Таким образом, удается сочетать хорошую масштабируемость систем MPP с универсальностью SMP.

Теперь обратимся к структурным изменениям, происходящим в суперкомпьютерных центрах. Первое кардинальное изменение структуры надо отнести к концу 70-х годов, когда суперкомпьютерные центры от задач сугубо расчетных обратились также к задачам обработки информации. Стали появляться информационные архивы национального масштаба и оформляться регламент доступа к информационным ресурсам. Неотъемлемым атрибутом суперкомпьютерного центра становится информационный сервер и автоматизированный архив. Существенная часть ресурсов направляется на обслуживание информационных систем и обработку информации.

В начале 80-х годов, с появлением и широким распространение персональных компьютеров и рабочих станций, когда сетевая модель взаимодействия систем вошла в жизнь, резко изменилась концепция доступа и взаимодействия центральных вычислительных систем с периферией. Доминирующим способом работы становится удаленный доступ. К этому времени следует отнести создание сетевой графической среды X Window, появление первых пакетов визуализации данных. Теперь на первый план вышла технология "клиент-сервер", позволяющая гибко сочетать ресурсы персональных рабочих станций с уникальными вычислительными возможностями центральных систем.

Году этак в 1990-м стало ясно, что системы визуализации должны стать отдельной и обязательной частью суперкомпьютерного центра. Это обусловлено не только необходимостью визуализации расчетных данных, но и тем, что в задачах обработки информации заметную долю начали иметь задачи, связанные с обработкой именно видеоинформации. Кроме того, визуальное представление данных позволило ускорить процесс научного и инженерного поиска и снизить затраты на дизайн. Суперкомпьютерные системы визуализации и автоматизированного проектирования появляются в крупных промышленных компаниях.

Очередные структурные изменения происходят прямо сейчас и обусловлены интеграционными тенденциями. На базе суперкомпьютерных центров в национальном масштабе создаются мета-центры. Технической базой для этого является развитие сетевых технологий, позволяющих гарантированть не только высокую пиковую пропускную способность каналов, но и обеспечить гарантированное качество сервиса. Последний факт открывает принципиальную возможность использования таких коммуникационных каналов в качестве коммуникационной среды мета-компьютера. Несмотря на то, что пропускная способность каналов растет быстро, задержка при передачи данных не может быть сделана меньше величины, определяемой скоростью распространения света. Поэтому возникают (и в ближайшее время будут решаться) проблемы интеграции географически разнесенных центров. Основой должен стать новый подход к распределенным вычислениям и децентрализованная синхронизация событий. Это, в свою очередь должно оказать влияние на развитие технологий распределенной обработки информации и на саму структуру и номенклатуру узлов мета-компьютера.

С технической точки зрения, метацентр получается в результате выделения каждым центром определенного и хорошо-контролируемого объема ресурсов в качестве слагаемого единой вычислительной системы. Такой метакомпьютер не обязательно имеет централизованное управление. Наоборот, прослеживаются тенденции к распределенному управлению и функциональному разделению административных задач.

Другим характерным изменением в порядке и способе обслуживания клиента, является развитие распределенных вычислительных сервисов. При этом вычислительная система обслуживает удаленные запросы на выполнение стандартных вычислений. Эти стандартные вычислительные задачи оформлены в виде модулей, открытых для удаленного (часто - анонимного) использования. Появляется все большее количество таких модулей удаленных вычислений (или обработки информации). Постепенно формируются библиотеки таких модулей. Пользователи могут создавать свое приложение, использующее в качестве своей части удаленные вычислительно-информационные модули, создавая системы распределенных вычислений и распределенной обработки информации. В качестве базовых протоколов используют протоколы семейства ORBA (Open Request Broker architecture). Именно такой безличный и стандартизованный доступ постепенно вытесняет традиционную интерактивную работу и пакетную обработку.