Gentoo в мире высокопроизводительных вычислений

Авторы:
Сидоров Иван
Новопашин Алексей
---
http://mvs.icc.ru


Сегодня без применения суперкомпьютеров - высокопроизводительных вычислительных систем - становится чрезвычайно сложно добиться серьезных результатов при качественном решении ресурсоемких задач науки и промышленности. Прежде всего, это касается таких стратегически важных направлений, как молекулярная биология, генная инженерия, квантовая химия, физика высоких энергий, проектирование новых видов вооружений и летательных аппаратов, прогнозирование изменения климата и многих других - там, где ведется обработка больших массивов данных, а скорость вычислений является критичной. В связи с этим, в последние годы в мире наблюдается стремительный рост числа крупных вычислительных установок и улучшение характеристик созданных ранее.

Стремясь реагировать на растущие потребности в мощных вычислительных ресурсах, производители компьютерного оборудования предлагают все более совершенные архитектурные решения, реализующие различные формы параллелизма (многопоточность, мультипроцессинг, многоядерность и др.), тем самым, позволяя разработчикам программного обеспечения многократно ускорять процесс обработки данных. Одним из эффективных и вполне доступных способов повышения производительности вычислений является создание вычислительных кластеров – мультикомпьютеров, состоящих из множества однотипных модулей (или узлов) серийного образца, связанных единой коммуникационной средой.



Один из таких кластеров - MBC-1000/16 – создан и успешно эксплуатируется в Институте динамики систем и теории управления (ИДСТУ) СО РАН, одновременно являясь главным вычислительным ресурсом Иркутского научного центра, находящимся в коллективном доступе. Система состоит из шестнадцати двухпроцессорных серверных модулей (SMP-узлов) Supermicro. Для объединения модулей в единый вычислитель использованы соединения двух типов: Myrinet (оптоволоконная сеть для внутрипрограммных обменов) и Gigabit Ethernet (для выполнения сервисных операций). Узлы кластера функционируют под управлением OC GNU\Linux. На смену изначально установленной ОС Linux Fedore Core 2 со временем пришла ОС Gentoo Linux. Главным фактором, побудившим системного администратора кластера решиться на смену операционной системы, явилась удачно реализованная в Gentoo Linux возможность оптимизации системы путем детальной настройки параметров на конкретную аппаратную платформу. В результате проведенной оптимизации удалось добиться увеличения производительности кластера более чем на 8% ( в сравнении с системой на базе Fedore Core 2). В итоге реальная производительность МВС на тестах Massively Parallel Linpack достигла 105 GFlops.

Сегодня с помощью МВС-1000/16 ИДСТУ СО РАН решается целый ряд научно-исследовательских задач, к основным из которых можно отнести следующие:

  • Разработка параллельных алгоритмов для решения задач динамической оптимизации управляемых систем.
  • Реализация кластерного подхода к логическому криптоанализу систем поточного шифрования (генераторов двоичных последовательностей).
  • Численное моделирование точечных дефектов в кристаллах щелочных и щелочно-земельных фторидов с применением методов квантовой химии.
  • Численное моделирование эффекта спин-селективной адсорбции молекул воды на поверхности кристаллов с использованием методов молекулярной динамики.
  • Численное моделирование ионизационных и конденсационных равновесий в растворах полимеров методом Монте-Карло на трехмерной решетке.
  • Разработка библиотеки параллельных алгоритмов для решения задач целочисленного линейного программирования.
  • Разработка параллельной версии решателя больших разреженных систем булевых уравнений.

В настоящий момент в ИДСТУ СО РАН осуществляется сборка второго кластера - на платформах Intel Bensley, двухядерных процессорах Intel Xeon 5060 EM64T и интерконнекте Gigabit Ethernet. В качестве операционной системы для нового кластера решено было использовать уже зарекомендовавший себя дистрибутив Gentoo Linux. Данный выбор позволил без дополнительных усилий перенести существующую систему с МВС-1000/16 и оптимизировать ее под новую платформу. Планируется довести число счетных узлов кластера до 16 (как минимум), что будет соответствовать пиковой производительности системы в 400 GFLops. Кроме того, ближайшей задачей разработчиков является объединение двух имеющихся кластеров в единый вычислительный ресурс (grid-сегмент) с целью их совместного использования для решения ресурсоемких задач, допускающих разнородность вычислительной установки.