1.3 Современные суперкомпьютеры

Для измерения производительности компьютеров и кластерных систем используется единица FLOPS. Как и большинство других показателей производительности, данная величина определяется путём запуска на испытуемом компьютере тестовой программы, которая решает задачу с известным количеством операций и подсчитывает время, за которое она была решена. Наиболее популярным тестом производительности на сегодняшний день является программа LINPACK, используемая, в том числе, при составлении рейтинга суперкомпьютеров TOP500. Список Top500 это – рейтинг самых высокопроизводительных вычислительных систем мира, обновляемый дважды в год [?]. В 31-м списке Top500 (июнь 2008) впервые в истории был преодолен петафлопный порог производительности – суперкомпьютер Roadrunner производства компании IBM показал на тесте LINPACK 1,026 петафлопс (предыдущий “психологический” барьер в один терафлопс был преодолен системой ASCI Red производства компании Intel в 1997 году – как видим, всего за 11 лет пик мощности вырос на три порядка) (Таблица 1.1).

Представленные в списке Top500 данные позволяют проследить характерные тенденции развития индустрии в сфере суперкомпьютерных вычислений. Первый список Top500 датирован июнем 1993 года и содержит 249 систем класса SMP и 97, построенных на основе единственного процессора; более 40% всех решений в нем были созданы на платформе, разработанной компанией Cray, еще в 1976 выпустившей первую векторную систему Cray-1, с которой связывают само возникновение термина суперкомпьютер. Уже четырьмя годами позже в Top500 не осталось ни одной системы на основе единственного процессора, а взамен появилась первая система с производительностью всего в 10 гигафлопс (в 100 раз меньше, чем у лидера списка системы ASCI Red), относящаяся к довольно новому тогда классу, который сегодня занимает в Top500 80% списка и является, по факту, основным способом построения суперкомпьютеров. Думается, многие догадались, что речь идет о кластерах.





Название годпроизводительность



Компьютер ЭНИАК1946 300 флопс



IBM 709 1957 5 Кфлопс



Cray-1 1974 160 Мфлопс



Cray Y-M 1988 2,3 Гфлопс



ASCI Red 1997 1 Тфлопс



Blue Gene/L 2006 478,2 Тфлопс



IBM Roadrunner 2008 1,042 Пфлопс



Jaguar 2008 1,059 Пфлопс



Jaguar Cray XT5-HE2009 1,759 Пфлопс



Тяньхэ-1А 2010 2,507 Пфлопс



IBM Sequoia 2012 20 Пфлопс




Таблица 1.1: Производительность суперкомпьютеров

Основным преимуществом кластеров, предопределившим их повсеместное распространение, было и остается построение из стандартных массово выпускающихся компонент, как аппаратных, так и программных. Сегодня 75% систем в списке построены на основе процессоров компании Intel, чуть больше 13% – на процессорах компании IBM и 11% – компании AMD (на двух оставшихся производителей NEC и Cray приходится по одной системе соответственно); 81% систем используют всего два типа интерконнекта: Gigabit Ethernet или Infiniband; 85% систем работают под управлением операционной системы из семейства Linux. Как видим, разнообразием список не блещет, что является несомненным плюсом с точки зрения пользователей.

Однако для пользователя массового еще большим плюсом была бы возможность иметь персональный суперкомпьютер у себя на столе или, на худой конец, стоящий под столом. И кластера, принесшие в индустрию высокопроизводительных вычислений идею “собери суперкомпьютер своими руками”, как нельзя лучше отвечают этой потребности. Сейчас трудно достоверно установить, какая система может быть названа первым в мире персональным кластером, во всяком случае уже в начале 2001 года компания RenderCube представила одноименный мини-кластер из 4-х двухпроцессорных систем, заключенных в кубический корпус со стороной всего в 42 см.

Тенденция “персонализации” супервычислений в последнее время развивается все активнее и недавно была подхвачена в том числе и производителями видеокарт, мощности которых возросли настолько, что возникло естественное желание использовать их не только в графических расчетах, но и в качестве ускорителей вычислений общего назначения. Соответствующие решения представлены в настоящее время компанией NVIDIA (семейство NVIDIA Tesla) и компанией AMD (семейство ATI FireStream) и демонстрируют в силу специфики внутреннего устройства потрясающую (в сравнении с универсальными процессорами) пиковую производительность, превышающую 1 терафлопс.