Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Эволюционный путь

Проблемы

«Стена памяти», которая переросла теперь в более общую проблему «перемещения данных»;

Энергопотребление.

Оценки показывают, что если не предпринимать специальных мер, то для питания экзафлопсной системы потребуется 150-200 MВт, что сопоставимо с атомной силовой установкой современного многоцелевого авианосца. Кроме того, это очень дорого в эксплуатации – плата за электроэнергию будет составлять 100 млн долл. в год, поэтому ставится задача не превысить уровень потребляемой энергии в 20 MВт, хотя и это много.

Примечательно, что более 70% энергии уходит на хранение данных в памяти и их перемещение.

Чтобы добиться потребления в 20 MВт вместо 150-200, надо не только решить проблему экономной передачи и хранения данных, но и снизить накладные расходы на организацию параллельного выполнения огромного количества операций, которые могут в десятки раз превышать затраты на выполнение полезных операций.

Требуемый рост параллелизма и оптимизации накладных расходов обусловливают проблему обеспечения отказоустойчивости для систем такого масштаба, с которыми ранее не работали, а также тесного сотрудничества специалистов разных областей для оптимизации систем в такой степени, которая тоже раньше не встречалась.

Проблема роста параллелизма сложна и многогранна настолько, что требует привлечения к ее решению мирового сообщества.

 

В работах эволюционного подхода выделяются два направления:

«тяжелое» – использование мощных по производительности и потребляемой энергии коммерчески доступных универсальных многоядерных процессоров и заказных коммуникационных сетей (пример - линейка Cray XT);

«легкое» – использование гораздо большего (чем в первом подходе) количества не очень мощных, но экономичных, заказных процессоров и сетей, специальных методов компоновки вычислительных узлов (линейка IBM BlueGene).

В таблице 3 приведены оценки специалистами Окриджской лаборатории эволюционного развития суперкомпьютеров «тяжелого» направления.

Оценки экспертов DARPA менее оптимистичны:

рост количества ядер в одном процессоре прогнозируется только до 64.

будет по 4-8 аппаратных поддерживаемых потоков (тредов) в каждом ядре.

Количество процессоров на одной серверной плате – 16.

Из-за ограничений по энергетике и теплоотводу тактовая частота ожидается около 1,5 ГГц.

Параллелизм запуска операций в процессорном ядре – четыре операции умножения-сложения за такт.

Пиковая производительность процессора – около 0,7 TFLOPS.

 

Таблица 3.

 

Специалисты DARPA выделяют два варианта развития событий:

без ограничений потребляемой энергии;

с ограничением в 20 МВт.

При этом выделяются две модели потребления энергии при передаче и хранении данных – оптимистичная и пессимистичная.

При энергопотреблении порядка 150 MВт в 2020 году будет достижима пиковая производительность системы:

для оптимистичной модели – в 160 PFLOPS (0,16 EFLOPS);

для пессимистичной модели – лишь 9,2 PFLOPS. Количество стоек – 600.

Вариант с ограничением потребляемой энергии в 20 MВт для оптимистичной модели обеспечит 20 PFLOPS (0,02 EFLOPS), а для Fully Scaled модели – 1 PFLOPS. Количество стоек – 78.

В чем причины таких низких оценок?

Процессорное ядро используемых процессоров оптимизировано для быстрого выполнения однотредовых (однопотоковых) программ за счет совмещения выполнения машинных команд – применяется спекулятивное выполнение команд не в порядке их следования в программе, что означает применение затратных механизмов динамического переименования архитектурных регистров, запуска команд по готовности операндов и ряда других приемов. Такие ядра слишком невыгодно масштабировать в кристалле из-за занимаемой ими площади и потребляемой энергии, вдобавок они эффективны лишь для программ с хорошей пространственно-временной локализацией обращений к памяти.

В таблице 4 приведены оценки специалистов Аргонской лаборатории эволюционного развития суперкомпьютеров «легкого» направления. Это направление эксперты DARPA рассматривают как более перспективное.

 

 

Таблица 4.

Структура процессоров для суперкомпьютеров этого направления принципиально выбиралась простой и экономной по энергетике, и, судя по таблице 2, такой подход оказался полезным и для масштабируемости ядер в процессоре – их будет 96. Простота ядра позволяет повысить и частоту – до 2,8 ГГц.

Тем не менее получение экзафлопса планируется здесь лишь к 2019 году и при двукратном превышении ограничения по потребляемой энергии – 40 MВт. Дополнительно стоит отметить специфичность решаемых на таких суперкомпьютерах задач — они не требуют глобально адресуемой памяти.

 

 

<== предыдущая лекция | следующая лекция ==>
Основные положения программы UHPC | Революционный путь
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 238; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.