Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Основы реализации многопроцессорных систем (продолжение)




Лекция 12

 

Многопроцессорные системы с локальной памятью и многомашинные системы. Существуют два различных способа построения крупномасштабных систем с распределенной памятью. Простейший способ заключается в том, что­бы исключить аппаратные механизмы, обеспечивающие когерентность кэш-памяти, и сосредоточить внимание на создании масштабируемой системы па­мяти. Несколько компаний разработали такого типа машины. Наиболее извест­ным примером такой системы является компьютер T3D компании Cray Research. В этих машинах память распределяется между узлами (процессорны­ми элементами) и все узлы соединяются между собой посредством того или иного типа сети. Доступ к памяти может быть локальным или удаленным. Спе­циальные контроллеры, размещаемые в узлах сети, могут на основе анализа ад­реса обращения принять решение о том, находятся ли требуемые данные в ло­кальной памяти данного узла, или размещаются в памяти удаленного узла. В последнем случае контроллеру удаленной памяти посылается сообщение для обращения к требуемым данным.

Чтобы обойти проблемы когерентности, разделяемые (общие) данные не кэшируются. Конечно, с помощью программного обеспечения можно реализо­вать некоторую схему кэширования разделяемых данных путем их копирова­ния из общего адресного пространства в локальную память конкретного узла. В этом случае когерентностью памяти также будет управлять программное обес­печение. Преимуществом такого подхода является практически минимальная необходимая поддержка со стороны аппаратуры, хотя наличие, например, та­ких возможностей как блочное (групповое) копирование данных было бы весь­ма полезным. Недостатком такой организации является то, что механизмы про­граммной поддержки когерентности подобного рода кэш-памяти компилятором весьма ограничены. Существующая в настоящее время методика в основном подходит для программ с хорошо структурированным параллелизмом на уров­не программного цикла.

Машины с архитектурой, подобной Cray T3D, называют процессорами (машинами) с массовым параллелизмом (МРР Massively Parallel Processor). К машинам с массовым параллелизмом предъявляются взаимно исключающие требования. Чем больше объем устройства, тем большее число процессоров можно расположить в нем, тем длиннее каналы передачи управления и данных, а значит и меньше тактовая частота. Происшедшее возрастание нормы массив­ности для больших машин до 512 и даже 64К процессоров обусловлено не рос­том размеров машины, а повышением степени интеграции схем, позволившей за последние годы резко повысить плотность размещения элементов в устрой­ствах. Топология сети обмена между процессорами такого рода систем мо­жет быть различной. В таблице 12.2 приведены характеристики сети обмена для некоторых коммерческих МРР.

Для построения крупномасштабных систем альтернативой рассмотрен­ному в предыдущем разделе протоколу наблюдения может служить протокол на основе справочника, который отслеживает состояние кэшей. Такой подход предполагает, что логически единый справочник хранит состояние каждого блока памяти, который может кэшироваться. В справочнике обычно содержит­ся информация о том, в каких кэшах имеются копии данного блока, модифици­ровался ли данный блок и т.д. В существующих реализациях этого направления справочник размещается рядом с памятью. Имеются также протоколы, в кото­рых часть информации размещается в кэш-памяти. Положительной стороной хранения всей информации в едином справочнике является простота протоко­ла, связанная с тем, что вся необходимая информация сосредоточена в одном месте. Недостатком такого рода справочников является его размер, который пропорционален общему объему памяти, а не размеру кэш-памяти. Это не со­ставляет проблемы для машин, состоящих, например, из нескольких сотен про­цессоров, поскольку связанные с реализацией такого справочника накладные расходы можно преодолеть. Но для машин большего размера необходима ме­тодика, позволяющая эффективно масштабировать структуру справочника.

Таблица 12.2 – Характеристики межсоединений некоторых коммерческих МРР

Фирма Назва­ние Количе­ство уз­лов Базовая тополо­гия Разряд­ность связи (бит) Частота синхро­низации (МГц) Пиковая полоса пропус­кания связи (Мбайт/ с) Общая полоса-пропус­кания (Мбайт/с) Год вы­пуска
Thinking Machines CM-2 1024-4096 12-мерный куб          
Ncube nCube/te n 1-1024 10-мерный куб     1,2    
Intel iPSC/2 16-128 7-мерный куб          
Maspar MP-1216 32-512 2-мерная сеть+сту пенчатая Omega          
Intel Delta   2-мерная сеть          
Thinking   Machines CM-5 32-2048 много­ступен­чатое толстое дерево          
Meiko CS-2 2-1024 много­ступен­чатое толстое дерево          
Intel Paragon 4-1024 2-мерная сеть          
Cray Research T3D 16-1024 3-мерный тор          

 

В частности, чтобы предотвратить появление узкого горла в системе, свя­занного с единым справочником, можно распределить части этого справочника вместе с устройствами распределенной локальной памяти. Таким образом, мож­но добиться того, что обращения к разным справочникам (частям единого спра­вочника) могут выполняться параллельно, точно также как обращения к ло­кальной памяти в распределенной памяти могут выполняться параллельно, су­щественно увеличивая общую полосу пропускания памяти. В распределенном справочнике сохраняется главное свойство подобных схем, заключающееся в том, что состояние любого разделяемого блока данных всегда находится во вполне определенном известном месте. На рис. 12.1 показан общий вид по­добного рода машины с распределенной памятью. Вопросы детальной реализа­ции протоколов когерентности памяти для таких машин выходят за рамки настоящего обзора.

Рис. 12.1 Архитектура системы с распределённой внешней памятью по узлам справочника.

 

 




Поделиться с друзьями:


Дата добавления: 2015-04-29; Просмотров: 415; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.