КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Кластер NCSA NT Supercluster
У 2000 році в Національному центрі суперкомп'ютерних технологій (NCSA - National Center for Supercomputing Applications) на основі робочих станцій Hewlett-Packard Kayak XU РС workstation був зібраний ще один кластер, для якого як операційна система була вибрана ОС Microsoft Windows. Розробники назвали його NT Supercluster. На момент введення в дію кластер з показником продуктивності на тесті LINPACK в 62 GFlops і піковою продуктивністю в 140 GFlops займав 207-й рядок списку Top 500. Кластер побудований з 38 двопроцесорних серверів на базі Intel Pentium III Xeon 550 MHz, 1 Gb RAM, 7.5 Gb HDD, 100 Mbit Ethernet card. Зв'язок між вузлами здійснювався через мережу Myrinet. Програмне забезпечення кластера: - операційна система - Microsoft Windows NT 4.0; - компілятори - Fortran77, C/C++; - рівень передачі повідомлень заснований на HPVM. В даний час в списку Top 500 самих високопродуктивних систем кластери складають більше 80% (417 позицій).
Контрольні запитання
1 Як в загальному можна охарактеризувати мультикомп’ютерні комп’ютерні системи? 2 З якою метою використовують мультикомп’ютерні комп’ютерні системи? 3 На яких рівнях організовується інформаційна взаємодія комп'ютерів в мультикомп’ютерній комп’ютерній системі? 4 З яких компонентів складається на структурному рівні комунікаційне середовище мережі в мультикомп’ютерній комп’ютерній системі? 5 Як в процесі розробки апаратури реалізується технічна сумісність елементів мультикомп’ютерної комп’ютерної системи? 6 Які є рівні мультиплексування? 7 Що позначають терміном “кластер”? 8 Яка топологія “малих” кластерів, що складаються з 2-4 вузлів?
Лекція № 8 Комп’ютерні системи з нетрадиційною архітектурою
8.1 Асоціативні КС В основі асоціативних КС лежить асоціативний процесор. Асоціативні КС мають n процесорних елементів (ПЕ), як правило, послідовної порозрядної обробки для кожного з елементів пам'яті. Операції здійснюються одночасно всіма n ПЕ. Всі або частина елементарних послідовних ПЕ можуть синхронно виконувати операції над всіма комірками або над вибраною множиною слів асоціативної пам'яті. Приклад асоціативної КС - система STARAN, розроблена Goodyear Aerospace Corporation в 1972 році. Асоціативний процесор (АП) - це асоціативна пам'ять, що допускає паралельний запис у всі комірки, для яких було зафіксовано збіг з асоціативною ознакою. Ця особливість АП, що носить назву мультизапису, є першою відмінністю асоціативного процесора від традиційної асоціативної пам'яті. Прочитування і запис інформації можуть проводитися по двох зрізах масиву, що запам'ятовує, - або це все розряди одного слова, або один і той же розряд всіх слів. При необхідності виділення окремих розрядів зрізу зайві позиції можна маскувати. Кожен розряд зрізу в АП забезпечений власним процесорним елементом, що дозволяє між прочитуванням інформації і її записом проводити необхідну обробку, тобто паралельно виконувати операції арифметичного складання, пошуку, а також емулювати багато рис матричних КС.
8.2 Систолічні КС У систоличних структурах дані на своєму шляху, від прочитування з пам'яті до повернення назад, пропускаються через як можна більше число ПЕ (рис.8.1).
Рисунок 8.1 - Обробка даних в КС з систоличною структурою
Якщо провести паралель у фізіології, то систоли більше всього нагадують систему судин і серце, яке постійно посилає кров у всі артерії, судини і капіляри тіла. Звідси і відбувається назва систолична матриця (систола - скорочення передсердя і шлуночків серця, при якому кров нагнітається в артерії). Систоличні структури ефективні при виконанні матричних обчислень, обробці сигналів, сортуванні даних і т.д. Систолічні системи є дуже спеціалізованими обчислювачами і створюються в основному під конкретне завдання. Фактично, завдання побудови систоличного обчислювача зводиться до побудови апаратного конвеєра, що має чималий час отримання результату (тобто велику кількість ступенів) але при цьому порівняно маленький час між послідовною видачею результатів, оскільки значна кількість проміжних значень обробляється на різних ступенях конвеєра. Розглянемо як приклад систоличну структуру, що виконує процес векторного множення матриць. В основі схеми лежить ритмічне проходження двох потоків даних xi і уj назустріч один одному. Послідовні елементи кожного потоку розділені одним тактовим періодом, щоб будь-який з них міг зустрітися з будь-яким елементом зустрічного потоку. Обчислення виконуються паралельно в процесорних елементах, кожний з яких реалізує один крок в операції обчислення скалярного множення (IPS, Inner Product Step) і носить назву IPS-елементу (рис.8.2). Значення увх, що поступає на вхід ПЕ, підсумовується з добутком вхідних значень xвх і авх. Результат виходить з ПЕ як увих. 3начение хвх, крім того, для можливого подальшого використання рештою частини масиву транслюється через ПЕ без змін і покидає його у вигляді xвих (рис.8.3). Рисунок 8.2 – Функциональна схема IPS-елемента
Систолична структура - це однорідне обчислювальне середовище з процесорних елементів, що суміщає в собі властивості конвеєрної і матричної обробки і що володіє наступними особливостями: - обчислювальний процес в систоличних структурах є безперервною і регулярною передачею даних від одного ПЕ до іншого без запам'ятовування проміжних результатів обчислення; - кожен елемент вхідних даних вибирається з пам'яті одноразово і використовується стільки раз, скільки необхідно по алгоритму, введення даних здійснюється в крайні ПЕ матриці; - створюючі систоличну структуру ПЕ однотипні і кожний з них може бути менш універсальним, чим процесори звичайних багатопроцесорних систем; - потоки даних і керуючих сигналів володіють регулярністю, що дозволяє об'єднувати ПЕ локальними зв'язками мінімальної довжини; - алгоритми функціонування дозволяють сумістити паралелізм з конвеєрною обробкою даних; - продуктивність матриці можна поліпшити за рахунок додавання в неї певного числа ПЕ, причому коефіцієнт підвищення продуктивності при цьому лінійний. В даний час досягнута продуктивність систоличних процесорів: близько 1000 млрд операцій/с.
Рисунок 8.3 – Процес векторного множення матриць
8.3 Класифікація структур систол Аналіз різних типів систоличних структур і тенденцій їх розвитку дозволяє класифікувати ці структури за декількома ознаками. За гнучкістю систоличні структури можуть бути згруповані на: - спеціалізовані; - алгоритмічно орієнтовані; - програмовані. Спеціалізовані систоличні структури орієнтовані на виконання певного алгоритму. Ця орієнтація відбивається не тільки в конкретній геометрії систоличної структури, статичності зв'язків між ПЕ і числом ПЕ, але і у виборі типу операції, що виконується всіма ПЕ. Прикладами є структури, орієнтовані на рекурсивну фільтрацію, швидке перетворення Фурье для заданої кількості крапок, конкретні матричні перетворення. Алгоритмічно орієнтовані систоличні структури володіють можливістю програмування або конфігурації зв'язків в систоличній матриці, або самих ПЕ. Можливість програмування дозволяє виконувати на таких структурах деяку множину алгоритмів, що зводяться до однотипних операцій над векторами, матрицями і іншими числовими множинами. У програмованих систоличних структурах є можливість програмування як самих ПЕ, так і конфігурації зв'язків між ними. При цьому ПЕ можуть володіти локальною пам'яттю програм, і хоча всі вони мають одну і ту ж організацію, в один і той же момент часу допускається виконання різних операцій з деякого набору. Команди або керуючі слова, що зберігаються в пам'яті програм таких ПЕ, можуть змінювати і напрям передачі операндів. За розрядністю процесорних елементів систоличні структури діляться на: - однорозрядні; - багаторозрядні. В однорозрядних матрицях ПЕ в кожен момент часу виконує операцію над одним двійковим розрядом, а в багаторозрядних - над словами фіксованої довжини. За характером локально-просторових зв'язків систоличні структури бувають: - одновимірні; - двомірні; - тривимірні. Вибір структури залежить від виду оброблюваної інформації. Одновимірні схеми застосовуються при обробці векторів, двомірні - матриць, тривимірні - множин іншого типу. Систоличні структури можуть відрізнятися по топології зв'язків між ПЕ: - лінійні; - квадратні; - гексагональні; - тривимірні і ін. Кожна конфігурація матриці найбільш пристосована для виконання певних функцій, наприклад лінійна матриця оптимальна для реалізації фільтрів в реальному масштабі часу; гексагональна - для виконання операцій звернення матриць, а також дій над матрицями спеціального вигляду; тривимірна - для знаходження значень нелінійних диференціальних рівнянь в часткових похідних. Найбільш універсальними і найбільш поширеними, проте, можна рахувати матриці з лінійною структурою.
Дата добавления: 2014-01-07; Просмотров: 572; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |