Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Структура векторного процесора

Узагальнена структура векторного процесора приведена на рис.3.4. На схемі показані основні вузли процесора, без деталізації деяких зв'язків між ними.

Особливості векторного процесора:

- обробка всіх n компонентів векторів-операндів задається однією векторною командою;

- елементи векторів представляються числами у формі з плаваючою комою;

- арифметико-логічний пристрій векторного процесора може бути реалізовано у вигляді:

- єдиного конвеєрного пристрою, здатного виконувати всі предбачені операції над числами з плаваючою комою;

- арифметико-логічний пристрій складається з окремих блоків складання і множення, а іноді і блоку для обчислення зворотної величини, коли операція ділення x/y реалізується у вигляді x(1/y). Кожний з таких блоків також конвеєризований.

 

Рисунок 3.4 – Узагальнена структура векторного процесора

 

Склад векторної системи:

- скалярный процесор, що дозволяє паралельно виконувати векторні і скалярні команди;

- векторні регістри для зберігання векторів-операндів, які є сукупністю скалярних регістрів, об'єднаних в чергу типу FIFO, здатну зберігати 50-100 чисел з плаваючою комою.

Набір векторних регістрів (Va, Vb, Vc...) є в будь-якому векторному процесорі. Система команд векторного процесора підтримує роботу з векторними регістрами і обов'язково включає команди:

- завантаження векторного регістра вмістом послідовних елементів пам'яті, вказаних адресою першої комірки цієї послідовності;

- виконання операцій над всіма елементами векторів, що знаходяться у векторних регістрах;

- збереження вмісту векторного регістра в послідовності комірок пам’яті, вказаних адресою першої комірки цієї послідовності;

- регістр довжини вектора. Цей регістр визначає, скільки елементів фактично містить оброблюваний в даний момент вектор, тобто скільки індивідуальних операцій з елементами потрібно зробити;

- регістр максимальної довжини вектора, що визначає максимальне число елементів вектора, яке може бути одночасно оброблене апаратурою процесора. Цей регістр використовується при розділенні дуже довгих векторів на сегменти, довжина яких відповідає максимальному числу елементів, що обробляються апаратурою за один прийом;

- регістр маски вектора служить для виконання таких операцій, в яких повинні брати участь не всі елементи векторів. У цьому регістрі кожному елементу вектора відповідає один біт. Установка біта в одиницю дозволяє запис відповідного елемента вектора результату у вихідний векторний регістр, а скидання в нуль - забороняє.

- регістр вектора індексів по структурі аналогічний регістру маски. Служить для виконання операцій упакування/розпаковування для отримання вектора, що містить ненульові елементи і для зворотної операції відповідно. У векторі індексів кожному елементу початкового вектора відповідає один біт. Нульове значення біта свідчить, що відповідний елемент вихідного вектора рівний нулю.

Переваги векторного процесора:

- замість багаторазового вибору одних і тих же команд досить здійснити вибір тільки однієї векторної команди, що дозволяє скоротити витрати за рахунок пристрою управління і зменшити вимоги до пропускної здатності пам'яті;

- векторна команда забезпечує процесор упорядкованими даними. Коли ініціюється векторна команда, КС знає, що їй потрібно вибрати n пар операндів, розташованих в пам'яті впорядкованим чином. Так, процесор може вказати пам'яті на необхідність почати вибір таких пар. Якщо використовується пам'ять з чергуванням адрес, ці пари можуть бути отримані із швидкістю однієї пари за цикл процесора і направлені для обробки в конвеєризованний функціональний блок. За відсутності чергування адрес або інших засобів вибору операндів з високою швидкістю переваги обробки векторів істотно знижуються.

 

3.4 Векторно-конвеєрні комп’ютерні системи

З середини 90-х років минулого століття цей вид КС став поступатися своїми позиціями іншим технологічнішим видам систем. Проте одна з розробок корпорації NEC (2002 рік) - обчислювальна система «Модель Землі» (The Earth Simulator), - була в той час самої швидкою обчислювальною системою в класі, і по суті була векторно-конвеєрною КС. Система включала 640 обчислювальних вузлів по 8 векторних процесорів в кожному. Пікова продуктивність суперкомп’ютера перевищувала 40 TFLOPS.

Суперкомп'ютер Cray X1 є непересічним представником векторно-конвеєрних КС (рис.3.5, табл.3.1, табл.3.2).

Рисунок 3.5 – Векторний суперкомп'ютер Cray X1 з 16-конвейєрними векторними процесорами

 

Таблиця 3.1 - Векторний суперкомп'ютер Cray X1

Виробник Cray Inc. (виробляють з 2003р.)
Клас архітектури Векторний суперкомп'ютер, що маштабується.
Процесор Використовуються 16-конвейєрні векторні процесори з піковою продуктивністю 12.8 GFLOP/sec. Тактова частота процесорів - 800MHz.
Число процесорів У максимальній конфігурації - до 4096.
Пам'ять Кожен процесор може містити до 16GB пам'яті. У максимальній конфігурації система може містити до 64TВ пам'яті. Вся пам'ять глобально адресуєма (архітектура DSM). Максимальна швидкість обміну з оперативною пам'яттю складає 34.1 Гбайт/сек. на процесор, швидкість обміну з кеш-пам'яттю 76.8 Гбайт/сек. на процесор.
Системне ПЗ Використовується операційна система UNICOS/mp
Засоби програму вання Реалізовані компілятори з мов Фортран і Сі++, що включають можливості автоматичної векторизації і розпаралелювання, спеціальні оптимізовані бібліотеки, інтерактивний відладчик і засоби для аналізу продуктивності. Додатки можуть писатися з використанням MPI, OPENMP, Co-array Fortran і Unified Parallel C (UPC).

Таблиця 3.2 - Можливі конфігурації векторного суперкомп'ютера Cray X1

Число стійок Число процесорів Об'єм пам'яті Пікова продуктивність
1*   64-256 Гбайт 204.8 Gflops
    256-1024 Гбайт 819.0 Gflops
    1024-4096 Гбайт 3.3 Tflops
    2048-8192 Гбайт 6.6 Tflops
    4096-16384 Гбайт 13.1 Tflops
    8192-32768 Гбайт 26.2 Tflops
    16384-65536 Гбайт 52.4 Tflops

 

Контрольні запитання

 

1 Як називається комп’ютерна система в якій паралельно використовуються конвеєрні арифметичні логічні пристрої?

2 Яка може бути архітектура засобів векторної обробки?

3 Який процесор називається векторним?

4 Як відбувається обробка елементів векторів конвеєрним арифметичним логічним пристроєм?

5 Які переваги векторного процесора?

 

 

Лекція №4

 

Матричні комп’ютерні системи

 

<== предыдущая лекция | следующая лекция ==>
Процесор з паралельним АЛП | Матричний процесор
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 1025; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.