Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Граф обчислювального алгоритму

Властивості паралельних алгоритмів

Багато сучасних систем являють собою ієрархію описаних вище систем. Наприклад, сучасні процесори є конвеєрними процесорами, і мають набір векторних інструкцій (MMX, SSE і т.п.), що дозволяють виконувати одночасні обчислення з різними даними. Крім того, процесор може мати два ядра, або може бути кілька процесорів в комп'ютері. Таким чином, на цьому рівні система являє собою систему із загальною пам'яттю. Потім можна з'єднати кілька таких комп'ютерів в кластер, утворивши новий рівень ієрархії: систему з розподіленою пам'яттю.

Гібридні системи

Щоб прискорити вирішення завдання, не достатньо мати паралельну обчислювальну систему. Крім цього, потрібно ще створити для такої системи спеціальну (паралельну) програму. Для того, щоб алгоритм міг бути ефективно реалізований у вигляді паралельної програми, він повинен володіти внутрішнім паралелізмом.

Будь-який алгоритм приймає вихідні дані, проробляє над ними операції, і видає результат. Якщо розглядати цей процес з кінця, то можна помітити, що для отримання результату повинні бути готові попередні дані, які безпосередньо використовуються для його отримання. Ці дані, в свою чергу, залежать від інших даних, і так далі до вихідних даних.

Розглянемо, наприклад, алгоритм обчислення виразу:

(1)

Спочатку потрібно обчислити добуток і , потім взяти корінь, і, нарешті, виконати додавання. Ми не можемо виконати додавання, поки не обчислені обидва його аргументу. Описаний алгоритм можна зобразити таким чином:

Рисунок 1. - Схема обчислення виразу (1)

Видно, що процес обробки даних може бути виражений у вигляді одно направленого графа. Такий граф можна зобразити на площині, причому кожну арифметичну операцію розташовувати максимально високо (якщо вісь часу спрямована вниз), але не вище тих операцій, результат яких потрібен для її обчислення. У такому випадку висота графа буде рівна мінімальному часу (числу кроків / етапів) рішення цього завдання на ідеальній паралельній обчислювальній системі з необмеженим числом обчислювачів.

<== предыдущая лекция | следующая лекция ==>
Системи з розподіленою пам'яттю | Ступінь паралелізму
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 348; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.