Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Паралельні обчислювальні системи та паралельні обчислення. Проектування клієнт-серверних економічних інформаційних систем

Шляхи досягнення паралелізму. Під паралельними обчисленнями розуміють процеси обробки даних, в яких комп’ютерна система одночасно здійснює декілька операцій. Досягнення паралелізму можливе за умови виконання наступних вимог до архітектурних принципів побудови обчислювального середовища:

- незалежність функціонування окремих пристроїв ЕОМ - ця вимога відноситься всіх основних компонентів обчислювальної системи (пристрої введення-виведення, обробляючим процесорам, пристроям пам’яті);

- надлишковість елементів обчислювальної системи - організація надлишковості може здійснюватися у таких формах: використання спеціалізованих пристроїв (окремі процесори для цілочислової та дійсної арифметики, пристрої багаторівневої пам’яті - регістри, кеш); дублювання пристроїв ЕОМ шляхом використання декількох однотипних обробляючих процесорів чи кількох пристроїв оперативної пам’яті.

Окремою формою забезпечення паралелізму може бути конвеєрна реалізація обробляючих пристроїв, коли виконання операцій в пристроях представляється як виконання послідовності складових операції команд. В результаті при обчисленнях на таких пристроях на різних стадіях обробки можуть знаходитися одночасно декілька різних елементів даних.

Розрізняють такі режими виконання незалежних частин програми:

- багатозадачний режим (режим розділення часу), коли для виконання декількох процесів використовується єдиний процесор. Такий режим є псевдопаралельним, коли активним, виконуваним, може бути один єдиний процес, а всі інші процеси знаходяться в стані очікування своєї черги; застосування режиму розділення часу може підвищити ефективність організації обчислень, наприклад, коли один з процесів не може виконуватися внаслідок очікування даних, що вводяться, процесор може бути задіяний для виконання іншого процесу, готового до виконання. В цьому режимі з’являються багато ефектів паралельних обчислень (необхідність взаємного виключення та синхронізації процесів, та ін.), та, як результат, цей режим можна використати за умови початкової підготовки паралельних програм;

- паралельне виконання, коли в один і той же момент часу може виконуватися декілька команд обробки даних. Такий режим обчислень може бути забезпечений не тільки за наявності декількох процесорів, але й з використанням конвеєрних та векторних пристроїв оброблення;

- розподілені обчислення; цей термін використовують для вказівки паралельної обробки даних, коли використовуються декілька пристроїв оброблення, достатньо віддалених один від одного, коли передача даних за лініями зв’язку призводить до істотних часових затримок. Як результат, ефективне оброблення даних за умови такого способу організації обчислень можливе тільки для паралельних алгоритмів з низькою інтенсивністю потоків між процесорних передач даних. Ці умови характерні, наприклад, за умови обчислень в багатомашинних обчислювальних комплексах, утворених об’єднанням декількох окремих ЕОМ з використанням каналів зв’язку локальних чи глобальних інформаційних мереж.

Далі розглядатимемо другий тип організації паралелізму, який реалізується у багатопроцесорних обчислювальних системах.

Приклади паралельних обчислювальних систем. Розмаїття паралельних обчислювальних систем величезне. Кожна така система унікальна, в кожній з них встановлюються різні апаратні складові: процесори (Intel, Power, AMD, HP, Alpha, Nec, Cray, та ін.), мережеві карти (Ethernet, Myrinet, Infiniband, SCI,...). Вони функціонують під управлінням різних операційних систем (версії Unix/Linux, версії Widjws,...) і використовують різне прикладне програмне забезпечення. Видається, що практично неможливо знайти між ними щось спільне, що не так. Далі будуть сформульовані варіанти класифікацій паралельних обчислювальних систем. Розглянемо декілька прикладів.

Суперкомп’ютери. Початком ери суперкомп’ютерів вважається 1976 різ з появою векторної системи Cray 1. Результати, показані цією системою на обмеженому в той час наборі додатків, були більш ніж вражаючими в порівнянні з іншими, тому система отримала назву "суперкомп’ютер" і протягом тривалого часу вона визначала розвиток всієї індустрії високопродуктивних обчислень. Проте в результаті сумісної еволюції архітектури та програмного забезпечення на ринку стали з’являтися системи з кардинально різними характеристиками, тому поняття "суперкомп’ютер" стало багатозначним і неодноразово переглядалися. Спроби дати означення терміну "суперкомп’ютер" базуватися не тільки на продуктивність, не зворотно приводять до необхідності постійно переглядати таку позицію. З альтернативних означень найбільш цікаві два: економічне та філософське. Перше означає, що суперкомп’ютер - це система, ціна якої вища за 1 - 2 млн. доларів США, друге - що суперкомп’ютер - це комп’ютер, потужність якого тільки на порядок менша необхідної для розв’язання сучасних задач.

Програма ASCI. Програма ASCI (http://www.llnl.gov/asci/) - Accelerated Strategic Computing Initiative, яка підтримується Міністерством енергетики США, в якості однієї з основних цілей - створення суперкомп’ютерів з продуктивністю в 100 TFlops (Терафлопс, означає 1 трильйон операцій за секунду). Перша система серії ASCI - ASCI Red, створена в 1996 р. компанією Intel, стала першим в світі комп’ютером з продуктивністю в 1 TFlops, яка надалі була доведена до 3 TFlops. Трьома роками пізніше з’явилися ASCI Blue Pacific від IBM та ASCI Blue Mountain від SGI, які стали першими на той час суперкомп’ютерами з швидкодією 3 TFlops. В червні 2000 р. була введена в дію система ASCI White (http://www.llnl.gov/asci/platforms/white/) з піковою продуктивністю вище за 12 TFlops, реальна продуктивність на тесті LINPACK скала 4938 TFlops, пізніше цей показник був доведений до 7304 TFlops. Апаратно ASCI White є системою IBM RS/6000 SP з 512 симетричними мультипроцесорами (SMP) вузлами. Кожний вузол має 16 процесорів, система в цілому - 8192 процесорів. Оперативна пам’ять системи складає 4 ТВ, ємність дискового простору складає 180 ТВ. Всі вузли системи є симетричними мультипроцесорами IBM RS/6000 POWER 3 з 64 - розрядною архітектурою. Кожний вузол автономний, має власну пам’ять, операційну систему, локальний диск та 16 процесорів. Процесори POWER 3 є суперскалярними 64 - розрядними числами конвеєрної організації з двома пристроями з обробки команд з плаваючою комою та трьома пристроями з обробки цілочислових команд. Вони здатні виконувати до 8 команд за тактовий цикл та до 4 операцій з плаваючою комою за такт. Тактова частота кожного такого процесора 375 MHz.

Програмне забезпечення ASCI White підтримує мішану модель програмування - передача повідомлень між вузлами та багато потоковість всередині SMP - вузла. Операційна система є версією Unix - IBM AIX. AIX підтримує як 32 -, так і 64 - розрядні системи RS/6000. Підтримка паралельного коду на ASCI White включає паралельні бібліотеки, налагоджування, зокрема TotalView), профілювання, утиліти IBM та сервісні програми з аналізування ефективності виконання. Підтримуються бібліотеки MPI, OpenMP, потоки POSIX та транслятор директив IBM. Є паралельне налагодження IBM.

Система BlueGene. Один з найпотужніших нині суперкомп’ютерів у світі створений фірмою IBM, роботи в цьому напрямку продовжуються донині. На даний час система називається "BlueGene/L DD2 beta-System", вона є першою чергою повної обчислювальної системи. Згідно з прогнозами, на момент введення в дію в роботу її пікова продуктивність досягне 360 TFlops. Основні напрямки застосування є гідродинаміка, квантова хімія, моделювання клімату, та ін. Поточний варіант системи має такі характеристики: 32 стійки по 1024 двох ядерних 32-бітних процесори PowerPC 440 з тактовою частотою 0.7 GHz; пікова продуктивність - порядку 180 TFlops; максимально показана продуктивність (на тесті LINPACK) - 135 TFlops.

MBC - 1000. Один з найпотужніших в РФ суперкомп’ютерів - Багатопроцесорна обчислювальна система МВС-1000М встановлена у в Міжвідомчому супекомп’ютерному центрі РАН, роботи з його створення проводилися з 2000 до 2001рік. Склад системи такий: 384 двох процесорних модулі на базі Alpha 21264 з тактовою частотою 667 MHz (кеш L2 - 4 Mb), зібрані у вигляді 6 базових блоків, по 64 модулі у кожному; керуючий сервер та файл-сервер NetApp F840; мережі Myrinet 2000 та Fast/Gigabit Ethernet; мережевий монітор; система безперебійного живлення. Кожний обчислювальний модуль має по 2 Gb оперативної пам’яті, HDD 20 GB, мережеві карти Myrinet (2000 Mbit). при обміні даними між модулями з використанням протоколів МР1 на мережі Myrinet пропускна здатність в МВС-1000М складає 110-150 Mb в секунду.

Кластер AC3 Velocity Cluster. Цей кластер встановлений в Корнельському університеті США є результатом сумісної діяльності університету та консорціуму АС3 (Advanced Cluster Computing Consortium), утвореного компаніями Dell, Intel. Microsoft, Giganet та ще 15 виробників ПЗ з метою інтеграції різних технологій для створення кластерної архітектури для навчальних та державних установ. Склад кластера: 64 чотирьох процесорних сервери Dell PowerEdge 6350 на базі Intel Pentium III Xeon MHz, 4 GB HDD, 100 MBit Ethernet card; 1 восьми процесорний сервер Dell PowerEdge 6350 на базі Intel Pentium III Xeon 550 MHz, 8 GB RAM, 36 GB HDD, 100 MBit Ethernet card.

Чотирьох процесорні сервери змонтовані по вісім штук на стійку і працюють під управлінням ОС Microsoft Windows NT 4.0 Server Enterprise Edition. Між серверами встановлено з’єднання на швидкості 100 Мбайт/с через Cluster Switch компанії Giganet.

Завдання в кластері управляються з використанням Cluster ConNTroller, створеного в Корнельському університеті. Пікова продуктивність АС3 Velocity складає 122 GFlops з вартістю в 4-5 меншою, порівняно з суперкомп’ютерами з аналогічними показниками. На момент виходу в дію, в 2000 році, кластера з показниками на тесті LINPACK в 47 GFlops займав 381 стрічку в списку Top 500.

Кластер NCSA NT Supercluster. В 2000 році в Національному центрі суперкомп’ютерних технологій (NCSA - National Center for Supercomputing Applications) на основі робочих станцій Hewlett-Packard Kayak XU PC workstation (http://www.hp.com/desktops/kaeak/) був зібраний ще один кластер, для якого була вибрана операційна система OC Microsoft Windows. Розробники назвали його NT Supercluster (http://archive.ncsa.uiuc.edu/SCD/Hardware/NTCluster/). На момент введення в дію кластер з показником на тесті LINPACK в 62 GFlops та піковою продуктивністю в 140 GFlops займав 207 стрічку списку Top 500. Кластер побудований з 38 двох процесорних серверів на базі Intel Pentium III Xeon 550 MHz, 1 Gb RAM, 7.5 Gb HDD, 100 MBit Ethernet card. Зв’язок між вузлами базується на мережі Myrinet (http://www.myri.com/murinet/index.html). Програмне безпечення кластера: операційна система - Microsoft Windows NT 4.0; компілятори - Fortran77, C/C++; рівень передачі повідомлень базується на HPVM (http://www-csag.ucsd.edu/projects/clusters.html).

Кластер Thunder. Нині чисельність систем, зібраних на основі процесорів корпорації Intel, які представлені в списку Top 500, складає 318. Самий потужний суперкомп’ютер, який представляє собою кластер на основі Intel Itanium2, встановлений в Ліверморській національній лабораторії (США). Апаратна конфігурація кластера Thunder (http://www.llnl.gov/linux/thunder/); 1024 сервери, по 4 процесори Intel Itanium 1.4GHz в кожному; 8 Gb оперативної пам’яті на вузол; загальна місткість дискової системи 150 Tb. Програмне забезпечення: операційна система CHOS 2.0; середовище паралельного програмування MPICH2; налагоджування паралельних програм TotalView; Intel та GNU Fortran, C/C++ компілятори. Нині кластер Thunder займає 5 позицію списку Top 500 (на момент встановлення - влітку 2004 року він займав 2 стрічку) з піковою продуктивністю 22938 GFlops і максимально показаною на тесті LINPACK 19940 GFlops.

<== предыдущая лекция | следующая лекция ==>
Технології побудови розподілених об’єктних систем. Розподілені об’єктні технології в інформаційних системах | Класифікація обчислювальних систем
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 1706; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.