КАТЕГОРИИ:

Главная
Случайная страница
Познавательное
Новые статьи
Контакты
Заказать работу

Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Устройство центрального процессора

⇐ Предыдущая 6 7 8 91011 12 13 14 15 Следующая ⇒

Классическая архитектура компьютера. Многопроцессорная и другие архитектуры компьютера

Другие типы архитектуры. Хотя большинство компьютеров имеет архитектуру фон Неймана, используются и другие архитектуры. Есть два типа ЦП с архитектурой фон Неймана, обозначаемых CISC (для компьютеров со сложным набором команд) и RISC (для компьютеров с упрощенным набором команд). Традиционный ЦП относится к типу CISC, позволяющему выполнять огромное разнообразие команд; RISC имеет меньше команд, но работает быстрее. RISC-процессор больше подходит для решения таких задач, где имеются многочисленные операции при относительно простых вычислениях, например приложения с интенсивным использованием графики; CISC-процессоры более предпочтительны в универсальных приложениях.

Для процессоров обоих этих типов приближается ситуация, когда скорость вычислений ограничивается необходимостью выполнять все на одном процессоре. Некоторые суперкомпьютеры, такие, как многопроцессорная машина, решают эту проблему путем использования параллельных матриц неймановских процессоров. Многопроцессорные машины используются там, где должны обрабатываться большие массивы сходных данных, например при прогнозировании погоды и в графике высокого разрешения. Параллельная машина распределяет данные между процессорами и выполняет расчеты одновременно. Еще один вид машины с параллельными процессорами – кластерный, или нейрокомпьютер, – использует очень простые микропроцессоры. Каждый из них действует подобно нейрону, отвечая на сигналы от нескольких различных входов. В нейрокомпьютере имеется сильно взаимосвязанная сеть таких микропроцессоров. Нейрокомпьютеры могут обучаться: при поступлении новых данных они настраивают реакции индивидуальных микропроцессоров и/или изменяют пути взаимосвязей. Эти компьютеры не программируются с помощью алгоритмов, используемых в других цифровых компьютерах; связи, алгоритмы отклика и законы обучения задаются программистом.

Основная компоновка частей компьютера и связь между ними называется архитектурой. При описании архитектуры компьютера определяется состав входящих в него компонент, принципы их взаимодействия, а также их функции и характеристики.

Рис. 1 Архитектура персонального компьютера

Практически все универсальные ЭВМ отражают классическую неймановскую архитектуру, представленную на схеме. Эта схема во многом характерна как для микроЭВМ, так и для мини ЭВМ и ЭВМ общего назначения.

Рассмотрим устройства подробнее.

Основная часть системной платы — микропроцессор (МП) или CPU (Central Processing Unit), он управляет работой всех узлов ПК и программой, описывающей алгоритм решаемой задачи. МП имеет сложную структуру в виде электронных логических схем. В качестве его компонент можно выделить:

A). АЛУ - арифметико-логическое устройство, предназначенное для выполнения арифметических и логических операций над данными и адресами памяти;

Б). Регистры или микропроцессорная память — сверхоперативная память, работающая со скоростью процессора, АЛУ работает именно с ними;

B). УУ - устройство управления - управление работой всех узлов МП посредством выработки и передачи другим его компонентам управляющих импульсов, поступающих от кварцевого тактового генератора, который при включении ПК начинает вибрировать с постоянной частотой (100 МГц, 200-400 МГц). Эти колебания и задают темп работы всей системной платы;

Г). СПр - система прерываний - специальный регистр, описывающий состояние МП, позволяющий прерывать работу МП в любой момент времени для немедленной обработки некоторого поступившего запроса, или постановки его в очередь; после обработки запроса СПр обеспечивает восстановление прерванного процесса;

Д). Устройство управления общей шиной — интерфейсная система.

Для расширения возможностей ПК и повышения функциональных характеристик микропроцессора дополнительно может поставляться математический сопроцессор, служащий для расширения набора команд МП. Например, математический сопроцессор IBM-совместимых ПК расширяет возможности МП для вычислений с плавающей точкой; сопроцессор в локальных сетях (LAN-процессор) расширяет функции МП в локальных сетях.

Характеристики процессора:

быстродействие (производительность, тактовая частота) — количество операций, выполняемых в секунду.

разрядность — максимальное количество разрядов двоичного числа, над которыми одновременно может выполняться машинная операция.

Пример 2.5.1. Первый процессор был 4-разрядным, то есть работал с числами, представляемыми 4 двоичными разрядами - 2'*= 16 чисел, 16 адресов.

16-разрядный процессор одновременно может работать с 216=б5536 числами и адресами. 32-разрядный - 232=4 294 967 296.чисел.

При тактовой частоте 33 МГц обеспечивается выполнение 7 млн. коротких машинных операций (+,*, пересылка информации); при частоте 100 МГц -20 млн. аналогичных операций.

Интерфейсная система - это:

-шина управления (ШУ) - предназначена для передачи управляющий импульсов и синхронизации сигналов ко всем устройствам ПК;

-шина адреса (ША) - предназначена для передачи кода адреса ячейки памяти или порта ввода/вывода внешнего устройства;

-шина данных (ШД) - предназначена для параллельной передачи всех разрядов числового кода;

-шина питания - для подключения всех блоков ПК к системе электропитания.

Интерфейсная система обеспечивает три направления передачи информации:

- между МП и оперативной памятью;

- между МП и портами ввода/вывода внешних устройств;

- между оперативной памятью и портами ввода/вывода внешних устройств. Обмен информацией между устройствами и системной шиной происходит с помощью кодов ASCII.

Память - устройство для хранения информации в виде данных и программ. Память делится прежде всего на внутреннюю (расположенную на системной плате) и внешнюю (размещенную на разнообразных внешних носителях информации).

Внутренняя память в свою очередь подразделяется на:

- ПЗУ (постоянное запоминающее устройство) или ROM (read only memory), которое содержит - постоянную информацию, сохраняемую даже при отключенном питании, которая служит для тестирования памяти и оборудования компьютера, начальной загрузки ПК при включении. Запись на специальную кассету ПЗУ происходит на заводе фирмы-изготовителя ПК и несет черты его индивидуальности. Объем ПЗУ относительно невелик - от 64 до 256 Кб.

- ОЗУ (оперативное запоминающее устройство, ОП — оперативная память) или RAM (random access memory), служит для оперативного хранения программ и данных, сохраняемых только на период работы ПК. Она энергозависима, при отключении питания информация теряется. ОП выделяется особыми функциями и спецификой доступа:

(1) ОП хранит не только данные, но и выполняемую программу;

(2) МП имеет возможность прямого доступа в ОП, минуя систему ввода/вывода.

Логическая организация памяти — адресация, размещение данных определяется ПО, установленным на ПК, а именно ОС.

Объем ОП колеблется в пределах от 64 Кб до 64 Мб и выше, как правило, ОП имеет модульную структуру и может расширяться за счет добавления новых микросхем.

Кэш-память - имеет малое время доступа, служит для временного хранения промежуточных результатов и содержимого наиболее часто используемых ячеек ОП и регистров МП.

Объем кэш-памяти зависит от модели ПК и составляет обычно 256 Кб.

Внешняя память. Устройства внешней памяти весьма разнообразны. Предлагаемая классификация учитывает тип носителя, т.е. материального объекта, способного хранить информацию.

(1) Накопители на магнитной ленте исторически появились раньше, чем накопители на магнитном диске. Бобинные накопители используются в суперЭВМ и mainframe. Ленточные накопители называются стримерами, они предназначены для создания резервных копий программ и документов, представляющих ценность. Запись может производиться на обычную видеокассету или на специальную кассету. Емкость такой кассеты до 1700 Мб, длина ленты 120 м, ширина 3.81 мм (2 - 4 дорожки). Скорость считывания информации-до 100 Кб/сек.

(2) Диски относятся к носителям информации с прямым доступом, т.е. ПК может обратиться к дорожке, на которой начинается участок с искомой информацией или куда нужно записать новую информацию, непосредственно.

Магнитные диски (МД)— в качестве запоминающей среды используются магнитные материалы со специальными свойствами, позволяющими фиксировать два направления намагниченности. Каждому из этих состояний ставятся в соответствие двоичные цифры — 0 и 1. Информация на МД записывается и считывается магнитными головками вдоль концентрических окружностей - дорожек. Каждая дорожка разбита на сектора (1 сектор = 512 б). Обмен между дисками и ОП происходит целым числом секторов. Кластер — минимальная единица размещения информации на диске, он может содержать один и более смежных секторов дорожки. При записи и чтении МД вращается вокруг своей оси, а механизм управления магнитной головкой подводит ее к выбранной для записи или чтения дорожке.

Данные на дисках хранятся в файлах — именованных областях внешней памяти, выделенных для хранения массива данных. Кластеры, выделяемые файлу, могут находиться в любом свободном месте дисковой памяти и необязательно являются смежными. Вся информация о том, где именно записаны кусочки файла, хранится в таблице размещения файлов FAT (file allocation table). Для пакетов МД (это диски, установленные на одной оси) и для двусторонних дисков вводится понятие цилиндр - совокупность дорожек МД, находящихся на одинаковом расстоянии от центра.

На ГМД магнитный слой наносится на гибкую основу. Диаметр ГМД: 5,25" и 3,5". Емкость ГМД от 180 Кб до 2,88 Мб. Число дорожек на одной поверхности - 80. Скорость вращения от 3000 до 7200 об/мин. Среднее время доступа 65 - 100 мс.

Каждая новая дискета перед работой должна быть отформатирована, т.е. создана структура записи информации на ее поверхности: разметка дорожек, секторов, записи маркеров, таблицы FAT. Дискеты нужно хранить аккуратно, беречь от пыли, механических повреждений, воздействия магнитных полей, растворителей. Это основной недостаток этого вида накопителей.

НЖМД или «винчестеры» изготовлены из сплавов алюминия или из керамики и покрыты ферролаком, вместе с блоком магнитных головок помещены в герметически закрытый корпус. Емкость накопителей за счет чрезвычайно плотной записи достигает нескольких гигабайт, быстродействие также выше, чем у съемных дисков (за счет увеличения скорости вращения, т.к. диск жестко закреплен на оси вращения). Первая модель появилась на фирме IBM в 1973 г. Она имела емкость 16 Кб и 30 дорожек/30 секторов, что случайно совпало с калибром популярного ружья 30'730" «винчестер».

Диаметр ЖМД: 3,5" (есть 1,8" и 5,25"). Скорость вращения 7200 об/мин, время доступа — 6 мс.

Каждым ЖМД проходит процедуру низкоуровневого форматирования — на носитель записывается служебная информация, которая определяет разметку цилиндров диска на сектора и нумерует их, маркируются дефектные сектора для исключения их из процесса эксплуатации диска. В ПК имеется один или два накопителя. Один ЖД можно разбить при помощи специальной программы на несколько логических дисков и работать с ними как с разными ЖД.

Дисковые массивы RAID - применяются в машинах-серверах БД и в суперЭВМ, они представляют собой матрицу с резервируемыми независимыми дисками, несколько НЖМД объединены в один логический диск. Можно объединить до 48 физических дисков любой емкости, формирующих до 120 логических дисков (RAID7). Емкость таких дисков составляет до 5Т6 (терабайт=1012).

НОД (накопители на оптических дисках) делятся на:

не перезаписываемые лазерно-оптические диски или компакт-диски (CD-ROM). Поставляются фирмой-изготовителем с уже записанной на них информацией. Запись на них возможна в лабораторных условиях лазерным лучом большой мощности. В оптическом дисководе ПК эта дорожка читается лазерным лучом меньшей мощности. Ввиду чрезвычайно плотной записи CD-ROM имеют емкость до 1,5 Гб, время доступа от 30 до 300 мс, скорость считывания данных от 150 до 1500 Кб/сек;

перезаписываемые CD-диски имеют возможность записывать информацию прямо с ПК, но для этого необходимо специальное устройство.

Магнитооптические диски (ZIP) — запись на такой диск производится под высокой температурой намагничиванием активного слоя, а считывание — лучом лазера. Эти диски удобны для хранения информации, но оборудование стоит дорого. Емкость такого диска до 20,8 Мб, время доступа от 15 до 150 мс, скорость считывания информации до 2000 Кб/сек.

Контроллеры служат для обеспечения прямой связи с ОП, минуя МП, они используются для устройств быстрого обмена данными с ОП - НГМД, НЖД, дисплей и др., обеспечения работы в групповом или сетевом режиме. Клавиатура, дисплей, мышь являются медленными устройствами, поэтому они связаны с системной платой контроллерами и имеют в ОП свои отведенные участки памяти.

Порты бывают входными и выходными, универсальными (ввод - вывод), они служат для обеспечения обмена информацией ПК с внешними, не очень быстрыми устройствами. Информация, поступающая через порт, направляется в МП, а потом в ОП. Выделяют два вида портов:

последовательный — обеспечивает побитный обмен информацией, обычно к такому порту подключают модем;

параллельный — обеспечивает побайтный обмен информацией, к такому порту подключают принтер. Современные ПК обычно оборудованы 1 параллельным и 2 последовательными портами.

Видеомониторы — устройства, предназначенные для вывода информации от ПК пользователю. Мониторы бывают монохромные (зеленое или янтарное изображение, большая разрешающая способность) и цветные. Самые качественные RGB-мониторы, обладают высокой разрешающей способностью для графики и цвета. Используется тот же принцип электронной лучевой трубки как у телевизора. В портативных ПК используют электролюминесцентные или жидкокристаллические панели. Мониторы могут работать в текстовом и графическом режимах. В текстовом режиме изображение состоит из знакомест — специальных знаков, хранимых в видеопамяти дисплея, а в графическом изображение состоит из точек определенной яркости и цвета. Основные характеристики видеомониторов - разрешающая способность (от 600х350 до 1024х768 точек), число цветов (для цветных) -от 16 до 256, частота кадров фиксированная 60 Гц.

Принтеры — это устройства вывода данных из ЭВМ, преобразовывающие информационные ASCII-коды в соответствующие им графические символы и фиксирующие эти символы на бумаге. Принтеры - наиболее развитая группа внешних устройств, насчитывается более 1000 модификаций.

Принтеры бывают черно-белые или цветные по способу печати они делятся на:

матричные — в этих принтерах изображение формируется из точек ударным способом, игольчатая печатающая головка перемещается в горизонтальном направлении, каждая иголочка управляется электромагнитом и ударяет бумагу через красящую ленту. Количество игл определяет качество печати (от 9 до 24), скорость печати 100-300 символов/сек, разрешающая способность 5 точек на мм;

струйные — в печатающей головке имеются вместо иголок тонкие трубочки - сопла, через которые на бумагу выбрасываются мельчайшие капельки чернил (12 - 64 сопла), скорость печати до 500 символов/сек, разрешающая способность - 20 точек на мм;

термографические — матричные принтеры, оснащенные вместо игольчатой печатающей головки головкой с термоматрицей, при печати используется специальная термобумага;

лазерные — используется электрографический способ формирования изображений, лазер служит для создания сверхтонкого светового луча, вычерчивающего на поверхности светочувствительного барабана контуры невидимого точечного электронного изображения. После проявления изображения порошком красителя (тонера), налипающего на разряженные участки, выполняется печать - перенос тонера на бумагу и закрепление изображения на бумаге при помощи высокой температуры. Разрешение у таких принтеров до 50 точек/мм, скорость печати - 1000 символов/сек.

Сканеры - устройства ввода в ЭВМ информации непосредственно с бумажного документа. Можно вводить тексты, схемы, рисунки, графики, фотографии и другую информацию. Файл, создаваемый сканером в памяти ЭВМ называется битовой картой. Существует два формата представления графической информации в ЭВМ:

растровый — изображение запоминается в виде мозаичного набора множества точек на экране монитора, редактировать такие изображения с помощью текстовых редакторов нельзя, эти изображения редактируют в Corel Draw, Adobe PhotoShop;

текстовый — информация идентифицируется характеристиками шрифтов, кодами символов, абзацев, стандартные текстовые процессоры предназначены для работы именно с таким представлением информации.

Битовая карта требует большого объема памяти, поэтому после сканирования битовые карты упаковывают с помощью специальных программ (PCX, GIF). Сканер подключается к параллельному порту. Сканеры бывают:

черно-белые и цветные (число передаваемых цветов от 256 до 65 536);

ручные перемещаются по изображению вручную, за один проход вводится небольшое количество информации (до 105 мм), скорость считывания - 5-50 мм/сек;

планшетные — сканирующая головка перемещается относительно оригинала автоматически, скорость сканирования -2-10 сек на страницу;

роликовые — оригинал автоматически перемещается относительно сканирующей головки;

проекционные - напоминают фотоувеличитель, внизу -сканируемый документ, сверху - сканирующая головка;

штрих-сканеры — устройства для считывания штрих-кодов на товарах в магазинах.

Разрешающая способность сканеров от 75 до 1600 точек/дюйм.

Манипуляторы - компьютерные устройства, управляемые руками оператора:

мышь — устройство для определения относительных координат (смещения относительно предыдущего положения или направления) движения руки оператора. Относительные координаты передаются в компьютер и при помощи специальной программы могут вызывать перемещения курсора на экране. Для отслеживания перемещения мыши используются различные виды датчиков. Самый распространенный - механический (шарик, к которому прикасаются несколько валиков), существует еще оптический датчик, обеспечивающий более высокую точность считывания координат;

джойстик — рычажный указатель - устройство для ввода направления движения руки оператора, их чаще используют для игр на компьютере;

дигитайзер или оцифровывающий планшет — устройство для точного ввода графической информации (чертежей, графиков, карт) в компьютер. Он состоит из плоской панели (планшета) и связанного с ней ручного устройства - пера. Оператор ведет вдоль графика перо, при этом абсолютные координаты поступают в компьютер.

Клавиатура — устройство для ввода информации в память компьютера. Внутри расположена микросхема, клавиатура связана с системной платой, нажатие любой клавиши продуцирует сигнал (код символа в системе ASCII -16-ричный порядковый номер символа в таблице), в памяти ЭВМ специальная программа по коду восстанавливает внешний вид нажатого символа и передает его изображение на монитор.

Конкретный набор компонент, входящих в данный компьютер, называется его конфигурацией. Минимальная конфигурация ПК необходимая для его работы включает в себя системный блок (там находятся МП, ОП, ПЗУ, НЖМД, НГМД), клавиатуру (как устройство ввода информации) и монитор (как устройство вывода информации)

Многопроцессорный компьютер (мультипроцессор) ПС-2000 предназначен для задач, обладающих массовым параллелизмом на уровне элементарных операций, и ориентирован на высокопроизводительную обработку данных по хорошо распараллеливаемым алгоритмам. Синхронная высокопараллельная обработка многих потоков данных в нем осуществляется под управлением общего потока команд, что свойственно SIMD-архитектурам (один поток команд, много потоков данных).

Мультипроцессор состоит из набора однотипных процессорных элементов (ПЭ1, ПЭ2, …, ПЭN), связанных между собой регулярным и магистральным каналом, и общего устройства управления (ОУУ) (рис. 1).

Каждый ПЭ, а также ОУУ состоят из нескольких функциональных устройств, включающих самую быструю в компьютере программно доступную регистровую память. Совокупность этих устройств (как в ОУУ, так и всех ПЭ) образует разветвленный конвейерный агрегат с программно конфигурируемыми связями. Каждое функциональное устройство составляет конвейерную ступень. Обмен данными между этими устройствами производится через общий для соседних ступеней регистр. Состав и назначение функциональных устройств каждого ПЭ приведены в табл. 1.

ОУУ обеспечивает прием и хранение программы мультипроцессора, генерацию и передачу общих для всех ПЭ управляющих сигналов, синхронизацию процессов обработки и ввода-вывода, тестирование ПЭ, а также связь с внешней мониторной подсистемой (МПС) (рис. 2). Состав и назначение функциональных устройств ОУУ приведены табл. 2.

Оригинальная архитектура ПС-2000 соединила относительную простоту аппаратных решений систем управления одним потоком команд с беспрецедентно высокой гибкостью программирования высокопараллельной обработки одновременно многих потоков данных. Уникальная гибкость управления ПС-2000 ломает привычные представления о функциональных возможностях SIMD-компьютеров. Невероятно, но в серийном ПС-2000 было сделано, казалось, совершенно немыслимое для компьютеров этого класса. В ресурсах ПС-2000 на программном уровне была эмулирована многопроцессорная архитектура MIMD (много потоков команд, много потоков данных). При этом все ПЭ, работая параллельно под управлением устройства активации, могли одновременно выполнять каждый свою программу, загруженную в собственный модуль оперативной памяти. Например, 64-процессорный SIMD-компьютер ПС-2000 смог параллельно выполнять 64 потока разных программ. Существовавшие на тот момент SIMD-компьютеры этого делать не умели.

Перечислим особенности архитектуры ПС-2000, которые обеспечили ей высокую гибкость и эффективностью вычислений.

· Команды отличались повышенной функциональной гибкостью управления разнообразными видами аппаратного параллелизма. Это качество достигается за счет многоуровневого иерархического структурирования большого множества одновременно исполняемых операций.

· Виды программно управляемого параллелизма:

— одновременное выполнение во всех ПЭ множества разнотипных действий (активация, вычислительные операции, вычисление адресов, доступ к модулям оперативной памяти, межпроцессорные пересылки данных по регулярному каналу);

— одновременное выполнение любого, программно задаваемого подмножества разнотипных действий (действия в ПЭ; ОУУ; параллельный обмен данным между модулями оперативной памяти ПЭ и набором дисководов через автономные каналы системы внешней памяти – СВП; действия в мониторной подсистеме), управление процессами внешней операционной системы.

· Наличие значительных объемов регистровой памяти ПЭ, в которых параллельно во всех активных ПЭ реализуются массовые вычисления и межпроцессорные обмены при исполнении циклических участков программ. Для циклов с большим числом повторений доля обращения к более медленным модулям оперативной памяти ПЭ может быть малой. В этом случае регистры реализуют положительный эффект кэширования (причем с параллельным выполнением действий во многих ПЭ).

· Межпроцессорная конвейеризация регистровых вычислений через регистры B регулярного канала обеспечивает режим программируемых систолических структур, что дает предельно достижимый уровень параллелизма.

· Набор однотипных устройств адресной арифметики L ПЭ обеспечивает параллельный доступ к памяти М по набору адресов с возможностями инкрементной модификации этих адресов.

· Набор однотипных устройств активации ПЭ обеспечивает высокий уровень параллелизма при ассоциативной обработке больших массивов данных (поиск и сортировки по программно задаваемым предикатным функциям, теоретико-множественные операции, обработка растровой графики, событийное управление вычислительными действиями и др.).

Система команд

Программирование мультипроцессора производится посредством высокопараллельных иерархически структурированных команд, которые обеспечивают программисту наглядное представление параллелизма функциональных устройств и высокоэффективное управление всеми действиями, синхронно исполняемыми в разветвленном конвейеризованном агрегате, связывающем функциональные устройства ПЭ и ОУУ.

Два верхних уровня структуры команды показаны на рис. 3. Все команды имеют одинаковый размер— 64 разряда— и разделены на две равные части— левую и правую. Каждая из них разделена на несколько полей. В каждом поле для соответствующего функционального устройства задается набор трехадресных операций с регистрами. В полях левой части задается управление устройством Т, а также либо S, либо В. В полях правой части задается управление либо устройствами М и L, либо W и устройствами H и HL, либо G.

После простой дешифрации команды все заданные в ее полях действия исполняются параллельно и синхронно на соответствующих устройствах.

Чем больше действий в полях каждой команды, тем выше параллелизм программы, эффективнее использование вычислительных ресурсов и, естественно, скорость выполнения. Искусство программирования мультипроцессора состоит в написании как можно более наполненных действиями полей команд.

Эффективность распараллеливания повышается за счет совмещения во времени разнотипных устройств. Например, выполнение массовых вычислений в устройствах S ПЭ совмещается с сопутствующими операциями (подготовка настроек, модификация адресов операндов, считывание операндов, запись результатов, управление конфигурацией решающего поля и т.п.). Таким образом, мультипроцессор ПС-2000 с общим потоком команд максимально использует параллелизм разнотипных и однотипных устройств.

Масштабируемость

Мультипроцессор ПС-2000 компонуется из модулей трех типов, каждый из которых размещается в одной стойке. Модули масштабирования компонуются из устройства обработки (УО), состоящего из 8 ПЭ и ОУУ. Модули имеют следующий состав:

· базовый – одно УО (8 ПЭ) и одно ОУУ;

· наращивания 1 — одно УО (8 ПЭ);

· наращивания 2 — два УО (16 ПЭ).

Минимальная конфигурация (8 ПЭ) состоит из одной стойки, максимальная (64 ПЭ) состоит из пяти стоек в виде «звезды».

Технические характеристики устройств ПС-2000

Быстродействие, разрядность и объемы регистровой и оперативной памяти определялись доступной элементной базой, однако структура и архитектура мультипроцессора не зависит существенным образом от элементной базы.

Устройство S работает с 24-разрядными регистровыми операндами. Однотактные арифметические операции с фиксированной запятой и логические операции над словами выполняются за 0,32 мкс, что соответствует рабочей частоте 3 МГц. Сложение/вычитание в формате плавающей запятой выполнялось за три такта (0,96 мкс), умножение— за пять тактов (1,6 мкс).

Объем одного модуля памяти данных М или Н составлял 1638424-разрядных слова, операции считывания или записи выполняются пословно за 0,96 мкс. Объем памяти программ G составляет 1638464-разрядных слова. Время выдачи каждой команды— 0,32 мкс, время выполнения операции ветвления – от 1,28 до 1,92 мкс.

Регулярный канал обеспечивал массовый обмен данными в режиме сегментируемого многокольцевого сдвига между соседними ПЭ.За 0,32 мкс производится передача и прием N 24-разрядных слов, где N – количество ПЭ в мультипроцессоре ПС-2000.

Магистральный канал обеспечивает «широковещательную» передачу одного 24-разрядного слова всем активным ПЭ либо из регистра KU ОУУ в один такт за 0,32 мкс, либо из любого ПЭ в два такта— за 0,64 мкс.

Регулярный и магистральный каналы могут программно сегментироваться на несколько не связанных между собой одинаковых фрагментов размером 8, 16, 32 или 64 ПЭ.

При тактовой частоте 3 МГц средняя производительность 64-процессорного компьютера ПС-2000 на задачах промышленной обработки данных была близка к пиковой— 200 MFLOPS

Любой ЦП независимо от его предназначения располагает рядом функциональных устройств (ФУ): блоками целочисленных вычислений (Integer Execution Unit, E-box, арифметико-логическое устройство), обработки адресов (Address Translation Unit, A-box), контроллером системной шины (System Bus Controller, B-box), декодером команд (Instruction Decoding Unit, I-box). Для проведения вычислений и хранения промежуточных результатов используется так называемый файл регистров (их может быть несколько), состоящий из фиксированного количества записей определенной длины (регистров). Практически во всех современных ЦП реализованы и средства предсказания направления условных переходов. С начала 1990-х гг. общепринятой стала практика внедрения в ядро ЦП блока вещественных вычислений (Floating-Point Unit, F-box). Если дизайн определенной аппаратной платформы предполагал использование кэш-памяти с прямым доступом, то в ЦП вводился блок взаимодействия с кэш-памятью (Cache Memory Interface Unit, C-box). В современных ЦП нередко также реализованы контроллеры памяти, периферийных шин и т. Д

Центральный процессор. Ключевыми подсистемами компьютера являются управляющее устройство (УУ) и арифметико-логическое устройство (АЛУ). Вместе они составляют центральный процессор (ЦП) – «командный пункт». В ЦП компьютер манипулирует данными, хранит след своих команд и управляет остальными подсистемами. В большинстве микрокомпьютеров ЦП размещается на одиночном микроэлектронном чипе. У миникомпьютеров УУ зачастую находится на одном чипе, АЛУ – на другом, а команды, управляющие обоими этими устройствами, – на третьем. В больших компьютерах ЦП рассредоточен по многим чипам. Во всех случаях ЦП занимает сравнительно мало места.

ЦЕНТРАЛЬНЫЙ ПРОЦЕССОР

Центральный процессор имеет дело непосредственно с программой, хранимой в основной памяти. Программа представляет собой просто перечень инструкций, указывающих компьютеру, что делать. Большинство компьютерных программ содержит два вида информации: команды и данные. Команды интерпретируются УУ, которое управляет всем, что должно быть сделано, например сложением в АЛУ. Команды поступают в УУ в форме кода операции, называемого так потому, что он сообщает компьютеру, что делать дальше. Большая часть компьютерных задач решается путем манипуляции данными: перемещения слов из одного места памяти в другое, сложения, вычитания, сравнения и изменения слов.

Компоненты типичного ЦП показаны на рисунке. Обычно АЛУ выполняет следующие функции: сложение, вычитание, логические операции, сравнение и манипулирование битами. С помощью проводников АЛУ связано с рядом регистров, представляющих собой наборы схем памяти, которые действуют как временные запоминающие устройства в процессе функционирования ЦП. Обычно в компьютере имеются два набора регистров: один для использования ЦП, другой – для удержания следов команд задействованной программы. Среди регистров ЦП выделим прежде всего сумматор, который является устройством, непосредственно обслуживающим АЛУ. Самые последние результаты операций находятся, как правило, в сумматоре. Среди других регистров назовем счетчик команд (который хранит след адресов команд, подлежащих извлечению из памяти), указатель стека (который хранит след промежуточных результатов вычислений) и различные регистры общего назначения. УУ дешифрует команды, извлеченные из памяти, генерирует и выдает управляющие сигналы, необходимые для перемещения данных в компьютере, и сообщает АЛУ, что делать дальше

ЦП типичного компьютера состоит из большого числа логических вентилей и триггеров. УУ использует много вентилей, чтобы выбрать способ обработки, которая должна быть выполнена в АЛУ, а также направить полученные результаты другим частям компьютера. Регистры, о которых мы рассказывали выше, представляют собой большей частью матрицы из триггеров. Наметился ряд тенденций в конструкции и производстве ЦП. В больших компьютерах и многих миникомпьютерах ЦП состоит из набора чипов, каждый из которых выполняет специальную функцию. В этих машинах каждый из основных блоков ЦП – АЛУ, УУ, микрокоманды для УУ – может находиться на одном или нескольких чипах. (Микрокоманды, по существу, сообщают УУ, какие проводники и вентили нужно соединить, чтобы выполнить команду.) Эти ЦП слишком сложны, чтобы их можно было уместить на одном чипе. Такой подход также позволяет вносить изменения в схему компьютера путем замены одного или двух чипов, а не всего ЦП.

В некоторых компьютерах выполняемая задача разделяется между несколькими ЦП. Этот метод известен как параллельная обработка. Некоторые ЦП работают непосредственно в терминах языка программирования (см. ниже), а не обычной архитектуры. Ожидается увеличение разнообразия конструкций и возможностей ЦП. Вероятен также отход от традиционной архитектуры по мере роста объема и скоростей обработки.

Возможно, самый большой скачок в конструировании ЦП был сделан с появлением в 1971 микропроцессора 4044 фирмы «Интел». Этот 4-разрядный микропроцессор представлял собой сравнительно медленный чип с ограниченным набором команд, но он и его наследники сделали возможным создание карманных калькуляторов и цифровых часов и привели к разработке микрокомпьютера. В 1974 появились 8-разрядные микропроцессоры, обрабатывающие по 8 бит информации одновременно.

Как упоминалось раньше, микропроцессор (или другой ЦП) принимает информацию в виде «слов». Например, память компьютера по командам УУ подает в сумматор сразу 8 бит. Затем УУ добавляет, например, число 00101101 к битам в сумматоре (снова сразу все). Теперь в сумматоре находится новый набор из 8 бит. Далее УУ передает эти 8 бит в память, все сразу. На каждом из этих шагов 8 бит обрабатываются или перемещаются одновременно, но индивидуальные действия – их ввод, сложение, копирование результата – выполняются последовательно. В принципе, чем больший размер слова доступен для обработки ЦП, тем больше информации он может «проглотить» сразу и тем быстрее он выполняет свои задачи.

Восьмиразрядные микропроцессоры дали жизнь микрокомпьютерам, сложным компьютерным терминалам и ряду «интеллектуальных» устройств; прогресс в вычислительной технике продолжается. В 1990-х годах имелись сотни миллионов 8- и 16-разрядных микропроцессоров, а в большинстве новых персональных компьютеров и рабочих станций использовались 32-разрядные микропроцессоры, выполняющие миллионы операций в секунду. В 1999 фирмой «Интел» выпущен высокопроизводительный микропроцессор «Пентиум III» с тактовой частотой 500 МГц, интегрированной кэш-памятью до 2 Мб и повышенными возможностями в таких сферах, как распознавание речи и трехмерная графика.

Одним из логических следствий микроэлектронной технологии была разработка всего компьютера, включая память, на чипе. Конечно, для таких малых компьютеров память довольно ограниченна, но она достаточна для разработки таких устройств, как реле-регуляторы автоматического зажигания и топливных систем автомобилей и микроволновых печей, а также полноценных «карманных» компьютеров

В каждом современном ЦП предусмотрено некоторое количество статической памяти, работающей на частоте ядра. Именно статической, поскольку использование динамической памяти в этих целях представляется крайне нерациональным.

Одна ячейка статической памяти состоит из шести транзисторов и двух резисторов (для техпроцессов с проектными нормами до 0,5 мкм могли быть использованы только четыре транзистора на одну ячейку, с дополнительным слоем поликремния и с более жесткими ограничениями по максимальной тактовой частоте), в то время как аналогичная структура динамической памяти состоит из одного транзистора и одного конденсатора. Быстродействие статической памяти намного выше (емкость, используемая в динамической памяти, имеет определенную скорость зарядки до требуемого уровня, определяющую «частотный потолок»), но из-за большего количества составляющих элементов она существенно дороже в производстве и отличается более высоким энергопотреблением. Битовое значение ячейки статической памяти характеризуется состоянием затворов транзисторов, а динамической — уровнем заряда конденсатора. Так как конденсаторы имеют свойство с течением времени разряжаться, то для поддержания их состояния требуется регулярная перезарядка (для современных микросхем динамической памяти — приблизительно 15 раз в секунду). Кроме того, при операции чтения из ячейки динамической памяти конденсатор разряжается, т. е. ячейка утрачивает свой первоначальный заряд, а следовательно должна быть перезаряжена.

Очевидно, что статическая память используется там, где требуется максимальное быстродействие (регистры ЦП, кэш-память, локальная память сигнального процессора), а динамическая — там, где приоритетом является объем, а не скорость чтения-записи (оперативная память, буферы периферийных устройств).

В настоящее время предельная производительность системы определяется мощностью ЦП и подсистемы памяти (контроллера памяти, который может быть встроен как в набор микросхем, так и непосредственно в процессор). Поэтому наиболее эффективное масштабирование по производительности обеспечивают именно многопроцессорные системы. Хотя кластерные решения, объединяющие несколько вычислительных узлов, как правило, при пересчете на один ЦП оказываются дешевле, но из-за накладных расходов на организацию их взаимодействия удельная производительность многопроцессорных машин все же заметно выше. Кроме того, использование многопроцессорных серверов позволяет минимизировать дублирование вспомогательных подсистем вычислительной машины — контроллеров ввода-вывода, дисковых массивов и т. п.

Нельзя не отметить и конструктивные преимущества многопроцессорных серверов: они обеспечивают максимальную удельную производительность при пересчете не только на один ЦП, но и на единицу объема, что в серверных платформах весьма важно.

Благодаря указанным преимуществам многопроцессорные платформы пользуются популярностью практически во всех сегментах серверного рынка. Двух- и четырехпроцессорные серверы младшего и среднего уровня имеют хорошее соотношение цена/производительность, и с точки зрения организации охлаждения они ненамного сложнее однопроцессорных. Решения с восемью и более процессорами имеют более сложную архитектуру, но и позволяют добиться максимальной производительности и надежности.

⇐ Предыдущая 6 7 8 91011 12 13 14 15 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2014-11-25; Просмотров: 1385; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.01 сек.