КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Особенности ЭВМ Pentium Intel Р6. Механизм динамического выполнение команд
Особенности ЭВМ PENTIUM Intel Р6. Механизмы максимальной загрузки конвейера. Динамический анализ потока данных. Анализ проводится с целью определения зависимостей команд от данных и регистров процессора с последующей оптимизацией потока выполняемых команд. Главный критерий – максимальная загрузка конвейера. Требование выполнения этого критерия приводит в некоторых случаях к нарушению последовательности выполнения команд, поступающих на конвейер. (Вообще-то это новшество нарушает один из принципов программного управления!) Такое отступление от основополагающего принципа осуществляется в тех случаях, когда для очередной команды нет данных нив кэш-памяти первого, ни в кэш памяти второго уровня. В этих случаях требуется “подкачка информации” из оперативной памяти в быструю, а чтобы конвейер не простаивал во время подкачки, ищется и выполняется команда, для которой информация есть в быстрой или регистровой памяти.
Интеллектуальное исполнение. Этим термином называется способность микропроцессора организовать неупорядоченное выполнение команд и восстановления впоследствии порядка за счет передачи результатов выполнения команд в порядке, предусмотренном алгоритмом обработки данных. Для реализации этого механизма результаты выполнения находящихся на конвейере команд размещаются во временных регистрах (буфер команд). Блок удаления и восстановления постоянно просматривает буфер команд и ищет те из них, которые уже исполнены и не имеют связи по данным с другими командами или не находятся в ветвях незавершенных переходов. Когда такие команды найдены, устройство удаления и восстановления помещает сформированные ими данные в память или регистры процессора в порядке, заданным исходным алгоритмом. После этого команды удаляются из конвейера. Механизм динамического выполнения команд приводит к тому, что наиболее оптимально используется время наиболее дорогостоящего компонента ЭВМ – микропроцессора, а если учесть, что в последних версиях Pentium команды программы исполняются в 3 потока одновременно, то понятным становятся истоки повышения производительности, достигаемые в этих моделях.
12.Повышение производительности вычислений: использование перекрытия и расслоения памяти. К ранним моделям, в которых использовалось перекрытие относят UNIVAC 1. Перекрытием называют способность ЭВМ одновременно выполнять не одну, а несколько операций обработки данных. В упоминаемой выше UNIVAC 1 было применено такое совмещение операций, которое впоследствии стало классическим: в ней перекрывались исполнение программы и выполнение операции ввода-вывода. M 7094 II сделан дальнейший шаг: использовано расслоение памяти для ускорения обращений к ней. Суть этого решения в том, что ОЗУ делят (расслаивают) на n независимых сегментов. Каждый сегмент имеет свое устройство управления. Величину n называют глубиной расслоения. Ячейки с последовательными номерами находятся в последовательных сегментах. Так, если n =4, то нулевая ячейка будет в первом сегменте, первая – во втором и т.д., иначе говоря, ячейка с номером 4 i будет в первом сегменте, а с номером 4 i+3 – в четвертом. Если полный цикл обращения к одному сегменту ОЗУ составляет К единиц времени, а глубина расслоения равна n, то к каждому последовательному сегменту можно обращаться через K/n единиц времени после обращения к предыдущему. Когда программа обратится к n подряд следующим ячейкам памяти, то пройдет время К и можно будет повторить цикл обращения. Быстродействие ОЗУ как будто увеличивается в n раз. Однако на практике такая оптимизация достигается редко из-за непоследовательных обращений к ячейкам памяти ЭВМ. Практика показала, что при обращении к адресам в памяти ЭВМ в случайном порядке, достигается продолжительность цикла обращения. Т.е. выигрыш от расслоения все равно получается существенным, хотя и не в n раз. 13.Повышение производительности вычислений: использование конвейеризации и параллельных вычислений. Разбиение процесса исполнения команды (конвейеризация) впервые применено в машинах STRETCH и LARC. В первой ЭВМ конвейер был двухступенчатым, во второй – четырехступенчатым. Существенному увеличению производительности за счет конвейеризации мешало то, что в этих машинах не была решена проблема снижения влияния помех. Под помехами в конвейерных ЭВМ понимают тот или иной фактор, связанный с его конструкцией или применением, который препятствует непрерывному поступлению новых данных на конвейер с максимально возможной скоростью. К первым машинам с конвейерной организацией относят IBM 360/91 (1967 г.). В ней была реализована предварительная выборка команд, причем, если предполагалось ветвление, то выбирались команды из обеих ветвей и ставились в очередь на конвейер. Когда исполнение команды ветвление определяло одну из ветвей программы, ненужная последовательность команд отбрасывалась. Уже в этой ЭВМ некоторые команды выполнялись непоследовательно, но за счет правильной организации процесса пересылки результатов все они оказывались на своих местах. К высокопараллельным ЭВМ относят ILLIAC IV (1968 г.). Построена была эта машина для решения очень больших научных задач. Такая ее специализация объясняет тот факт, что в ней использовались 64 копии блока, сходного с арифметическим устройством традиционной машины. Каждая копия имела свои регистры, сумматор и память, все копии могли работать одновременно. Повышение производительности за счет параллельной обработки может идти по двум альтернативным направлениям: - создание многомашинных комплексов – это направление развивается как вычислительные сети; - создание многопроцессорных комплексов.
Дата добавления: 2015-04-24; Просмотров: 501; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |