Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Динамическое (спекулятивное) исполнение




Одной из главных особенностей шестого поколения микропроцессоров архитектуры IA32 является динамическое (спекулятивное) исполнение. Под этим термином подразумевается следующая совокупность возможностей:

  • Глубокое предсказание ветвлений (с вероятностью >90% можно предсказать 10-15 ближайших переходов).
  • Анализ потока данных (на 20-30 шагов вперед просмотреть программу и определить зависимость команд по данным или ресурсам).
  • Опережающее исполнение команд (МП P6 может выполнять команды в порядке, отличном от их следования в программе).

Внутренняя организация МП P6 соответствует архитектуре RISC, поэтому блок выборки команд, считав поток инструкций IA-32 из L1 кэша инструкций, декодирует их в серию микроопераций. Поток микроопераций попадает в буфер переупорядочивания (пул инструкций). В нем содержатся как не выполненные пока микрооперации, так и уже выполненные, но еще не повлиявшие на состояние процессора. Для декодирования инструкций предназначены три параллельных дешифратора: два для простых и один для сложных инструкций. Каждая инструкция IA-32 декодируется в 1-4 микрооперации. Микрооперации выполняются пятью параллельными исполнительными устройствами: два для целочисленной арифметики, два для вещественной арифметики и блок интерфейса с памятью. Таким образом, возможно выполнение до пяти микроопераций за такт.

Блок исполнительных устройств способен выбирать инструкции из пула в любом порядке. При этом благодаря блоку предсказания ветвлений возможно выполнение инструкций, следующих за условными переходами. Блок резервирования постоянно отслеживает в пуле инструкций те микрооперации, которые готовы к исполнению (исходные данные не зависят от результата других невыполненных инструкций) и направляет их на свободное исполнительное устройство соответствующего типа. Одно из целочисленных исполнительных устройств дополнительно занимается проверкой правильности предсказания переходов. При обнаружении неправильно предсказанного перехода все микрооперации, следующие за переходом, удаляются из пула и производится заполнение конвейера команд инструкциями по новому адресу.

Взаимная зависимость команд от значения регистров архитектуры IA-32 может требовать ожидания освобождения регистров. Для решения этой проблемы предназначены 40 внутренних регистров общего назначения, используемых в реальных вычислениях.

Блок удаления отслеживает результат спекулятивно выполненных микроопераций. Если микрооперация более не зависит от других микроопераций, ее результат переносится на состояние процессора, и она удаляется из буфера переупорядочивания. Блок удаления подтверждает выполнение инструкций (до трех микроопераций за такт) в порядке их следования в программе, принимая во внимание прерывания, исключения, точки останова и промахи предсказания переходов.

Описанная схема отображена на рис. 5.2.


Рис. 5.2. Блок схема микропроцессора Pentium Pro

Вопросы для самоконтроля

1. Какие блоки составляют конвейер МП 80286?

2. Какой блок и почему был добавлен в конвейер МП Intel-486?

3. Что понимают под суперскалярной архитектурой?

4. Какие способы обработки данных объединяет термин " динамическое исполнение программы"?

5. В чем состоит внутренняя RISC-архитектура ЦП Pentium Pro?

6. В работе какого процессора наблюдается отклонение от принципов фон Неймана? В чем это проявляется?

7. В чем состоит преимущество использования двойной независимой шины?

8. Что нового появилось в архитектуре процессора Pentium III по сравнению с Pentium MMX?

9. Какие особенности имеет Net Burst-архитектура?

Лекция 6: Анализ развития процессоров фирмы Intel: семейство Pentium

Аннотация: В этой лекции рассматриваются организация и режимы работы процессоров семейства Pentium, SIMD-расширения архитектуры IA-32, микроархитектура NetBurst, приводится алгоритм инициализации ЭВМ на базе процессоров х86. Цель: познакомить учащихся с особенностями новых архитектурных решений: SIMD и NetBurst; сформировать знания о MMX- и SSE-инструкциях, о новых типах данных, сформировать умения и навыки правильного выбора и использования режима работы микропроцессора.

Ключевые слова: PCI, интерфейс, DCI, 3d rendering, процессор, суперскалярная архитектура, FPU, MESI, конвейеризация, managed mode, самотестирование, устройство управления памятью, алгоритм функционирования, BTB, branch, target, кэш, память, буфер, TLB, translation, pentium pro, IA-32, архитектура, динамическое исполнение программы, глубокое предсказание ветвлений, анализ потока данных, опережающее исполнение команд, SIMD, инструкция, микропроцессор, MMX, extension, SIMD-расширение, вещественная арифметика, байт, сложение, производительность, увеличение производительности, ПО, двойная независимая шина, шина, масштабируемость, SSE, регистр управления, бит, single precision, операции, SSE2, ядро, dual independent bus, DIB, CPU, core, разрядность, кэш данных, trace, cache, микрооперация, функциональный контроль, FRC, quad, тактовая частота, информация, адрес, АЛУ, длина конвейера, гиперконвейер, микроархитектура NetBurst, офисные приложения, механизмы, модуль ядра, контроллер прерываний, ПДП, CMOS, LPT, APR, BIOS, Basic, input, output, system, ПЗУ, программное обеспечение, POST, power, setup, программа, значение, поиск




Поделиться с друзьями:


Дата добавления: 2015-04-25; Просмотров: 1216; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.