Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Лекция 17. Номера процессоров




Б – блок-схема

Barcelona. В августе 2006 г. при запуске Socket F (известного так же, как Socket 1207) для двухъядерного процессора Opteron AMD объявила, что закончено проектирование четырехъядерного процессора на основе Opteron. Новые 4-ядерные процессор (Quad-Core Opteron) выпущен AMD в конце 2007 г. и является конкретной реализацией архитектуры К10. Первоначально спроектирован для серверов и рабочих станций и имеет кодовое название “Barcelona”. В основе лежат процессоры Opteron 2348 и 2350 с частотами ядра в 1,9 и 2,0 ГГц, с возможным дальнейшим ее повышением (рис.5.3.8.6).

Рис. 5.3.8.5. Одиночное ядро процессора архитектуры К10

Рис.5.3.8.3. Архитектура AMD К8

Рис.5.3.8.1. Процессор К6

Процессоры AMD K7. К этому типу относятся ЦП Athlon, Athlon XP/MP, Sempron. К7 – первый из семейства микропроцессоров х86 7-го поколения, в котором присутствуют конструктивные решения, до сих пор не применявшиеся в процессорах архитектуры х86 и сулящие выигрыш в быстродействии даже при одинаковых тактовых частотах (рис.5.3.8.2).

Рис.5.3.8.2. Архитектура AMD K7 (Athlon)

AMD Athlon. Выпуск процессоров Athlon летом 1999 г. был наиболее удачным ходом AMD. Это позволило им гордиться тем, что они произвели первый процессор седьмого поколения (у него было достаточно много радикальных архитектурных отличий от Pentium II/III, и К6-III, чтобы заслужить название процессора следующего поколения), и это означало также, что они вырвали технологическое лидерство у Intel.

Athlon - процессор, с помощью которого AMD надеялась увеличить реальное конкурентоспособное присутствие в корпоративном секторе, помимо ее традиционного преимущества на потребительском рынке. Ядро размещается на кристалле в 102 мм2 и содержит приблизительно 22 млн транзисторов.

Athlon использует разъем Slot А компании AMD, который является механически совместимым с системными платами с разъемом Slot 1, но использует другой электрический интерфейс, подразумевая, что центральные процессоры Athlon не будут работать с обычной Slot 1 системной платой. Slot A разработан, чтобы электрически соединяться с системной шиной на 200 МГц, основанной на шинном протоколе Alpha EV6, предоставляя таким образом, существенное преимущество в производительности перед инфраструктурой Slot 1.

Athlon первоначально выпускался в диапазонах скорости 500, 550 и 600 МГц и немного позднее – 650 МГц (все изготовлены по технологии 0,25 мкм). К концу 1999 г. AMD еще более повысил частоту – его ядро К75 (750 МГц), является первым процессором, построенным с использованием алюминиевой 6-слойной технологии 0,18 мкм компании AMD.

Утверждение о том, что это был самый быстрый х86-совместимый ЦП тысячелетия, спорно, поскольку Intel быстро ответила объявлением Pentium III (800 МГц). Однако AMD вскоре вернула лидерство 2000 г. выпуском версии на 800 и 850 МГц и даже преуспела в опережении Intel в преодолении барьера 1 ГГц буквально на несколько недель.

Thunderbird. В середине 2000 г. была выпущена улучшенная версия Athlon с кодовым названием “ Thunderbird ”.

Технология 0,18 мкм, кэш-память 2-го уровня (L2) размером в 256 Кбайт расположена на плате процессора и работает на полной частоте (первые процессоры Athlon имели кэш L2, работающую на меньших частотах).

Интерфейсы – 462-контактных Socket A Slot A. Частоты от 0,75 до 1 ГГц. Размещение 256 Кбайт памяти на кристалле привело к увеличению его размера до 120 мм2 (102 мм2 для ядра). Однако, он меньше исходного К7 Athlon, который занимает 184 мм2. Добавление 256 Кбайт к L2-кэшу на кристалле весьма увеличивает число транзисторов, т.е. 15 млн добавились для размещения кэша L2.

Осенью 2000 г. был выпущен чипсет AMD760, обеспечивающий поддержку для памяти DDR SDRAM PC1600 (200 МГц FSB) и PС2100 (266 МГц FSB). Другие особенности – AGP 4-х, 4 порта USB, адресация памяти 8 Гбайт на 4 DIMM и поддержка ATA-100. С этого момента процессоры Athlon выпускались только для разъемов Socket A. Последние из процессоров Athlon/Thunderbird были выпущены летом 2001 г., достигнув частоты 1,4 ГГц.

Duron. В середине 2000 г. был выпущен процессор Duron, предназначенный для дома и офиса (вариант Athlon, ядро - Spitfire). Кэш-память L1 (128 Кбайт, по 64 Кбайт на код и на данные) и L2 (64 Кбайт) размещается на плате. Первичная системная шина работает на частоте 200 МГц. Поддерживается улучшенная технология 3DNow! Технология 0,18 мкм, частоты 600, 650, 1000, 1200 МГц. Интерфейс – 462-контактный разъем Socket A.

Содержит 25 млн транзисторов и имеет площадь 100 кв. мм, использует высокопроизводительную 100 МГц DDR (Double Data Rate, фактически данные передаются на частоте 200 МГц) системную шину EV6, все подсистемы работают на полной частоте ядра, напряжение питания – 1,5 В.

Palomino (серия Athlon XP, «HP» - “Extra Performance”, сверхпроизводительность). Процессор выполнен по технологии 1,18 мкм с использованием медных проводников на плате (вместо алюминия), содержит 37,5 млн транзисторов на кристалле в 128 мм2. Достигнуто понижение на 20 % энергопотребления сравнительно с Thunderbird. Введен ряд новшеств, в совокупности именуемых AMD как “QuantiSpeed Archtecture”:

· введение дополнительного буфера – буфера быстрого преобразования адреса (БПА, TLB – Translation Lookaside Buffer). Это дополнительная кэш-память, расположенная между L1 и L2. В частности TLB содержит данные, которые используются для перевода виртуальных адресов в физические и наоборот. Вероятность того, что процессор найдет необходимые данные в TLB оказывается достаточно высокой;

· поддержка SSE-технологии Intel. В Palomino добавлены еще 52 новые команды SIMD по отношению к ранее имевшимся. Удвоено количество исходных 21 SIMD-команд, реализующих “3DNow!” (“3DNow! Professional”);

· использование технологии упаковки OPGA (organic PGA)для замещения CPGA (ceramic PGA), которая использовалась ранее. Применение пластмасс вместо керамики технологичнее, платы оказываются легче и обладают лучшими тепловыми свойствами. Кроме того, можно плотнее размещать навесные элементы, что уменьшает наводки и помехи. OPGA размещаются на уже известном разъеме Socket A.

Morgan. Morgan представляет модификацию процессоров AMD, первоначально представлял ядро Palomino с удвоенными ¾ кэша L2 (64 Кбайт вместо 256 Кбайт). Размер кристалла – 106 мм2, число транзисторов – 25,18 млн. Напряжение питания было изменено от 1.6 до 1, 75 В.

Thoroughbred. Летом 2002 г. AMD начла поставлять первый процессор с технологией 0, 13 мкм и медными соединителями. Площадь кристалла – 80 мм2 (у его предшественников 128 мм2). Питание – 1,65 В, размеры кэша на кристалле – 128 Кбайт для L1 и 256 Кбайт для L2, разъем – Socket A.

Barton. В феврале 2003 г. AMD начинает выпускать первый процессор, основанный на обновленном ядре Athlon XP (кодовое наименование “ Barton ”). В то время как этот чип Athlon 3000+ имел все особенности предыдущего процессора Athlon XP, новое ядро позволило организовать более эффективный дизайн памяти, чем в любых предыдущих процессорах Athlon. Это связано с тем, что здесь были объединены лучшие характеристики предшественников - кэш L2, работающий на полной скорости, и больший размер кэша в 512 Кбайт исходного процессора Athlon.

Вследствие большого кэша здесь существенно увеличивается размер кристалла, который включает 56 млн транзисторов и измеряется 101 мм2. Это представляет существенное возрастание по сравнению с ЦП Thoroughbred (54,3 млн транзисторов на 84 мм2).

Однако ядро Barton предусматривает более быстрый доступ к главной памяти – в то время как более ранние ЦП Athlon XP характеризуются частотой FSB 266 МГц (133х2), здесь частота FSB составляет 333 МГц (166х2).

В итоге Athlon XP 3000+ показывает более высокую эффективность сравнительно с более ранним Athlon XP 2800+, несмотря на меньшую тактовую частоту (2,167 ГГц против 2,250).

Появление ЦП Athlon 64 осенью 2003 г. подразумевало сход со сцены процессоров Barton, и последний процессор Athlon XP (модель 3200+) вышел не боле чем чкрез три месяца после появления первых изделий Barton.

Sempron. Летом 2004 г. AMD объявила о выходе ЦП семейства Sempron. Первоначально задуманный как преемник успешного ЦП Duron и прямой конкурент процессору Celeron D (Intel, 90 нм), диапазон применения Sempron фактически перекрыл диапазон Athlon AMD XP и поставил фирмы, выпускающие настольные и мобильные ПК перед выбором – либо Sempron, либо Athlon 64.

Все первые ЦП базировались на технологии AMD 130 нм. Наиболее мощные образцы (3100+) выпускаются в формате интерфейса Socket 754 (Athlon 64 – в формате Socket 939). Другие участники семейства – от 2 ГГц (2800+) до 1,5 ГГц (2200+) – используют Socket A.

В дальнейшем Sempron предполагается перевести на технологию 90 нм и интерфейс Socket 939.

Архитектура К8. Эта архитектура используется во всех современных серверных, настольных и мобильных процессорах AMD (Opteron, Athlon 64 и Athlon 64 X2). Первым из процессоров К8 является Hammer (середина 2000 г.).

Одним из главных новшеств К8 является 64-разрядная архитектура х86-64 ISA. Примером 64-разрядных процессоров (IA-64) является Intel Itanium. Однако между 64-разрядными архитектурами процессоров Itanium и К8 мало общего. Itanium – процессор, несовместимый с системой команд х86. Тогда как К8, напротив, таковым является.

Стратегия AMD на 64 бита (х86-64) заключается в следующем – за основу взято производительное х86-ядро и расширен набор инструкций для возможности адресации 64-битового пространства памяти.

Особенности архитектуры х86-64 (AMD64):

· обратная совместимость с инструкциями х86;

· 8 новых 64-разрядных РОН плюс 64-разрядные версии прежних 8РОН х86;

· поддержка SEE и SEE2 помимо восьми новых регистров SSE2;

· увеличен объем адресуемой памяти для приложений, работающих с большими объемами данных;

· высокая производительность 32-разрядных приложений, плюс поддержка появляющихся 64-битовых приложений, хороший вариант переходного процессора;

Основные недостатки:

· процессор продолжает поддерживать архитектуру х86, которая достаточно устарела;

· новые РОН можно использовать лишь в 64-разрядном режиме, что не позволяет повысить производительность 32-разрядных приложений посредством улучшения архитектуры системы команд.

Некоторые прочие особенности К8(рис. 5.3.8.3):

· контроллер памяти интегрирован в сам процессор. Традиционно он располагается в серверном мосте чипсета на системной плате. Контроллер памяти – это основной функциональный блок “серверного моста”. Преимущество такого решения очевидно – контроллер памяти работает на чистоте процессора, а следовательно, обладает низкой латентностью, которая будет тем меньше, чем больше частота, на которой работает процессор;

· встроенный порт (“линк”) шины HuperTransport – универсальная шина межчипового соединения – элемент транспьютерной архитектуры. В процессорах К8 Opteronможет быть до 3-4 линков НТ, что позволяет комбинировать их в 3- и 4-мерных кластерные структуры;

· архитектура К8 разработана с перспективой создания многоядерных процессоров и многопроцессорных систем;

· усовершенствован блок предсказания переходов – для увеличения точности он содержит историю 16 000 переходов, а также 2000 адресов назначения.

 

Исполнение инструкций на конвейере К8 начинается с блока выборки инструкций (рис.5.3.8.4). За один такт блок выбирает из кэша 16 байт данных и выделяет из них от одной до трех инструкций х86 – сколько в выбранных данных поместилось. Поскольку средняя длина команды х86 составляет 5-6 байт, то, как правило, блоку удается выбрать три команды за такт.

Во втором такте конвейера выбранные команды распределяются по трем блокам декодирования инструкций. Самые сложные команды отправляются в декодер сложных команд.

Исходные х86-инструкции на завершающих этапах работы декодера К7/К8 переводятся в макрооперации, или МакОПы. Большинству х86-инструкций составляет одна МакОП, некоторые преобразуются в 2 или 3, а наиболее сложные – в последовательность из нескольких десятков МакОП. Макрооперации имеют фиксированною длину и регулярную структуру.

За счет конвейеризации возможны ситуации, когда одновременно в разных блоках процессора будут выполняться до двух десятков команд – и в К7, и в К8 имеется десять исполнительных устройств – три ALU, три FRU, три AGU и отдельный блок умножения.

Подобно тому, как объединение двух отдельных МкОП в одну МакОП дает явные преимущества, точно так же дела обстоят и с самим МакОП – практически они выступают не в виде самостоятельных единиц, а в виде группы. Группу образуют три МакОП, которые одновременно запускаются на параллельные каналы.

Вся дальнейшая работа идет не с одиночными, а с “тройками” МакОП (“линиями”, line). Такая “линия” воспринимается центральным управляющим блоком процессора ICU как единое целое: все основные действия выполняются именно над “линиями”, в первую очередь - выделение внутренних ресурсов.

Сгенерированные линии от декодеров по одной за такт поступают в блок управления командами – Instructions Control Init (ICU), где подготовленные к исполнению линии накапливаются в специальной очереди (24 линии).

Из очереди в 24 линии (по три МакОП в каждой) ICU выбирает в наиболее удобный для исполнения последовательности одну-три МакОП и пересылает их либо на АЛУ, либо на блок ПЗ в зависимости от типа микрооперации. В случае АЛУ микрооперации сразу же попадают в очередь планировщика (шесть элементов по три МакОП), которые подготавливает необходимые для исполнения микрооперации ресурсы, дожидается их готовности и только потом отправляет. Причем при исполнении одной МакОП на самом деле может происходить исполнение сразу двух действий (МакОП).

Подготовка данных в планировщике занимает (в идеальном случае) один такт, исполнение – от одного до трех тактов.

Hammer. Процессор, первоначально имевший кодовое имя “Sledgehammer”, а в дальнейшем “Hammer”, был выпущен в середине 2000 г.

В процессоре Hammer используется улучшенная конвейеризация, предполагающая 12-стадийный конвейер вычисления с ФТ и 17-стадийный конвейер для ПТ. Это связано с необходимостью упаковки-распоковки данных и команд при их передаче и декодировании. Одним из главных новшеств процессора Hammer является 64-разрядная архитектура х86-64 ISA.

Athlon 64. Осенью 2003 г. вышли две модели процессора AMD - Athlon 64 массового рынка и Athlon 64 FX-51 для мультимедийных и профессиональных приложений (архитектура К8). В системе обозначений AMD Athlon 64 имеет эквивалентную частоту 3200+, при физической частоте 2 ГГц (FX-51 чуть выше – 2,2 ГГц).

Процессор приспособлен как для 32-, так и для 64-битовых приложений. Поддерживаются системы ОЗУ типов PC3200, РС2700, РС2100 или РС1600 DDR SDRAM. Установлены наибольшие по размерам для данного момента модули кэш-памяти на процессоре – 64 Кбайт L1 –кэш команд; 64 Кбайт L1 – кэш данных. Общая кэш-память может достигать 1154 Кбайт.В то время как Athlon 64 использует 64-битовый одноканальный контроллер памяти, FX-51 включает 128-битовый двухканальный контроллер памяти на чипе.

Первоначально размер кэша 2-го уровня – 512 Кбайт, как и для Athlon XP. Затем он был увеличен до 1 Мбайт, в связи с чем здесь число транзисторов достигло 106 млн по сравнению с 54 млн для Athlon XP.

Процессор выпускается по технологии 0,13 мкм, разработанной в филиале AMD, Дрезден, германия. Система команд AMD64, х86-64 – расширение AMD для команд Intel х86 – не совместима с Intel IA-64 архитектурой. Однако AMD поддерживает полную совместимость с 32-битовыми процессорами ПЭВМ, выпускаемыми как Intel, так и AMD.

В то же время, когда AMD объявила Athlon 64, фирма Microsoft заявила о выпуске бета-версии Windows XP-Bit Edition для 64-битовых процессоров, которая может работать естественно как на процессорах AMD Athlon 64 (ПЭВМ), так и AMD Opteron (рабочие станции). Хотя здесь и поддерживаются все существующие 32-битовые приложения, 32-битовые драйверы устройств должны быть обновлены и перетранслированы.

Intel в начале 2004 г. объявила, что будущие версии процессора Prescott (Socket T) будут включать 64-битовые расширения х86, совместимые с AMD 64-битовой архитектурой.

Athlon 64 Х2. AMD снова оказалась впереди Intel, продемонстрировав действующий экспериментальный образец двухъядерного процессора летом 2004 г., и поэтому Intel вызвала всеобщее удивление, все же выйдя первой на рынок с двухъядерным процессором весной 2005 г. Однако, несмотря на то, что AMD 64Х2 был только короткое время позади Pentium Extreme Edition и Pentium D по датам выхода на рынок, он значительно опережал их по показателям эффективности.

Когда процессоры Х2 были впервые выпущены, они показали большую производительность, сем самые быстрые в то время одноядерные процессоры (4000+), а именно 4200+, 4400+, 4600+ и 4800+. Двухъядерные системы работают медленнее, чем единственное ядро для некоторых процессоров, что затрудняет точное сравнение. Однако специалисты AMD считают, что Х2 обеспечивает 80 % -ное превышение эффективности над системами с единственным ядром (при той же самой частоте) при выполнении приложений с обработкой мультимедийной информации.

Основная архитектура ядра Х2 по существу та же, кА и у Athlon 64. Различие в том, что новые чипы, размещаемые на единственном кристалле в 199 мм2, причем каждый содержит более чем 233млн транзисторов, изготовлены по технологии AMD 90 нм.

Степень интеграции двойных ядер больше, чем в системах Intel – два ядра AMD способны к прямой связи без использования внешней платы и чипсета и фактически совместно используют объединенный контроллер памяти.

Кроме скорости, другим существенным преимуществом, который системы AMD имеют по сравнению с Intel, является совместимость и, следовательно, возможность обновления существующих систем. Принимая во внимание, что ЦП Intel требуют новый чипсет и VRM, чтобы справиться с увеличением мощности (при этом сокращается напряжение питания ядра от 1,50 до 1,35 В), AMD спроектировала двухъядерный чип, соответствующий тому же самому разъему с 939 штырьками, что и у одноядерных процессоров. При этом достигается совместимость с существующими системными платами для Athlon 64 (90 нм) и только требуется модификация BIOS.

Turion 64 – семейство 64-битовый мобильных (с низким энергопотреблением) процессоров. Данные процессоры, включая и Turion 64 {2, являются ответом AMD на линейку мобильных процессорв компании Intel – Pentium M и Intel Core.

Процессоры Turion 64 (кроме Turion 64 X2) совместимы с интерфейсом Socket 754 компании AMD и включают от 512 до 1024 Кбайт кэша 2-го уровня, 64-битовый одноканальный контроллер памяти, интегрированный на ядро, и шину HyperTransport (800 МГц). Основной акцент при позиционировании и продвижении данного процессора на рынке делается на его энергосберегающие функции, такие как PowerNow! и Cool & Quiet.

Lancaster (выпущен 10 марта 2005 г.) изготовлен по технологии 90 нм (SOI), кэш L1 составляет 64+64 Кбайт (команды и данные), кэш L2 – 512 или 1024 КБ, работающих на скорости ядра. Процессор поддерживает технологии ММХ, Extended 3DNow!, SSE – SSE3, AMD64, PowerNow!, NX Bit.

Напряжение питания ядра: 1,00 -1,45 В, потребление энергии (TDP) – максимум 25/35 Вт, диапазон частот – 1600, 1800, 2000, 2200, 2400 МГц, интерфейс – Socket 754, системная шина – HyperTransport (800 МГц, HT800).

Richmond (1 сентября 2006 г.), технология изготовления 90 нм (SOI), L1-кэш: 64+64 КБ (команды и данные), L2-: 512 КБ (полная скорость ядра).

Напряжение питания ядра -1,00 – 1,45 В, энергопотребление (TDP) – максимум 31 Вт, частоты – 2000, 2200 МГц, интерфейс Socket S1, HyperTransport (НТ800).

Turion 64 X2 – двухъядерный мобильный 64-разрядный процессор AMD. Он конкурирует с процессорами Intel Core и Core 2. Процессор Turion 64 Х2 был представлен компанией AMD 17 мая 2006 г. после нескольких задержек. Процессор устанавливается в разъем Socket S1 и использует память DDR2. В Turion 64 X2 используются более совершенные энергосберегающие технологии по сравнению с предыдущими процессорами компании.

Первые модели Turion 64 X2 производятся с использованием 90 нм процесса компании IMB (Taylor). В дальнейшем осуществляется переход на 65 нм процесс (Tyler), вероятнее всего на основе технологии напряженного кремниево-германиевого процесса, который был недавно совместно разработан исследователями IBM и AMD и который является более совершенным по сравнению с другими 65 нм процессами.

Taylor (17 мая 2006 г.), технология 90 нм (SOI), кэш первого уровня: 64 (данные) + 64 (инструкции) Кбайт в каждом ядре; кэш второго уровня: 256 или 512 КБ в каждом ядре, работает на скорости ядра, поддерживает стандартные технологии. Контроллер памяти – двухканальный DDR2, 667 МГц. Интерфейс Socket S1, HyperTransport (800 МГц, НТ800), энергопотребление (TDP): 31, 33, 35 Вт максимум, частота: 1600, 1800, 2000 МГц.

Tyler (первая половина 2007 г.), технология 65 нм (SOI), кэш первого уровня: 64+64 Кбайт (данные + инструкции) в каждом ядре, кэш второго уровня: 512 Кбайт в каждом ядре, работает на скорости ядра. Контроллер памяти – двухканальный DDR2, 800 МГц, поддерживает стандартные технологии. Интерфейс Socket S1, HyperTransport, энергопотребление (TDP): 35 Вт максимум.

Архитектура К9. Об архитектуре AMD К9 в анналагах истории не сохранилось достоверных упоминаний. Есть сведения, что проект AMD Greyhound (2001-2003 гг.) имел кодовое название К9, кроме того, утверждают, что под этой вывеской первоначально объявлялся Athlon 64 X2.

Архитектура К10 представляет собой следующее поколение архитектур AMD. Впервые о существовании новой микроархитектуры заявил в апреле 2006 г. Henri Richard, исполнительный вице-президент AMD, директор департамента маркетинга и продаж. Рассмотрим характеристики микроархитектуры К10 (рис.5.3.8.4).

Интерфейсы:

· Socket AM2+ для процессоров Athlon 64 X2 и Phenom X4, а также для одноядерных ЦП Opteron и Socket F+ для процессоров Phenom FX, ориентированных на 4-процессорные платформы AMD Quad FX, а также для многоядерных ЦП Opterons, с поддержкой HyperTransport 3.0 и использованием банков ОП DDR2 DIMM;

· обратная совместимость с системными платами, укомплектованными разъемами Socket AM2 и Socket F.

Рис. 5.3.8.4. Микроархитектура К10 (символ “*” отмечены количественные или качественные отличия от К8)

Усовершенствование конвейера исполнения(рис.5.3.8.5):

· блоки операций SSE на 128 разрядов;

· более “широкий” интерфейс с кэшем данных L1 (запись 128 бит за цикл, сравнительно с 64 битами на цикл для К8);

· блок косвенного предсказания переходов на 512 входов, более емкий стек возвратов и буфер точек перехода, размер удвоен по сравнению с К8;

· оптимизатор регистрового стека, связанный с увеличением/уменьшением указателя стека.

Интеграция новых технологий в кристалле ЦП:

· 4-ядерные процессоры (Quad-core);

· Dynamic Independent Core Engagement (DICE) или Enhanced PowerNow! – разделение управления энергопотреблением между ядром ЦП и контроллером памяти (Northbridge), что позволяет им управлять питанием независимо;

· технология CoolCore, позволяющая отключать питание от незагруженных цепей ядра ЦП.

Усовершенствования в системах памяти:

· уменьшение задержек памяти;

· изменение в иерархии памяти;

· усовершенствования в управлении адресным пространство

Усовершенствования в интерфейсах:

· поддержка режима повторных пересылок в HyperTransport;

· обеспечение для HyperTransport 3.0 восьми связей “точка-точка” для каждого процессорного разъема.

Другие усовершенствования:

· автоматическая модуляция частоты тактового генератора;

· повышение скважности импульсов тактового генератора;

· поддержка сопроцессоров через разъемы НТХ или свободные гнезда ЦП посредством интерфейса HyperTransport.

 

Рис. 5.3.8.6. Четырехъядерный процессор AMD Barcelona: а – общий вид кристалла;

Как и двухъядерные архитектуры, 4-ядерные на некоторых сложных приложениях демонстрируют существенное повышение производительности, в то время как для более простых это повышение несущественно или вообще отсутствует.

Процессоры Barcelona используют три уровня кэш-памяти – L1 и L2 (64 и 512 Кбайт соответственно выделены каждому ядру, как это было у ЦП Opterons и Athlon), тогда как L3-кэш (от 2 Мбайт) совместно используется всеми ядрами.

ЦП Barcelona будет выпускаться по технологии AMD 64 нм SOI (кремний на изоляторе), позволяющей использовать более низкие напряжение питания и рассеиваемую мощность. Первые образцы ЦП Barcelona потребляют около 95 Вт. Здесь используется улучшенная технология PowerNow! (позволяющая отдельным ядрам оперировать на той тактовой частоте, которая соответствует вычислительной нагрузке в данный момент).

AMD прилагает большие условия по обеспечению обратной совместимости, обеспечивая возможность установки новых процессоров на существующие системные платы с интерфейсами АМ2 (при несущественном обновлении BIOS), хотя только интерфейс АМ2+ позволяет раскрыть все возможности новых процессоров.

Phenom – процессор AMD для настольных ПК, базирующихся на микроархитектуре К10. Двухъядерная версия (кодовое название “Kuma”) будет носить имя Phenom X2, четырехъядерная (кодовое название “Agena”) – Phenom X4, высокопроизводительная четырехъядерная (платформа AMD Quad FX, кодовое имя “Agena FX”) будет именоваться FX. Конфигурации “Agena”, “Agena FX” имеют частоты 2,4 – 2,9 ГГц соответственно, 512 КБ каждая L2-кэш, 2 МБ L3-кэш, интерфейс Hyper-Transport 3.0, термическая мощность 125 Вт.

Объявлялись также одноядерные и двухъядерные с L3-кэшем или без него (кодовые имена “Kuma” и “Rana”). Сообщались, что двухъядерные “Rana” без L3-кэша все еще будут называться Athlon X2. Предусмотрен также одноядерный “Luma”, использующий процесс 65 нм.

Процессоры будут использовать интерфейсы AM2+, за исключением высоких моделей с интерфейсами Socket F+.

В начале 2009 г. AMD предполагает выпустить серию процессоров по технологии 45 нм с кодовыми именами “Deneb FX” для Phenom FX, “Deneb” для Phenom X4, “Heka” для трехъядерного Phenom (ранее называвшегося Phenom X3) и “Regor” для Athlon Х2. Эти процессоры будут работать с ОП типа DDR3, комплектоваться более крупным L3-кэшем, использовать интерфейс АМ3 для однопроцессорных систем и Socket G3МХ для двухпроцессорных Quad FX platform.

AMD Fusion – кодовое название проектов процессоров следующего (после К10) поколения, продукт сотрудничества между AMD и ATI, начатого в 2006 г. Ожидается, что изделия Fusion будут представлены в конце 2008 – начале 2009 гг. в качестве следующего этапа развития микроархитектур AMD.

Архитектура Fusion представляет собой гетерогенный многоядерный микропроцессор, комбинирующий ядра обычных процессоров (центральный процессор – ЦП, CPU) и графической обработки (графический процессор – ГП, GPU).

Bobcat – процессор архитектуры, промежуточной между К10 и Fusion, предполагаемый к выпуску в 2008 г. Представляет собой существенно упрощенное ядро х86, позволяющее осуществлять обработку программ х86 при энергопотреблении между 1 и 10 Вт. Предполагается, что Bobcat будет использоваться в устройствах UMPC, OLPC, КПК и других малогабаритных изделиях.

Bulldozer – кодовое название, данное ядру ЦП архитектуры Fusion, опирающегося на методологии проектирования, ядро которого будет иметь энергоемкость от 10 до 100 Вт, планируется к выпуску в 2009 г. Ядро Bulldozer предполагается устанавливать на общем чипе с одним или более ядрами графической обработки, поддерживающими стандарты DirectX (предполагается, что это будут процессоры Radeon).Кроме того, планируется архитектура с кодовым именем Sandtiger, предусматривающая объединение от 8 до 16 ядер Bulldozer и предназначенная для серверов и высокопроизводительных вычислений (НРС applications).

Предполагается также, что ядра Bulldozer в многоядерных архитектурах будут наделены способностями переключения незанятых исполнительных элементов (арифметико-логические устройства, ALU и блоки операций с ПЗ, FRU) от одного ядра к другому для выравнивания загрузки элементов процессора.

 

 

В течение долгих лет развитие ЦП показывало, что использование только тактовой частоты является недостаточным критерием для сопоставления ЦП.

AMD долго стремилась преуменьшить важность “сырой” тактовой скорости как окончательного критерия уровня производительности процессора и перешла к “номеру модели”, который сопоставлял реальные скорости ее процессоров с оценками чипов Intel. До недавнего времени казалось, что Intel достаточно было ограничиваться тактовой частотой, по-видимому, потому что их чипы показывали более высокую частоту, чем равноценные ЦП AMD.

Процессоры Intel. Ситуация изменилась весной 2004 г., когда Intel также решила использовать более общие критерии для сопоставления процессоров в глазах пользователей. В дальнейшем, кроме рассмотрения чистой скорости часов, номера процессоров Intel, также примут во внимание такие важные особенности, как размер кэш-памяти, скорость FSB, технологический процесс и другие существенные архитектурные особенности.

Результатом явилась разработка системы номеров процессора с использованием комбинации марки процессора (“семейство процессоров”) и определенного номера из трех цифр (“номер процессора” – 3 цифры – 7хх, 5хх или 3хх).

Это число да плюс “семейство процессоров” дают полное “наименование процессора”. В пределах каждой последовательности определены номера процессора (например, 735, 560 или 320). Ссылка на тактовую скорость или на название процессора (как использовалась в прошлом) заменяется номерами процессоров, которые теперь описывают более широкий набор особенностей. Семейства процессора могут также изменяться, чтобы отразить изменения в изделиях Intel.

Более высокий номер в пределах семейства процессора может отмечать улучшение какой-либо характеристики ЦП, или изменения в архитектуре. Следует отметить, что в некоторых случаях более высокий номер процессора может потенциально описывать улучшение одной из характеристик (не отражая ухудшение ряда других).

Номера процессоров предназначены, чтобы отразить различия в пределах некоторого семейства процессора (например, в пределах Intel Pentium IV) или в пределах последовательности (например, 550 против 540). Сами цифры не имеют никакого решающего значения, особенно в рамках семейства. Номера ассоциируются с различными семействами процессоров и таким образом представляют различные оценки для конечного пользователя.

Процессоры AMD. Система модельных номеров Opteron состоит из трех цифр – XYZ. Первая цифра (Х) указывает на общее число процессоров, которое можно использовать в многопроцессорной системе. Оставшиеся цифры (YZ) отражают относительную производительность.

 

 

Контрольные вопросы:

 




Поделиться с друзьями:


Дата добавления: 2013-12-13; Просмотров: 480; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.096 сек.