Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Микропроцессоры фирмы AMD 2 страница




- процессор тактируется частотой 450 МГц и выше,

- наличие кэш-память второго уровня размером до 1Мб, работающей на частоте ядра процессора,

- ряд технологических усовершенствований, обеспечивающих эффективную работу процессора в многопроцессорной конфигурации с использованием до 8 процессоров и объемом памяти до 64 Гб.

- МП выполнен в модульном варианте на прямоугольной плате с ножевым разъемом в 330 контакта - Slot 2,

 

Все модели процессоров Pentium II имеют два весьма существенных недостатка, снижающих их потребительские свойства. Во-первых, они обладают неблагоприятным соотношением “цена-производительность”. Так при росте цены по сравнению с Pentium I более чем в два раза, рост производительности на большинстве приложений составляет около 30%. Во-вторых, загрузка дорогостоящей и емкой кэш-памяти второго уровня, как показали исследования специалистов фирмы-разработчика, при существующем программном обеспечении (ПО) редко превосходит 55-65%. Это свидетельствует о возможности снижения размера кэш-памяти второго уровня, как одного из самых дорогостоящих компонентов процессора.

Указанные причины послужили основой для разработки более дешевого процессора Celeron.

Микропроцессоры Celeron 1 (Deshutes ) МП выполнены в конструктиве Socket 370, то есть выводы располага-

ются в несколько рядов по периметру прямоугольного корпуса перпендикулярно его плоскости. Этот МП - архитектурный аналог процессора Pentium II. Он работает на частотах 266 и 300 МГц, но не имеет кэш-памяти L2, что и делает его значительно более дешевым изделием. Большим преимуществом процессора является простота его “разгона”, то есть повышения тактовой частоты ядра до 350 - 400 МГц. При этом частота работы системной шины может быть увеличена с 66 МГц до 90 МГц (в МП используется фиксированный коэффициент умножения 4,5).

Однако “разгон” ядра процессора может привести к повышению температурного режима его работы и, в конце концов, к сбою в работе. Поэтому “разгон” процессора является процедурой достаточной нежелательной и опасной.

Необходимо отметить, что полное отсутствие кэш-памяти второго уровня привело к довольно значительному снижению его стоимости, но, одновременно, привело к заметному снижению производительности при обработке программ трехмерной графики. Последнее привело к разработке процессора Celeron II.

 

Микропроцессоры Celeron II (Mendocino) В 1998 г. Intel освоила выпуск 0,25 мкм процессора

Celeron II с тактовыми частотами 300,..., 500 МГц, имеющих фиксированные коэффициенты умножения 4,5 (для Celeron II с 300 МГц), 5 (для Celeron II с 333 МГц) и 6 (для Celeron II выше 400 МГц) на 66 МГц системную шину. Эти процессоры имеют кэш-память второго уровня 128 Кбайт, выполненную на одном кристалле с процессором и работающую на частоте процессора. Процессоры содержат около 19 млн. транзисторов и, как и предыдущий, хорошо “разгоняются”. Проведенные исследования показали, что “разогнанный” 333 МГц Celeron II до тактовой частоты 463 МГц по производительности не уступает 450 МГц процессору Pentium II.

Одним из недостатков процессоров Celeron является поддержка им системной шины тактовой частотой до 66 МГц, сдерживающей производительность системы в целом.

Процессоры Celeron выполнены в монолитном прямоугольном плоском корпусе с 370 контактами (Socket 370).

 

Микропроцессоры Pentium III (Katmai). В начале 1999 г. начат выпуск 0,25 мкм процес-

cора Pentium III (разъем Slot 1) с тактовыми частотами 450 и 500 МГц и имеющий потенциальные возможности их увеличения до 1 ГГц. Ядро процессора содержит 9,5 млн. транзисторов и обеспечивает работу системной шины на 100 МГц и на 133 МГц. Он имеет кэш-память L1 объемом 32 Кб (по 16 Кб на кэш-команд и кэш-данных), работающую на частоте системной шины, и L2 объемом 512 Кб, расположенную вне процессорного ядра, но в процессорном картридже, и работающую на половинной частоте ядра.

Состав команд дополнен 70 новыми SIMD-инструкциями, позволяющими значительно ускорить обработку команд трехмерной графики или речи.

Отличительными особенностями МП являются:

- наличие блока SSE (Streaming SIMD Extension), обеспечивающего выполнение до 4-х операций одновременно над 128-битными данными с плавающей точкой за счет использования набора из 70 инструкций SIMD (Single Instruction Multiply Data - одна инструкция, много данных).

- использование высокопроизводительной шины AGP 4X (Accelerated Graphic Port), имеющая пиковую производительность до 1 Гбайт/с.

- прошитый внутри кристалла серийный идентификационный номер данного экземпляра, что должно способствовать отслеживанию работы данного МП в глобальных или локальных сетях, тем самым, повышению уровня безопасности электронной коммерции.

 

Микропроцессоры Pentium III (Coppermine). Архитектура этого 0,18 мкм процеcсора во многом

повторяет предыдущую модель. Его выпуск осуществляется с 1999 г.

Он рассчитан на тактовые частоты 533,..., 700 МГц, при этом системная шина может работать при 100 и 133 МГц. Его ядро содержит 28 млн. транзисторов и имеет площадь 106 кв. мм. В процессе производства используется медное технологическое покрытие. На кристалле интегрированы кэш-память L1 размером 32 Кбайта и L2 - 256 Кбайт, работающая на частоте процессора.

Процессор Coppermine выпускается в модульном исполнении с разъемом Slot 1 и в конструктиве Socket 370. Переход на последний конструктив вызван низкой надежностью разъема Slot 1, его относительно высокой стоимостью и, наконец, переносом всех элементов вторичной кэш-памяти внутри процессора, что и предопределило выполнение процессора в более надежном и дешевом варианте с Socket 370.

Для повышения производительности в Coppermine имеется набор SIMD - инструкций с проверкой контрольной суммы (SSE), переделана система внутренней буферизации, позволяющая ускорить операции с кэш-памятями, а также ликвидировать узкие места при использовании 133 МГц системной шины.

Напряжение питания ядра процессора - 1,6 В.

 

1.4. Микропроцессоры фирмы Hewlett - Packard

 

Фирма Hewlett-Packard еще в 1986 г. перешла на RISC-архитектуру, разработав процессоры семейства PA-RISC (PА - Precision Architecture - прецизион­ная архитектура). В настоящее время она производит уже четвертое семейство своих RISC-процессоров. Базовой моделью семейства стал процессор 7100 (1992 г.), изготовленный на кристалле площадью 200 мм2 по 0,8-мкм технологии. Он допускал параллельное выполнение двух команд с плавающей запятой, имел хорошо продуманную систему управления конвейерами, практически исключающую их простой, и работал начастоте 100 МГц.

Последовавший за ним PA-7100LС стал первым микропроцессором с интегрированными средствами мультимедиа. Он способен в реальном масштабе времени декодировать видеосигнал со скоростью 30 кадров в секунду в масштабе MPEG-1, одновременно поддерживая стереозвук. Появившиеся позже процессоры РА-7150 и РА-7200 в целом близки к РА-7100, но по сравнению с последним в них приняты меры для повышения производительности: в первом - тактовая частота увеличена до 125 МГц а во втором использованы оригинальные разработки по повышению производительности кэш-памяти второго уровня.

Процессоры следующего поколения РА-8000 и РА-8200 относятся к 64-разрядным структурам и допускают параллельное выполнение до четырех команд. Они выпол­нены они по 0,5 мкм и 0,35 мкм технологии соответственно и функ­ционируют на частоте 200 МГц и выше.

За один такт процессор РА-8200 может выполнять до четырех команд, выбранных из динамически nеpеупорядочиваемого буфера объемом до 56 команд.

Структура процессора содержит десять исполнительных устройств, которые разбиты по парам и допускают параллельное выполнение команд в них. Это – два целочисленных устройства, два устройства для операций с плавающей запятой и по два устройства деления/извлечения корня, загрузки/сохранения и сдвига/совмещения. В процессоре нет внутренней кэш-памяти первого уровня. Ее отсутствие компенсируется наличием 128-разрядного интерфейса для внешней кэш-памяти первого уровня, объем которой может достигать 4 Мбайт. В качестве системной используется шина Runway. Она применялась в ранних моделях PA-RISC и характеризуется пропускной способностью 768 Мбайт/с.

Фирма НР совместно с Intel планирует к выпуску в 2000 г. опытного процессора Merced. Он призван развить новую концепцию микропроцессоров с архитектурой VLIW (Very Long Instruction Word - очень длинные инструкции), в противовес бурно развивающимся RISC-процессорам с простыми и короткими инструкциями.

Использование этой архитектуры вызвано следующим. Многие современ­ные процессоры (Р6, Nx586, K6 и т.д.) содержат в своем составе устройства, преобразующие длинные и нерегулярные команды х86 в короткие и регулярные RISC-команды, которые затем с большой скоростью "перемалываются" ядром процессора.

Этот процессор будет запущен в серийное производство на фирме Intel и изготавливаться по 0,18 мкм технологии. Он станет первым процессором семейства IA-64 (аббревиатура от Intel 64-bit architecture). Которая воплощает концепцию EPIC (Explicitly Parallel Instruction Computing - вычисления с явным параллелизмом команд). Основными достоинствами данной концепции являются:

- распараллеливанием потока команд занимается компилятор, а не процессор, при этом компилятор способен провести анализ по всей программе, в то время как процессор может анализировать лишь небольшие ее участки. Такое положение усложняет архитектуру компилятора, а значит, может привести к увеличению числа ошибок при компилировании команд программы;

- процессор не тратит свое время на анализ потока команд;

- при многократном запуске некоторой программы ее распараллеливание осуществляется всего один раз (при компиляции), а не каждый раз, когда она исполняется на процессоре.

Главными конструктивно-технологическими особенностями IA-64 являются:

1) Наличие большого числа регистров для хранения информации (128 64-разрядных регистров общего назначения, 128 80-разрядных регистров вещественной арифметики и 64 одноразрядных предикатных регистров);

2) Масштабируемость архитектуры до большего количества функциональных устройств. Команды IA-64 упаковываются (группируются) компилятором в связку длиной в 128 разрядов. Каждая связка содержит три команды и шаблон, в котором указываются зависимости выполнения команд: можно ли с командой к1 запустить параллельно к2, или же к2 должна выполняться только после к1), а также между другими связками (можно ли с командой к3 из связки с1 запустить параллельно команду к4 из связки с2). Ниже представлены все возможные варианты составления связки их трех команд:

i1 çç i2 çç i3 - все команды исполняются параллельно,

i1& i2 çç i3 - сначала i1, а затем исполняются параллельно i2 çç i3,

i1 çç i2 & i3 - параллельно исполняются i1 çç i2, после них - i3,

i1 & i2 & i3 - последовательно исполняются i1, i2, i3.

Одна такая связка, состоящая из трех команд, соответствует набору из трех функциональных устройств процессора. IA-64 могут содержать разное количество блоков, оставаясь при этом совместимыми по коду. Благодаря шаблону процессору с N одинаковыми блоками из трех функциональных устройств будет соответствовать командное слово из N связок. Таким образом обеспечивается масштабируемость IA-64.

3) Явный параллелизм в машинном коде, при котором поиск зависимостей между командами производит не процессор, а компилятор,

4) Предикация, при которой команды из разных ветвей условного ветвления снабжаются предикатными полями (полями условий) и запускаются параллельно. Если в программе встречается условное ветвление, то команды из разных ветвей помечаются разными предикатными регистрами, далее они выполняются совместно, но их результаты не записываются, пока значения предикатных регистров не определены. Когда же, наконец, вычисляется условное ветвление, то один предикатный регистр, соответствующий “правильной” ветви, устанавливается в “1”, а другой - в “0”. Перед записью результатов процессор проверяет предикатное поле и проверяет результаты только тех команд, предикатное поле которых содержит предикатный регистр с записанной “1”.

5) Загрузка по предположению, при которой данные из медленной основной памяти загружаются компилятором заранее и помечаются особым образом. А непосредственно перед командой, использующей загружаемые по предположению данные, компилятор вставляет команду проверки предположения. Если при выполнении загрузки по предположению возникает исключительная ситуация, то процессор сгенерирует исключение только когда встретит команду проверки предположения. Если, например, команда загрузки выносится из ветвления, а ветвь, из которой она вынесена, не запускается, возникшая исключительная ситуация проигнорируется.

Однакo необходимо заметить, что RISC-технология постепен­но приближается к своему пределу производительности, в связи с чем разработчики новые пути ее повышения. Возможно, что достигнутый уровень технологии позволит реализовать принципиально новый подход: длинные и нерегулярные команды х86 преобразуются в очень длинные, но регулярные, которые затем выполняются большим числом параллельно работающих внутренних устройств так же за один такт. Другими словами, за один такт может быть выполнено сразу несколько десятков команд, что недостижимо для сегодняшних RISC-процессоров.

 

1.5. Микропроцессоры фирмы DEC

Корпорация Digital Equipment (DEC) широко известна благодаря популяр­ным (в том числе и в нашей стране) ми­ни-компьютерам PDP и VAX. На рынок RISC-систем она вышла относительно недавно, но практически сразу завоева­ла позицию лидера по производитель­ности благодаря уникальным характеристикам микропроцессора Alpha. Передовые решения, реализованные ею в новых изделиях, в течение двух лет не могли быть реализованы, так как не было программ, адаптированных для ее 64-разрядных процессоров. Однако стратегия DEC "на опережение" оказа­лась весьма разумной. Сегодня плат­форма Alpha поддерживается весьма солидным списком программных средств, причем некоторые из них — уникальны, как, например, 64-разряд­ная версия СУБД Oracle 7.0.

История микропроцес­соров Alpha началась в 1988 г. DEC, когда она приступила к вы­полнению программы, которая должна была одним рывком вывести корпора­цию в число лидеров. Проект Alpha был ориентирован на самую передовую на то время 0,8-мкм технологию, перспективную архитекту­ру, поддерживающую режим SMP (Symmetric Multiprocessing - симмет­ричное мультипроцессирование) и об­работку 64-разрядных приложений в среде UNIX (несколько позднее для про­цессоров Alpha была адаптирована и ОС Microsoft Windows NT). Основным принципом разработчиков было предель­ное упрощение конструкции, которое позволило бы выйти на тактовые час­тоты, недоступные другим изделиям, и добиться рекордной производи­тельности за счет работы на предельно возможных частотах.

Первым процессором семейства Alpha APX стал 21064, выполненный на кристалле площадью 238 мм2 и содер­жащий 1,7 млн. транзисторов. Фантас­тическая по тем временам тактовая час­тота 200 МГц и суперскалярная обра­ботка (до двух команд за один такт) поз­волили ему превзойти по производи­тельности всех остальных конкурентов. Конвейер состоял из десяти ступеней, что также было передовым решением на то время.

В 1994 г. была выпущена следующая модификация — 21064А— с тактовой частотой 275 МГц. Через год появился процессор третьего поколения — 21164. Он был выполнен по 0,5-мкм тех­нологии, и на подложке площадью 298 мм2 размещено 9,3 млн. транзисто­ров. Число исполнительных устройств было увеличено с двух до четырех, а кэш-память второго уровня объемом 96 Кбайт впервые размещена на кристалле микропроцессора.

Долгое время 21164 оставался лиде­ром по производительности, и только в 1997 г. DEC выпустила 400- и 433-мегагерцевые версии 21164. Кроме того, она завершает разработку 500-мегагерцевого 21264.

Корпорация DEC обнародовала свои планы долгосрочного развития процес­сорного направления. Вслед за 21264 должен появиться процессор с кодовым названием EV7, выполненный по 0,25-мкм технологии и работающий на частоте 750 МГц. Он будет иметь в сво­ем распоряжении 16 конвейеров. Это позволит, по мнению специалистов DEC, втрое поднять его производительность в сравнении с 21264. И завершит эту линию 32-конвейерный процессор EV8, который планируется анонсировать в 2000 г. Он будет содержать 250 млн. транзисторов и работать с тактовой частотой 1 ГГц.

Помимо суперпроизводительных процессоров, DEC разработала и по­ставляет процессоры Alpha 21066/21068, являющиеся упрощенным вариантом 21064. Их тактовая частота находится в пределах от 66 до 233 МГц. Более плотная "упаковка" транзисторов на кристалле позволила включить в состав процессоров графи­ческий контроллер, контроллер прямо­го доступа к памяти и контроллер PCI - шины. Благодаря своим широким возможностям и низкой стоимости, они стали весьма привлекательными для использования в рабочих станциях ниж­него уровня.

 

1.4. Микропроцессоры фирмы SUN Microsystems

 

В течение довольно долгого времени фирма SUN выпускала процессоры се­мейства SPARC для недорогих рабочих станций и UNIX-серверов. В основном это была техника, используемая учеб­ными и научными организациями. Первым процессором семейства был процессор UltraSPARC I с рабочей частотой до 167 МГц. Он имел мощное арифметико-логическое устройство, благодаря чему его производительность превзошла и PowerPC 620, и Pentium, и Р6.

В процес­сор были интегрированы специальные блоки цифровой обработки графики и видео­данных, позволяющие ему выполнять компрессию/декомпрессию данных в стандарте MPEG-2 с частотой 30 кадров в секунду в реальном масштабе време­ни. Кроме того, обеспечивается весьма высокая скорость обработки изображе­ний, более чем на порядок превышаю­щая скорость выполнения этой работы любым из ранее упомянутых процессоров. К тому же разработчикам SUN удалось добиться очень высокой скорости обме­на процессора с системной шиной (до 1,3 Гбайт/с), что также положительно сказалось на производительности сер­веров, использующих UltraSPARC I.

Вначале 1996 г. фирма анонсировала процессоры UltraSPARC II, вдвое пре­восходящие по производительности своих предшественников. Работают они на частотах вплоть до 300 МГц и также предназначены для использования в ра­бочих станциях и серверах, ориентиро­ванных па обработку высококачествен­ных изображений.

Дальнейшее разви­тие семейства — процессоры UltraSPARC III, которые появились в 1998 г. Они функцио­нируют на частотах 350, 400 и 450 МГц, по производительности более чем вдвое превосходят UltraSPARC II и, по крайней мере, во столько же раз будут "быстрее" 200-мегагерцевых РА-8000 компании Hewlett-Packard при сопоста­вимых ценах.

Форсирование выпуска более мощ­ных процессоров связано с внедрением в информационные системы корпора­тивных серверов. Первым ша­гом в этом направлении стал выпуск в 1996 г. серии Ultra Enterprise, старшая модель которой оснащена процессо­ром UltraSPARC-200. Система пред­ставляет собой мультипроцессорный сервер, в котором независимо друг от друга параллельно могут работать до 30 процессоров. Архитектурно она компонуется из четырехпроцессорных модулей, объединяемых высокопроиз­водительной шиной, выполненной по патентованной технологии SUN Ultra Port. Пропускная способность ши­ны — до 2,6 Гбайт/с. Объем ОЗУ серве­ров — 60 Гбайт, дискового пространства - 9 Тбайт.

В 1996 г. SUN выкупила у Silicon Graphics подразделение, выпус­кавшее серверы Cray. Оно произво­дило суперсервер Cray Research CS6400, потенциально масштабируе­мый до 64 процессоров. В SUN начались работы по выпуску аналогичного изде­лии на процессорах UltraSPARC-200. В нем использован ряд архитектурных решений, отрабо­танных при выпуске Ultra Enterprise, в ча­стности шину ввода-вывода и систем­ную шину.

Фирма SUN продолжает расширять производственную базу своих процес­соров. В частности, с 1996 г. японская фирма NEC, известная своей приверженностью к разработкам MIPS, производит на своих заводах процессоры SUN (ра­нее они изготавливались только на предприятиях фирмы Texas Instru­ments). NEC изготавливает се­рийные изделия с проектными нормами до 0,15,...0,18 мкм. Такой технологией вла­деет всего десяток хорошо известных фирм (Intel, IBM, Motorola, AMD, Texas Instruments, NEC, SGS-Thomson, DEC, Hewlett-Packard).

Помимо UltraSPARC, SUN анонсиро­вала процессор microSPARC-llep для программируемых устройств, включая системы офисной автоматизации, теле­коммуникационные системы и корпора­тивные сетевые устройства. Это первый вид процессоров SPARC с контроллером PCI на кристалле. Он, кроме того, имеет два интегрированных высокоскорост­ных интерфейса для работы с памятью программ и с памятью данных. Прямой интерфейс с памятью расширяет поло­су пропускания запоминающего устрой­ства и позволяет передавать данные без блокировки процессора.

Контрол­лер интерфейса динамического ОЗУ формирует все необходимые сигналы для управления памятью объемом 256 Мбайт по 64-разрядной магистра­ли, имеется также устройство для реге­нерации этого ОЗУ. Объем кэш-памяти — 24 Кбайт, из которых 16 Кбайт — память команд и 8 Кбайт — память дан­ных. Целочисленное устройство содер­жит восемь окон регистров на 136 слов, а арифметическое устройство с плава­ющей запятой — 32 32-разрядных реги­стра, исполнительные блоки общего на­значения и аппаратные умножители.

Помимо SUN выпуском аналогичной продукции занимаются еще несколько фирм, производящие SUN-совместимую продукцию. Это оказалось возможным благодаря тому, что SPARC-архитектура открыта для разработчиков. SUN опубликовала и постоянно обновляет все необходимые для этого спецификации. Наиболее заметная из этих фирм — Ross Technology со своими процессорами hyperSPARC. В 1997 г. она выпус­тила изделия, работающие на частотах 133, 166 и 180 МГц. По оценкам экспертов по производительности hyperSPARC-133 не уступает 233-мегагерцевому процессору Alphaа фирмы DEC.

Необходимо заметить, что hyperSPARC допускают простой upgrade путем замены процессора в панельке (как, например, Pentium-100 на Pentium-166). Важность этого определяется тем, что у RISC-про­цессоров близко нет такой аппаратной и программной совместимости, которая наблюдается у процессоров 80х86.

 

 

Микропроцессор К5. В 1996 г. фирмой AMD был

предложен к реализации первый скалярный процессор на основе одного исполнительного конвейера К5 (5´86), использующий 64 - разрядную шину данных (ШД) и работающий на частоте 100 МГц. МП имеет практически самое высокое быстродействие при обработке команд целочисленной арифметики. Однако из-за несовершенного конструктивно-технологического исполнения арифметического сопроцессора обработка команд с плавающей точкой, имеющих место во всех программах трехмерной графики, операциях с многоканальным звуком и т.д., он по производительности значительно уступает аналогичным микропроцессорам Intel. Вторым недостатком МП было то, что используемая в нем технология не дает возможности увеличения тактовой частоты, что сводило практически на нет все попытки дальнейшего совершенствования этой модели МП.

После этого AMD приобрела фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6.

 

Микропроцессор К6-2 В 1998 г. фирма AMD приступила к

выпуску процессораК6-2, в котором использованы ряд технических новшеств (разделены блоки диспетчеризации потока команд и данных, использовано преобразование 80 ´ 86 команд в набор RISC - подобных внутренних микроопераций, добавлены к стандартному набору команд инструкции мультимедийной (ММХ) архитектуры и т.д.). Процессоры выпускаются на тактовые частоты 300,..., 500 МГц, выполнены на кристалле площадью 81 мм2 по 0,25 – микронной технологии, имеют 9,3 млн. транзисторов и рассчитаны на работу с 100 МГц шиной. Процессор имеет встроенные кэш-памяти L1 и L2, причем кэш-память L1 имеет объем 64 Кб (по 32 Кб на кэш-команд и кэш-данных), а кэш-память L2 встроена в процессор, имеет объем 256 Кб и работает на частоте процессора.

Напряжение питания ядра процессора - 2,2 В.

Для повышения производительность обработки команд с плавающей точкой в К6-2 AMD предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!, выполнение которых возлагалось на основной процессор. Для этого к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность.

Использование указанной технологии позволяло переложить задачу обработки команд с плавающей точкой на основной процессор, имеющего большее быстродействие, чем быстродействие арифметического сопроцессора. Однако высокая производительность этого МП проявлялась только в том случае, когда обрабатываемые программы выполнялись с учетом технологии 3DNow!.

Микропроцессор К6-3 Для повышения производительно-

сти с использованием новой технологии 3Dnow! AMD добавила интегрированный в ядро кэш-память второго уровня L2, работающую на частоте процессора. Новый процессор К6-3 (разъем Socket 7) получил кодовое название Sharptooth, выполнен по 0,25 мкм технологии и имеет 21,3 млн. транзисторов. Он работает на частотах 350,..., 475 МГц, что позволяет обеспечить работу системной шины на частоте до 100 МГц. Кэш-памяти L1 имеет объем 64 Кб (по 32 Кб на кэш-команд и кэш-данных), а кэш-память L2 - 256 Кб. Кроме того, в системе предусматривается использование кэш-памяти третьего уровня L3, позволяющая несколько увеличить производительность процессора. Напряжение питания процессора 2,3-2,5 В.

Система команд процессора дополнена 21 SIMD-командами 3Dnow! для обработки чисел с плавающей точкой. Арифметический сопроцессор имеет два конвейера, оперирующими с двумя парами вещественных чисел одинарной точности.

Ядро процессора отличается от предшествующего наличием функции пакетной записи в память. Суть такой записи заключается в том, что данные по шине передаются по мере их накопления 8-ми байтными пакетами.

 

Микропроцессор К7 “Athlon” C 1999 г. АMD начала выпуск

0,25 мкм (а позже и 0,18 мкм) RISC - процессора К7, который имеет площадь кристалла менее 100 кв. мм., рассчитан на работу при тактовых частотах 500,..., 650 МГц и имеет наибольшую производительность при обработке команд с плавающей точкой. Процессор содержит 22 млн. транзисторов, поддерживает системную шину Alpha EV6, кэш-память L1 имеет объем 128 Кб (по 64 Кб на кэш-команд и кэш-данных), а кэш-память L2 - от 512 Кб до 8 Мб, которая может работать либо на полной тактовой частоте процессора, либо на половинной, либо на одной третьей частоте.

Набор SIMD-инструкций расширен до 45 команд. Напряжение питания ядра процессора - 1,6 В.

Для установки процессора используется специальный разъем Slot A, который выглядит также как и Slot 1, но шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов - Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть.

Отличительной особенностью процессора является системная шина EV6, которая хотя и работает на частоте 100 МГц, но передача данных по ней, в отличие от GTL+ фирмы Intel, ведется на обоих фронтах сигнала. Поэтому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ESS (под проверку контрольной суммы), то скорость передачи данных составляет:

V д = 64 бита ´ 200 МГц = 1,6 Гбайт/с.

Заметим, что пропускная способность GTL+, работающей на 100 МГц частоте, в два раза меньше и составляет около 800 Мбайт/с. Таким образом, EV6 более перспективна. При этом планируется, что частота EV6 должна достигнуть значения 133 (266), а затем и 200 (400) МГц.

Еще одна интересная особенность EV6 заключается в поддержке многопроцессорных систем. В отличие от GTL+, EV6 обеспечивает соединение точка-точка между процессорами, что позволяет выделить всю пропускную способность шины для каждого процессора. Теоретически таким образом может подключаться до 14 процессоров, что и определяет перспективность EV6 при использовании в многопроцессорных системах.

Особенности работы процессора заключаются в следующем.

Перед началом работы над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно.




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 746; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.