КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Характеристики микропроцессоров и их анализ
Главной характеристикой любого микропроцессора общетехнического применения является производительность: - при использовании кэш-памяти первого уровня (L1), - при обработке целочисленных величин (чисел с фиксированной точкой), - при обработке вещественных чисел (чисел с плавающей точкой), - при чтении и записи информации в память, - при обработке команд трехмерной графики. Для определения указанных характеристик и сравнительного анализа при тестировании использовалось одно и тоже оборудование, что давало возможность более объективной оценки быстродействию используемых при тестировании процессоров и ПК на их основе.
Производительность при использовании кэш-памяти L1 определяет быстродействие процессоров и ПК при обработке команд и обмене данными между процессором и памятью при наличии кэш-памяти L1. На рис. 8 для примера приведены кривые, отображающие производительность основного процессора (CPU) и арифметического сопроцессора (FPU). Для испытаний был выбран кристалл процессора Pentium II с тактовой частотой 450 МГц, работающий с 100 МГц системной шиной. В процессе тестирования определялись: . Рис. 8. Производительность CPU и FPU при обработке команд и обмене информацией с памятью
- производительность основного процессора и арифметического сопроцессора при обработке команд, исследование которых проводилось на синтетических тестах CPUМark 99 и FPU WinМark соответственно, - производительность CPU и FPU при обмене информацией с системной памятью (CPU Memory Мark и FPU Memory Мark соответственно). Очевидно, что введение кэш-памяти L1 повышает на несколько порядков производительность CPU и FPU по сравнению с ее отсутствием. Производительность при обработке целочисленных величин. Обработка целочисленных величин свойственна в большей степени офисным приложениям. Измерение производительности процессора может быть проведено тестирующими пакетами Winstone 99 и CPUMark 99. На рис. 9 приведены кривые производительности для трех групп процессоров: - первая группа: 400 МГц процессоры AMD K6-2, Celeron, Pentium II и AMD K6-3, - вторая группа: 450 МГц процессоры Pentium III и Celeron, - третья группа: 600 МГц процессоры Pentium III и AMD Athlon. Рис. 9. Производительность процессоров при целочисленных вычислениях
Сравнительный анализ гистограмм, проведенный для пар процессоров Pentium II 400 МГц и Pentium III 450 МГц, Celeron 400 МГц и Celeron 450 МГц, Pentium III 600 МГц и Athlon 600 МГц показывает, что чем выше тактовая частота процессора, тем он производительнее. Введение быстродействующей кэш-памяти L2, как видно из верхней кривой (тест CPUMark 99) для 400 МГц процессоров AMD K6-2 и K6-3, приводит к заметному росту производительности (для этих процессоров почти на 50%). Производительность при обработке вещественных чисел может быть оценена тестирующей программой FPU WinMark, которая осуществляет тестирование арифметического сопроцессора при обработке команд с плавающей точкой. Гистограммы для ранее выбранной группы процессоров приведены на рис. 10.
Рис. 10. Гистограммы производительности FPU при обработке вещественных чисел
Процессоры AMD K6-2 и K6-3 имеют наименьшую производительность, которая обусловлена использованием в них неконвейерных арифметических сопроцессоров. Введение в его архитектуру кэш-памяти третьего уровня практически не влияет на повышение производительности. В тоже время конвейеризация вычислений, используемая в процессорах Intel Pentium и Celeron, ведет к увеличению производительности на 50 - 70%. В одинаковых по структуре построения (за исключением размера кэш-памяти второго уровня) процессорах Celeron 400 МГц и Pentium II 400 МГц также наблюдаются практически одинаковые производительности, что еще раз подтверждает незначительное влияние быстродействующей кэш-памяти на производительность при обработке вещественных чисел. Производительность при чтении и записи информации из памяти. Кривые производительности чтения информации из памяти для 450 МГц процессоров AMD K6-2, AMD K6-3, Celeron, Pentium II и Pentium III приведены на рис. 11. Из них видно, что производительность чтения во многом определяется размером считываемого блока. Для всех процессоров на начальном участке производительность чтения информации из памяти практически одинаковы и слабо зависят от размера блока информации. Рис. 11. Производительность при чтении из памяти
Однако при превышении размера блока объема кэш-памяти производительность при чтении резко снижается, причем это снижение раньше проявляется у процессоров Intel, у которых объемы первичных кэш-памятей команд и данных вдвое меньше, чем у AMD. Второе падение скоростей чтения приходится при превышении размеров вводимых блоков объемов вторичной кэш-памяти. И чем больше объем вторичной кэш-памяти, тем ниже производительность при чтении информации. Сказанное свидетельствует о демпфирующем влиянии вторичной кэш-памяти на быстродействие процессора. Поэтому для устранения негативного влияния вторичной кэш-памяти на производительность обмена информацией разработчики AMD ввели кэш-память третьего уровня, расположив ее на системной плате вне процессора. По мнению разработчиков это должно повысить производительность при чтении пакетов информации больших объемов. Анализ кривых скоростей записи информации в память этих же процессорах показывает, что их поведение практически аналогично поведению кривых, представленных на рис. 11. Таким образом, очевидно влияние использования кэш-памятей обеих уровней на производительность обмена информацией процессоров с памятью. Из сказанного можно сделать следующие выводы: - объемы передаваемых пакетов информации между процессором и памятью не должны превышать размеров соответствующих кэш-памятей команд и/или данных, - объемы вторичной кэш-памяти оказывают демпфирующее влияние на производительность обмена информацией между процессором и памятью, при этом чем больше ее объемы, тем ниже производительность обмена информацией между процессором и памятью.
Производительность при обработке команд трехмерной графики. Обработка команд трехмерной графики характеризуется наибольшим использованием аппаратных возможностей процессора. Вся вычислительная мощность при этом мобилизована на выполнение команд 3D-программы, формируя трехмерные сцены воспроизводимого изображения. В обработке команд принимают участие основной процессор, проводящий предварительные вычисления (геометрические расчеты объектов), арифметический сопроцессор, который осуществляет все основные расчеты формы, размеров, цвета объектов, их расположения, производительность и направления перемещения, освещенности и т.д., и процессор(ы) вывода информации на экран монитора (дисплея), формирующие сменяющиеся с определенной частотой страницы изображения. Для тестирования процессора с целью определения производительность обработке команд трехмерной графики используется тестирующая программа CPU 3Dmark, с помощью которой можно определить пиковую производительность процессора при обработке 3D-команд. На рис. 12 приведены гистограммы, показывающие производительности процессоров Intel и AMD, при этом процессоры AMD подверглись тестированию с включенным и выключенным блоком 3DNow! Рис. 12. Гистограммы производительности при обработке команд трехмерной графики
Из гистограмм можно сделать следующие выводы: - производительность возрастает с ростом тактовой частоты процессора и размера вторичной кэш-памяти; - использование блока 3DNow! позволяет увеличить производительность процессоров К6-2(3) почти в 2,5 раза. Это увеличение осуществляется за счет применения SIMD-инструкций, которые обрабатываются основным процессором, а не арифметическим сопроцессором. Проводя сравнительный анализ производительности необходимо отметить, что для интенсивных вычислений с числами с плавающей точкой Athlon несколько превосходит Coppermine. Это объясняется использованием в нем более быстрого арифметического сопроцессора.
Дата добавления: 2015-06-04; Просмотров: 668; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |