Реферат Архитектура процессора Intel Pentium 4
Работа добавлена на сайт bukvasha.net: 2015-10-28Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
чЕРКАССКИЙ ГОССУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ
КАФЕДРА СПЕЦИАЛИЗИРОВАННЫХ КОМПЬЮТЕРНЫХ СИСТЕМ
КУРСОВАЯ РАБОТА
с дисциплины «Архитектура компьютера»
на тему:
«Архитектура процессора Intel Pentium 4»
Проверил: ст.преподаватель | | Сделал: |
Черкассы 2008
Содержание
| Введение | 3 |
1. | Аналитический обзор аналогов | 4 |
2 | Архитектура Pentium процессора | 7 |
3 | Тестирование | 17 |
| Заключение | 23 |
| Список использованных источников | 24 |
Введение
Будучи выпущенным в 1995 году, процессор Intel Pentium Pro стал первым CPU с архитектурой P6. С тех пор прошло уже достаточно много времени, сменилось несколько поколений процессоров, однако, по сути архитектура не менялась. Семейства Pentium II, Pentium III и Celeron имеют все то же строение ядра, отличаясь по сути только размером и организацией кеша второго уровня и наличием набора команд SSE, появившегося в Pentium III. Естественно, рано или поздно архитектура P6 должна была устареть. И дело тут вовсе не в невозможности дальнейшего наращивания тактовых частот и даже не в обострившейся в последнее время конкуренцией с AMD. Конечно, нельзя отрицать тот факт, что достигнув частоты в 1 ГГц Intel столкнулся с проблемами в дальнейшем наращивании частоты своих процессоров: Pentium III 1.13 ГГц даже пришлось отзывать в связи с его нестабильностью. Однако, эту проблему легко можно решить переходом на 0.13 мкм процесс – тем более, что его повсеместное внедрение не за горами.
Настоящая причина необходимости новой архитектуры кроется глубже. К сожалению, дальнейшее наращивание частоты существующих процессоров приводит все к меньшему росту их производительности. Проблема в том, что латентности, то есть задержки, возникающие при обращении к тем или иным узлам процессора, по нынешним меркам в P6 уже слишком велики. Именно это явилось основной причиной, по которой Intel затеял разработку Pentium 4, которая выполнена с чистого листа. Таким образом, анонсированный Pentium 4 - совершенно новый процессор, ничего общего не имеющий со своими предшественниками. В его основе лежит архитектура, названная Intel NetBurst architecture. Этим названием Intel хотел подчеркнуть, что основная цель нового процессора – ускорить выполнение задач потоковой обработки данных, напрямую связанных с бурно развивающимся Internet.
1.
Аналитический обзор аналогов
Процессор Pentium фирмы INTEL объединяет преимущества, традиционно присущие миникомпьютерам и рабочим станциям, с гибкостью и совместимостью, которыми характеризуются платформы персональных компьютеров.
Спроектированный для нужд объединения все усложняющегося современного и будущего прикладного программного обеспечения, Pentium процессор расширяет диапазон микропроцессорной архитектуры фирмы INTEL до новых высот, затеняемой ранее отличиями между мощными вычислительными платформами и созданными для совершенно новой области применений настольными компьютерами и серверами.
Объединяя более чем 3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Pentium процессор характеризуется высокой производительностью с тактовой частотой 60 и 66МГц. Его суперскалярная архитектура использует усовершенствованные способы проектирования, которые позволяют выполнять более чем одну команду за один период тактовой частоты, в результате чего Pentium в состоянии выполнять огромное количество PC-совместимого программного обеспечения быстрее, чем любой другой микропроцессор.
На приведенном коллаже (это действительно коллаж, потому что со скриншота Task Manager были удалены все пользовательские процессы, т. е. приложения, запускаемые “для работы”) хорошо видно, что “голая” Windows XP, сама по себе, не запустив еще ни одного приложения, уже породила 12 процессов, причем многие из них к тому же еще и многопоточные, и общее количество потоков достигает двухсот восьми штук!
Поэтому рассчитывать на то, что удастся прийти к схеме “по собственному CPU на каждую задачу” совершенно не приходится, и переключаться между фрагментами кода процессоры будут все равно - и физические, и виртуальные.
Теперь перейдем к Hyper-Threading. Фактически - это тоже многопроцессорность, только виртуальная. Ибо процессор Pentium 4 на самом деле один. А процессоров ОС видит - два.
Классическому “одноядерному” процессору добавили еще один блок AS - IA-32 Architectural State. Architectural State содержит состояние регистров (общего назначения, управляющих, APIC, служебных). Фактически, AS#1 плюс единственное физическое ядро (блоки предсказания ветвлений, ALU, FPU, SIMD-блоки и пр.) представляет из себя один логический процессор (LP1), а AS#2 плюс все то же физическое ядро - второй логический процессор (LP2). У каждого LP есть свой собственный контроллер прерываний (APIC - Advanced Programmable Interrupt Controller) и набор регистров. Для корректного использования регистров двумя LP существует специальная таблица - RAT (Register Alias Table), согласно данным в которой можно установить соответствие между регистрами общего назначения физического CPU. RAT у каждого LP своя. В результате получается схема, при которой на одном и том же ядре могут свободно выполняться два независимых фрагмента кода т. е. де-факто - многопроцессорную систему!
2. Архитектура Pentium процессора
Pentium процессор. Технические нововведения.
Многочисленные нововведения - характерная особенность Pentium процессора в виде уникального сочетания высокой производительности, совместимости, интеграции данных и наращиваемости. Это включает:
- суперскалярную архитектуру;
- раздельное кэширование программного кода и данных;
- блок предсказания правильного адреса перехода;
- высокопроизводительный блок вычислений с плавающей запятой;
- расширенную 64-битовую шину данных;
- поддержку многопроцессорного режима работы;
- средства задания размера страницы памяти;
- средства обнаружения ошибок и функциональной избыточности;
- управление производительностью;
- наращиваемость с помощью Intel OverDrive процессора.
Предварительная подготовка, первое декодирование (декодирование команды), второе декодирование (генерация адреса), выполнение и обратная выгрузка. Это позволяет нескольким командам находиться в различных стадиях выполнения, увеличивая тем самым вычислительную производительность. Каждый конвейер имеет свое арифметическо-логическое устройство (ALU), совокупность устройств генерации адреса и интерфейс кэширования данных. Так же как и процессор Intel486, Pentium процессор использует аппаратное выполнение команд, заменяющее множество микрокоманд, используемых в предыдущих семействах микропроцессоров. Эти инструкции включают загрузки, запоминания и простые операции АЛУ, которые могут выполняться аппаратными средствами процессора, без использования микрокода. Это повышает производительность без затрагивания совместимости. В случае выполнения более сложных команд, для дополнительного ускорения производительности выполнения расширенного микрокода Pentium процессора для выполнения команд используются оба конвейера суперскалярной архитектуры.
В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.
Первым делом, попробуем разобраться с особенностями новой архитектуры. Архитектура NetBurst имеет в своей основе несколько инноваций, в комплексе и позволяющих добиться конечной цели – гарантировать запас быстродействия и будущую наращиваемость для процессоров семейства Pentium 4. В число основных технологий входят:
- Hyper Pipelined Technology. Конвейер Pentium 4 имеет беспрецедентно большую глубину – 20 стадий;
- Advanced Dynamic Execution. Улучшенное предсказание переходов и исполнение команд с изменением порядка их следования (out of order execution);
- Trace Cache. Для кэширования декодированных инструкций в Pentium 4 используется специальный кэш;
- Rapid Execute Engine. ALU процессора Pentium 4 работает на вдвое большей, чем сам процессор, частоте;
- SSE2. Расширенный набор инструкций для обработки потоковых данных;
- 400 MHz System Bus. Новая системная шина.
Рассмотрим все нововведения по порядку.
Названием Hyper Pipelined Technology конвейер Pentium 4 обязан своей длине – 20 стадий. Для сравнения – длина конвейера Pentium III составляет 10 стадий. Чего же достиг Intel, так удлинив конвейер? Благодаря декомпозиции выполнения каждой команды на более мелкие этапы, каждый из этих этапов теперь может выполняться быстрее, что позволяет беспрепятственно увеличивать частоту процессора. Так, если при используемом сегодня технологическом процессе 0.18 мкм предельная частота для Pentium III составляет 1 ГГц (ну или, по более оптимистичным оценкам, 1.13 ГГц), Pentium 4 сможет достигнуть частоты 2 ГГц.
Однако, у чрезмерно длинного конвейера есть и свои недостатки. Первый недостаток очевиден – каждая команда теперь, проходя большее число стадий, выполняется дольше. Поэтому, чтобы младшие модели Pentium 4 превосходили по производительности старшие модели Pentium III, частоты Pentium 4 начинаются с 1.4 ГГц. Если бы Intel выпустил бы Pentium 4 1 ГГц, то этот процессор несомненно бы проиграл в производительности гигагерцовому Pentium III. Второй недостаток длинного конвейера вскрывается при ошибках в предсказании переходов. Как и любой современный процессор, Pentium 4 может выполнять инструкции не только последовательно, но и параллельно, соответственно не всегда в том порядке, как они следуют в программе и не всегда доподлинно зная направления условных переходов. Для того, чтобы выбирать в таких случаях ветви программы для дальнейшего выполнения, процессор прогнозирует результаты выполнения условных переходов на основании накопленной статистики. Однако, иногда блок предсказания переходов все же ошибается, и в этом случае приходится полностью очищать конвейер, сводя на нет всю предварительно проделанную процессором работу по выполнению не той ветви в программе. Естественно, при более длинном конвейере, его очистка обходится дороже в том смысле, что на новое заполнение конвейера уходит больше процессорных тактов, а следовательно и времени.
Целью ряда ухищрений в архитектуре Pentium 4, под общим названием Advanced Dynamic Execution, как раз и является минимизация простоя процессора при неправильном предсказании переходов и увеличение вероятности правильных предсказаний. Для этого Intel улучшил блок выборки инструкций для внеочередного выполнения и повысил правильность предсказания переходов. Правда, для этого алгоритмы предсказания переходов были доработаны минимально, основным же средством для достижения цели было выбрано увеличение размеров буферов, с которыми работают соответствующие блоки процессора. Так, для выборки следующей инструкции для исполнения используется теперь окно величиной в 126 команд против 42 команд у процессора Pentium III. Буфер же, в котором сохраняются адреса выполненных переходов и на основании которого процессор предсказывает будущие переходы, теперь увеличен до 4 Кбайт, в то время как у Pentium III его размер составлял всего 512 байт. Результатом этого, а также благодаря небольшой доработке алгоритма, вероятность правильного предсказания переходов была улучшена по сравнению с Pentium III на 33%. Это – очень хороший показатель, поскольку теперь Pentium 4 предсказывает переходы правильно в 90-95% случаев.
Вместо обычного L1 кеша, который в Pentium III был разделен на область инструкций и область данных в Pentium 4 применен новый подход. Инструкции в L1 кэше не сохраняются, он предназначен теперь только для данных. Для кэширования инструкций теперь используется Trace Cache, однако по сравнению с обычным L1-кешем он имеет много преимуществ, направленных опять же на минимизацию простоев процессора при выполнении неправильных предсказаний переходов. Первое, и основное – в Trace Cache сохраняются уже декодированные инструкции. Это значит, что в нем хранятся не классические x86 инструкции, а так называемые микрокоманды, более простые операции которыми непосредственно оперирует процессорное ядро. Сохранение в Trace Cache микроопераций позволяет избежать повторного декодирования x86 инструкций при повторном выполнении того же участка программы или при неправильном предсказании переходов.
Второе преимущество Trace Cache заключается в том, что микрооперации в нем сохраняются именно в том порядке, в каком они выполняются. Правда, правильный порядок определяется опять же на основании предсказания переходов, однако вероятность того, что переходы предсказываются неправильно, достаточно мала для того, чтобы отказаться от очевидного выигрыша, получаемого путем отказа от повторных декодирований и предсказаний переходов.
Intel не раскрывает размеров своего Trace Cache в килобайтах, однако, известно что в нем может быть сохранено до 12000 микроопераций.
Наиболее простая часть современного процессора – это ALU (арифметико-логическое устройство). Благодаря этому факту, Intel счел возможным увеличить его тактовую частоту внутри Pentium 4 вдвое по отношению к самому процессору. Таким образом, например, в 1.4 ГГц Pentium 4 ALU работает на частоте 2.8 ГГц.
В ALU исполняются простые целочисленные инструкции, поэтому, производительность нового процессора при операциях с целыми числами должна быть очень высокой. Однако, на производительности Pentium 4 при операциях с вещественными числами, MMX или SSE двукратное ускорение ALU никак не сказывается. Таким образом, латентность ALU существенно снижается. В частности, на выполнение одной инструкции типа add Pentium 4 1.4 ГГц тратит всего 0.35нс, в то время как выполнение этой команды у Pentium III 1 ГГц занимает 1 нс.
Реализовав в своем процессоре Athlon новый конвейерный FPU, AMD очень сильно обогнала интеловский Pentium III в производительности при операциях с вещественными числами. Однако, Intel в своем Pentium 4 не стал сосредотачиваться на совершенствовании своего FPU, а просто увеличил возможности блока SSE. В результате, в Pentium 4 имеет место расширенный набор команд SSE2, в котором к имеющемуся набору из 70 инструкций было добавлено еще 144. Такое решение – результат NetBurst идеологии, основной целью которой является увеличение скорости работы с потоками данных.
Инструкции SSE позволяли оперировать с восемью 128-битными регистрами XMM0..XMM7, в которых хранились по четыре вещественных числа одинарной точности. При этом все SSE операции проводились одновременно над четверками чисел, в результате чего специально оптимизированные программы, в которых производилось большое количество однотипных вычислений (а к ним, помимо обработки потоков данных в какой-то мере относятся и 3D-игры), получали существенный прирост в производительности.
SSE2 же оперирует с теми же самыми регистрами и обратно совместим с SSE процессора Pentium III. А столь впечатляющее расширение набора команд вызвано тем, что теперь операции со 128-битными регистрами могут выполняться не только как с четверками вещественных чисел двойной точности, но и как с парами вещественных чисел двойной точности, с шестнадцатью однобайтовыми целыми, с восемью короткими двухбайтовыми целыми, с четырьмя четырехбайтовыми целыми, с двумя восьмибайтовыми целыми или с 16 байтовыми целыми. То есть, теперь SSE2 представляя собой симбиоз MMX и SSE и позволяет работать с любыми типами данных, влезающими в 128-битные регистры.
Таким образом, SSE2 гораздо более гибок, позволяя добиваться впечатляющего прироста в производительности. Однако, использование нового набора команд требует специальной оптимизации программ, поэтому ждать его внедрения сразу после выхода нового процессора не стоит. Со временем же, SSE2 имеет достаточно большие перспективы. Поэтому, даже AMD собирается реализовать SSE2 в своем новом семействе процессоров Hammer. Старые же программы, не использующие SSE2, а полагающиеся на обычный арифметический сопроцессор, никакого прироста в производительности при использовании Pentium 4 не получат. Более того, несмотря на то, что что Intel говорит о том, что блок FPU в Pentium 4 был слегка усовершенствован, время, необходимое на выполнение обычных операций с вещественными числами возросло по сравнению с Pentium III в среднем на 2 такта.
Что касается кеша первого уровня в Pentium 4, то поскольку теперь команды хранятся в Trace Cache, он предназначен только для хранения данных. Однако, его размер в Pentium 4, основанном на ядре Willamette составляет всего 8 Кбайт. Это выглядит достаточно небольшой цифрой даже на фоне 16-килобайтной области данных в L1 кэше Pentium III. Однако, Intel был вынужден сократить объем кеша первого уровня в Pentium 4, так как ядро этого процессора и без того получалось слишком большим. Тем не менее, архитектура этого процессора может поддерживать L1-кеш и большего размера, поэтому, скорее всего, при переходе на технологический процесс 0.13 мкм и новое ядро Northwood, этот кэш будет увеличен.
Однако, для увеличения производительности, Intel применил для доступа к L1-кешу новый алгоритм, чем уменьшил в Pentium 4 латентность этого кеша до двух процессорных тактов вместо трех тактов в Pentium III. Таким образом, учитывая большую тактовую частоту Pentium 4, время реакции его L1 кеша составляет всего 1.4нс для 1.4 ГГц модели против 3нс у L1 кеша Pentium III 1 ГГц. Также как и в Pentium III, L1 кэш Pentium 4 является write through и ассоциативным с 4 областями ассоциативности. При этом длина одной строки L1 кеша равна 64 байтам.
Процессор Pentium 4 обладает Advanced Transfer Cache второго уровня объемом 256 Кбайт. Также, как и в Pentium III, L2-кеш имеет широкую 256-битную шину, благодаря которой процессоры от Intel имеют более высокую пропускную способность кеша, чем их конкуренты от AMD, использующие 64-битную шину кеша. Однако, в отличие от Athlon, в Pentium 4 (впрочем, также как и в Pentium III) L2 кэш не является эксклюзивным, то есть он дублирует данные, находящиеся в L1 кэше.
Так как Pentium 4 рассчитан на обработку потоковых данных, скорость работы L2-кеша для него является одним из ключевых моментов. Поэтому, Intel увеличил пропускную способность кеша второго уровня в Pentium 4 в два раза. Это усовершенствование было сделано благодаря передаче данных из L2-кеша на каждый процессорный такт, в то время, как данные из L2-кеша Pentium III передаются только на каждый второй такт. Таким образом, пропускная способность L2-кеша Pentium 4, работающего, например, с частотой 1.4 ГГц имеет теперь внушительную величину 44.8 Гбайт/с. Для сравнения – пропускная способность Advanced Transfer Cache у Pentium III 1 ГГц составляет 16 Гбайт/с. Также как и в Pentium III, L2 кэш имеет восемь областей ассоциативности и строки длиной 128 байт. Однако, в отличие от Pentium III, каждая строка может быть изъята не целиком, а по 64-байтовым половинкам.
Говоря о системе кэширования в Pentium 4, нельзя обойти стороной и тот факт, что архитектура NetBurst поддерживает и кэш третьего уровня размером до 4 Мбайт. Однако, в Pentium 4 пока эта возможность не используется. Она зарезервирована для будущего применения в серверных процессорах.
Итак, после краткого знакомства с основными деталями NetBurst архитектуры Pentium 4 взглянем на его формальную спецификацию:
- чип, производимый по технологии 0.18 мкм с использованием алюминиевых соединений. Переход на медные соединения Intel планирует произвести одновременно с внедрением технологии 0.13 мкм.
- ядро Willamette, основанное на архитектуре NetBurst. Содержит 42 млн. транзисторов и имеет площадь 217 кв.мм. Это более чем в два раза больше, чем площадь ядра Athlon или Pentium III;
- работает в специальных материнских платах с 423-контактным процессорным разъемом Socket 423;
- использует высокопроизводительную 400 МГц Quad Pumped системную шину;
- кеш данных первого уровня 8 Кбайт. Trace Cache для декодированных инструкций рассчитан на 12000 микроопераций;
- интегрированный Advanced Transfer Cache второго уровня размером 256 Кбайт. Работает на полной частоте ядра и имеет 256-битную шину;
- напряжение питания - 1.7В;
- набор SIMD-инструкций SSE2;
- выпускаются версии с частотами 1.4 и 1.5 ГГц. Позднее ожидается версия с частотой 1.3 ГГц.
Поскольку Pentium 4 имеет совершенно новую архитектуру, то ему потребовался и новый чипсет. Так как Intel нацеливает свой новый процессор на приложения, работающий с потоками данных, то основной задачей такого чипсета должно являться обеспечение высоких пропускных способностей основных шин: шины памяти и системной шины, соединяющей процессор с северным мостом чипсета.
Pentium 4 использует совершенно новую Quad Pumped процессорную шину, работающую с частотой 400 МГц. Пропускная способность такой шины в три раза больше, чем пропускная способность шины процессора Pentium III, и составляет 3.2 Гбайт/с. Благодаря такой высокой пропускной способности, минимизируются простои быстрого процессора Pentium 4 в ожидании следующей порции данных. Физически, реализуется новая системная шина путем умножения в контроллерах процессорной шины чипсета и процессора тактовой частоты, которая для Pentium 4 составляет 100 МГц, на 4. То есть, на частоте 400 МГц работает только участок между процессором и чипсетом.
Наряду с такой высокопроизводительной шиной, чтобы система была сбалансирована, подсистема памяти для Pentium 4 должна обеспечивать не меньшую, чем 3.2 Гбайт/с, пропускную способность. Поэтому, при создании набора системной логики для нового процессора Intel принял решение адаптировать чипсет i840, который поддерживает два канала Direct RDRAM. Как известно, пропускная способность PC800 RDRAM составляет 1.6 Гбайт/с, то есть, при использовании двух каналов Rambus, пропускная способность памяти оказывается как раз на уровне 3.2 Гбайт/с.
В качестве южного моста в этом наборе логики используется уже знакомая нам по чипсету i815E микросхема ICH2, а в качестве северного моста – новый MCH Intel 82850, в числе ключевых особенностей которого следует отметить поддержку двух каналов Rambus, каждый из которых может функционировать с парой модулей RIMM, поддержку 400-мегагерцовой системной шины и AGP 4x.
Ввиду дороговизны самого чипсета i850, а также ввиду того, что платы под Pentium 4 должны иметь шестислойную PCB, производить их достаточно сложно и дорого. Поэтому, только ограниченное число производителей системных плат высказало желание ввязаться в производство плат под Socket 423. В ближайшее время платы под Pentium 4 будут выпускаться только восемью производителями. Спецификации некоторых таких плат уже известны:
Плата | Чипсет | Форм-фактор | RIMM | AGP | PCI | CNR | Примечания |
Aopen AX4T | i850 | ATX | 4 | AGP Pro | 5 | 1 | |
ASUS P4T | i850 | ATX | 4 | AGP Pro | 5 | 0 | Возможности для разгона CPU |
Gigabyte GA-8TX | i850 | ATX | 4 | AGP Pro | 5 | 1 | Интегрированный Creative CT5880 |
Intel D850GB | i850 | ATX | 4 | AGP Pro | 5 | 1 | |
MSI MS-6339 | i850 | ATX | 4 | 1 | 5 | 1 | |
Как можно видеть из таблицы, все платы под Pentium 4 похожи друг на друга: все имеют по четыре слота для RIMM и по пять слотов PCI. Большинство плат оборудовалось слотом AGP Pro, позволяющим использовать профессиональные графические карты с повышенным энергопотреблением.
3. Тестирование
Для тестирования было собрано три системы со следующими конфигурациями:
| Pentium 4 | Pentium III | Athlon |
Процессор | Intel Pentium 4 1.4 Гц | Intel Pentium III 1ГГц | AMD Athlon 1.2 ГГц |
Системная плата | Intel D850GB (i850) | ASUS CUSL2 (i815) | ABIT KT7 (VIA T133) |
Память | 256 Мбайт PC800 RDRAM | 256 Мбайт PC133 SDRAM | |
Видеокарта | ASUS V7700 32MB (NVIDIA GeForce2 GTS) | ||
Жесткий диск | IBM DTLA 307015 |
Производительность Pentium 4 сравнивалась с самыми быстрыми на сегодня процессорами других семейств: Intel Pentium III 1 ГГц и AMD Athlon 1.2 ГГц.
Тестирование проводилось под управлением операционной системы Microsoft Windows2000 SP1 с установленным DirectX 8.
Поскольку процессор Pentium 4 имеет совершенно новую архитектуру, анализ производительности этого процессора будет состоять из двух частей. В первой для измерения быстродействия мы воспользуемся синтетическими тестами, а во второй протестируем процессоры, принимающие участие в тестировании, реальными приложениями.
CPUmark 99
Этот тест показывает производительность целочисленной части процессора и скорость работы с данными. Казалось бы, поскольку ALU Pentium 4 работает на удвоенной частоте процессора, то по результатам этого теста впереди должен быть Pentium 4. Однако этого не происходит. Разгадка медлительности Pentium 4 в данном тесте кроется в недостаточно большом L1 кэше, в который не помещаются все необходимые для его работы данные. Athlon же, с областью данных в L1-кеше размером 64 Кбайта, а это в 8 раз больше, чем кеш данных Pentium 4, значительно превосходит всех своих соперников.
FPU WinMark
Этот бенчмарк показывает "чистую" скорость работы арифметического сопроцессора благодаря тому что все данные, необходимые для его работы умещаются в L1 кэше процессора. Результаты еще раз подтверждают, что блок FPU у Athlon очень хороший. Кроме того, ясно видно, что из-за возросшей латентности FPU в Pentium 4, его показатели в этом тесте выглядят даже хуже, чем у Pentium III.
3DMark2000 CPUmarks
Этот бенчмарк, входящий в состав 3DMark2000 демонстрирует теоретическую скорость работы процессора по обработке типовых игровых 3D-сцен при активном использовании наборов SIMD-команд SSE и 3Dnow. К сожалению, тестов, позволяющих оценить выигрыш, получаемый от использования новых SSE2 инструкций Pentium 4 пока нет, поэтому сегодня мы довольствуемся только использованием базового набора инструкций SSE. Тем не менее, даже в этом случае Pentium 4 оказывается на высоте, обходя ближайшего конкурента, процессор AMD Athlon 1.2 ГГц на 12%. Таким образом, логично ожидать, что в играх, особенно поддерживающих SSE, Pentium 4 будет показывать достойные результаты.
Так как процессор Pentium 4 работает на совершенно отличной платформе, использующей двухканальную RDRAM, посмотрим на то, какую скорость операций с памятью может обеспечить эта система в сравнении с соответствующими результатами, полученными на остальной паре платформ:
Memory Speed - Read
Memory Speed - Write
По графикам совершенно очевидно, что действительно скорость работы L1 и L2 кэшей в Pentium 4 по сравнению с Pentium III возросла. Однако, AMD Athlon обладает гораздо большим по размеру L1 кэшем, что в ряде случаев обуславливает его превосходство. Естественно, также на графике ясно видно, что пропускная способность двухканальной RDRAM гораздо выше, чем используемой в системах на Athlon и Pentium III PC133 SDRAM. Также, результаты этого теста позволяют оценить, что L2 кеш процессора Athlon действительно работает медленнее чем L2 кеш даже Pentium III, из-за более узкой шины. И достаточно любопытным является тот факт, что влияние L1-кеша совершенно не сказывается в системе с Pentium 4 при записи в память.
Тест
ы в реальных приложениях
Content Creation Winstone 2000
Этот тест основывается на измерении скорости системы в нескольких приложениях для создания контента. Как можно видеть, производительность системы с Pentium 4 тут однозначно выше, чем скорость системы на Pentium III 1 ГГц и приближается к производительности системы с Athlon 1.2 ГГц. Получается, AMD была права не став выпускать процессоры с более высокой, чем 1.2 ГГц частотой. Athlon 1.2 ГГц может конкурировать с Pentium 4 вполне успешно.
Sysmark 2000
Еще один тест, использующий для измерения производительности офисные приложения. Однако, тут упор делается на приложения более широкого профиля, чем в предыдущем тесте, в результате чего показатели Athlon здесь выше. Однако, архитектуры Pentium III, Athlon и Pentium 4 отличаются слишком сильно, поэтому, соотношения производительностей этих процессоров может изменяться от приложения к приложению. Поэтому, посмотрим на скорости испытуемых процессоров в конкретных приложениях.
Sysmark 2000
В семи из двенадцати приложений лидирует AMD Athlon 1.2 ГГц, в то время как Pentium 4 показывает большую скорость только в трех задачах: системе распознавания речи Dragon Naturally Speaking Preferred 4.0, графическом редакторе Adobe Photoshop 5.5 и в утилите для кодирования видеопотока Microsoft Windows Media Encoder 4.0. Таким образом, вся полезность Pentium 4 раскрывается действительно только в задачах потоковой обработки данных. И то, часть заслуги за высокую производительность этого процессора лежит на подсистеме памяти с гораздо более высокой пропускной способностью, чем у конкурирующих платформ.
3D Studio MAX R3 (чем меньше – тем лучше)
Для оценки производительностей систем в этом 3D-пакете, мы засекли время рендеринга сцены Anisotropic Wheel, входящей в дистрибутив. Соответственно, меньшее время соответствует лучшему результату. Удивительно, но тут производительность Pentium 4 1.4 ГГц в точности повторяет производительность Pentium III 1 ГГц. Это говорит о том, что FPU в Pentium 4 действительно работает медленнее, чем в Pentium III. Athlon 1.2 ГГц, обладая лучшим блоком FPU легко обошел обоих конкурентов, построив сцену на 40% быстрее.
Заключение
Итак, сделать однозначный вывод относительно процессора Pentium 4 нельзя. Безусловно, его архитектура имеет массу достоинств, основным из которых следует признать возможность легкого наращивания тактовых частот. Однако, производительность процессора в ряде приложений все же не так высока как хотелось бы: достаточно часто она оказывается меньше производительности старшего процессора семейства Athlon. Виной этому – сверхдлинный 20-стадийный конвейер и недостаточно большой кеш данных первого уровня. Поэтому, в ближайшее время Pentium 4 обогнать по быстродействию конкурента от AMD, Athlon, который также имеет пути для наращивания скорости посредством перехода на новое ядро Palomino и использования DDR SDRAM, не смог.
В то же время, у систем на Pentium 4 были и более существенные недостатки, главный из которых – цена. Поскольку стоимость RDRAM, необходимой для Pentium 4, а также системных плат для него достаточно высока, Athlon-платформы обладают гораздо лучшим соотношением цена-производительность.
Тем не менее, Pentium 4 все же имелт отдаленные перспективы. С переводом технологического процесса на 0.13 мкм и с выпуском чипсетов, поддерживающих более дешевые чем RDRAM типы памяти, Pentium 4 может стать массовым процессором. Пока же его удел – высокопроизводительные рабочие станции.
Список использованных источников:
1. Компьютерный еженедельник “Компьютерра”, № 24,
2. Журнал “Страна игр”, №22,
3. Журнал “Мир ПК”, №12,
4. Журнал «Домашний ПК», 2002-2003 г.
5. www.computerra.ru
6. www.zdnet.ru
7. www.ferra.ru/online/processors