Муфты электромонтажные от производителя Fucon
РадиоЛоцман - Все об электронике

Обзор AMD Opteron - часть 4: производительность настольных приложений

Превращаем серверную плату в настольную. Предсказываем производительность Athlon 64? Тестирование.

Прошлая неделя оказалась очень интересной для IT-сообщества. Выпуск микропроцессора AMD Opteron восстановил баланс конкуренции двух микропроцессорных гигантов. И хотя наш сайт посещает большое количество IT-специалистов, многим нашим читателям малоинтересны результаты двухпроцессорного сервера Opteron в тесте баз данных.

Сообщество энтузиастов всё еще ждёт появления Athlon 64. Почему бы нам уже сегодня не создать однопроцессорную настольную конфигурацию на базе Opteron, которая смогла бы отразить производительность будущего настольного процессора?

Однако все материнские платы для Opteron на чипсете AMD не имеют слота AGP. Так что здесь приходится ждать появления чипсета nVidia nForce3 Pro, который обладает слотом AGP 8X. Если вы не читали первую часть нашего обзора, чипсет nVidia nForce3 Pro является одночиповым решением для однопроцессорной рабочей станции под Opteron и настольного ПК для энтузиастов.

Партнёром nVidia по запуску nForce3 Pro стал ASUS, но, к сожалению, официальные образцы плат nForce3 Pro для обозревателей не будут готовы ещё один месяц или два. Получается, мы уже некоторое время говорим о тестировании Opteron в роли рабочей станции, и не сможем эти станцию воссоздать?

Самым большим препятствием здесь является отсутствие слота AGP, однако, используя относительно быструю видеокарту PCI, мы всё же можем произвести сравнение Opteron с Athlon XP, чтобы получить представление о производительности, которую нам следует ожидать от пары Opteron/nForce3 и Athlon 64.

Поэтому мы посвятим сегодняшнюю статью производительности процессора Opteron в не-серверных окружениях.

Превращаем серверную плату в настольную

Как мы уже упомянули во введении, самым большим ограничением служит медленное интегрированное видеоядро на серверных материнских платах, которое не только сделает наше 3D-тестирование бессмысленным, но также будет замедлять и производительность 2D-приложений.

Мы выбрали видеокарту PCI GeForce4 MX 440.
Мы выбрали видеокарту PCI GeForce4 MX 440.

Без слота AGP у нас оставался только один выход - использовать видеокарту PCI. Мы нашли GeForce4 MX 440 в PCI-версии, поэтому все наши тестовые платформы будут оборудованы именно этой карты. Поскольку цель статьи заключается в отражении производительности процессора, запуск игровых тестов в разрешении 640x480 сможет не только уменьшить нагрузку на слабую видеосистему, но и сделает результаты меньше зависящими от процессора. Если вы помните, до выпуска GeForce4 Ti 4600 и Radeon 9700 Pro, почти все наши обзоры процессоров использовали тесты игр при разрешении 640x480.

Предсказываем производительность Athlon 64?

При чтении статьи вам следует учитывать один факт: Opteron - это не Xeon, поскольку между Opteron и Athlon 64 существует заметная разница в производительности.

Чтобы напомнить вам архитектурные изменения, приведём основные отличия Opteron.

Уже само число ножек процессоров говорит о существенных различиях между Opteron и Athlon 64. Если настольный вариант Athlon 64 имеет 754 ножки, то Opteron - 940 ножек. Для чего нужны дополнительные ножки?

Если настольная версия Athlon 64 имеет только один порт HyperTransport, то Opteron содержит три порта - два для подключения к другим процессорам, и один - для связи с мостами ввода/вывода (южный мост, мост PCI-X и т.д.)

Следующее отличие между Athlon 64 и Opteron заключается в том, что Opteron использует 144-битный интерфейс памяти DDR, в сравнении с 64-битным интерфейсом DDR контроллера памяти Athlon 64. 144-битная шина памяти более чем в два раза превышает шину одноканального контроллера памяти Athlon, но обеспечивает лишь в два раза большую пропускную способность. Дополнительные биты - это биты чётности, поскольку контроллер памяти Opteron работает только с памятью ECC.

Мы использовали модули Corsair DIMM в наших тестах.
Мы использовали модули Corsair DIMM в наших тестах.

Хотя Athlon 64 и Opteron используют 128 кбайт кэш L1 (64 кбайт кэш инструкций, 64 кбайт кэш данных), Athlon 64 будет выпускаться как с большим, так и с маленьким кэшем L2 (1 Мбайт и 256 кбайт соответственно), в то время как размер кэша у Opteron не опустится ниже 1 Мбайт.

Подведём итог. Основное отличие между процессорами заключается в том, что в случае с Athlon 64 вы можете использовать лишь половину пропускной способности памяти Opteron. Поэтому в приложениях, интенсивно работающих с памятью, следует ожидать от Athlon 64 пониженной производительности при данной тактовой частоте, чем в случае с Opteron.

Также следует учитывать, что протестированные нами материнские платы не нацелены на выжимание максимальной производительности, поскольку основное их предназначение - надёжная работа круглые сутки. Общая производительность на материнских платах для рынка энтузиастов (nForce3 Pro) должна быть выше, равно как и у материнских плат на чипсетах для Athlon 64.

Тестирование

Мы решили уменьшить количество соперников до минимума, поскольку данный обзор является лишь предварительным взглядом на производительность однопроцессорных рабочих станций на базе Opteron или систем Athlon 64. Более подробное тестирование будет проведено, как только мы получим соответствующие материнские платы и чипсеты. Пока что мы выполним следующие сравнения:
  • Сравнение Opteron и Athlon XP при одинаковой тактовой частоте,
  • Сравнение Opteron и самой быстрой настольной системы на базе Pentium 4,
  • Сравнение Opteron и самой быстрой настольной системы на базе Athlon XP.
Первый пункт является самым важным. Мы можем сравнить Opteron 244 (1,80 ГГц) и Athlon XP 2200+ (1,80 ГГц), что позволит нам получить представление о тех преимуществах, которые нам даёт улучшенная архитектура ядра и встроенный на кристалл контроллер памяти. Но как же мы отличим улучшения, связанные с архитектурой, от прироста производительности по причине увеличения размера кэша L2?

Чтобы определить прирост производительности приложений от перехода к большему кэшу L2, мы решили включить в тестирование гипотетический процессор Barton 1,80 ГГц. Из нашего обзора Athlon XP 3000+ вы должны помнить, что ядро Barton попросту добавляет ещё 256 кбайт к кэшу L2 Athlon XP, что позволяет определить зависимость тестов от размера кэша Athlon.

Перейдём к тестовой конфигурации:

Тестовая система на базе Windows XP Professional
Аппаратная конфигурация
Процессор
AMD Athlon XP 3000+ (2,167 ГГц) Barton
AMD Athlon XP 2200+ (1,80 ГГц) Barton - 3000+ с пониженной частотой
AMD Athlon XP 2200+ (1,80 ГГц)
AMD Opteron 244 (1,80 ГГц) только один процессор
Intel Pentium 4 3,0C ГГц - поддержка HyperThreading включена
Материнская плата
ASUS A7N8X - NVIDIA чипсет nForce2 (зелёные полоск)
Intel D875PBZ - чипсет Intel 875P (синие полоски)
Rioworks HDAMA - чипсет AMD 8000 (красные полоски)
Память
2 x 256 Мбайт DDR400 CAS2 Corsair XMS3200 модули DIMM
2 x 256 Мбайт регистровые ECC DDR333 Corsair модули DIMM
Звук
None
Жёсткий диск
120 Гбайт Western Digital специальное издание с кэшем L2 8 Мбайт ATA/100
Видеокарта
NVIDIA GeForce4 MX 440 SE PCI


Если вам нужны результаты синтетических тестов, которые отображают влияние кэшей L1/L2 и интегрированного контроллера памяти Opteron на производительность, обратитесь к первой части нашего обзора Opteron, где рассмотрена архитектура процессора и приведены несколько результатов низкоуровневых тестов в данных областях.

Производительность создания контента и общих пользовательских приложений




Мы наблюдаем менее чем двухпроцентную разницу между ядрами Barton и Thoroughbred 1,80 ГГц Athlon XP, то есть данный тести не слишком зависит от увеличения размера кэша Opteron. Следует отметить, что прирост производительности в 27% над Athlon XP довольно солиден, что позволяет Opteron 244 работать быстрее даже Athlon XP 3000+.

К сожалению, AMD придётся выпустить что-то более весомое, чем 1,80 ГГц Athlon 64, чтобы сместить с трона Pentium 4. 3,0C показывает отрыв 22% в производительности по сравнению с Opteron 244.



В бизнес-приложениях ситуация драматически меняется. Для начала, отметим значительное увеличение влияния размера кэша на производительность, что видно по результатам Barton и Thoroughbred. Pentium 4 не слишком хорош в этом тесте, как и в большинстве бизнес-приложений (да и в целочисленном коде в целом), поскольку код подобных приложений содержит множество ветвлений, таким образом сброс короткого конвейера процессора при неправильном предсказании происходит быстрее.

1,80 ГГц Opteron 244 смог обойти равного по тактовой частоте Athlon XP на весомые 21%, лишь немного обогнав Athlon XP 3000+.

Игровая производительность - Unreal Tournament 2003

Поскольку мы использовали медленный графический процессор, мы решили не устанавливать максимальную детализацию. Мы оставили право игре UT самой выбирать оптимальные установки для GeForce4 MX 440.



Результаты игровой производительности довольно интересны. Если все три Athlon XP работают практически идентично друг другу, Opteron смог дистанцировать себя от остальных процессоров. По результатам Athlon XP можно подумать об ограничении теста графической подсистемой, однако лидерство в 12% у Opteron заставляет принимать во внимание производительность платформы в целом.



Тест botmatch намного больше привязан к процессору, поэтому мы наблюдаем увеличение разброса результатов. Opteron продолжает нести свою корону, демонстрируя увеличение производительности в 25% над Athlon XP с равной тактовой частотой. Наверное, подобные результаты можно отнести на счёт встроенного на кристалл контроллера памяти, равно как и улучшенного блока предсказания ветвлений Opteron.



Похоже, что игры на движке Quake III получают неплохой прирост производительности от сниженных задержек памяти Opteron.



Лидерство продолжается и в Jedi Knight II. Поначалу мы думали, что с результатами Athlon XP что-то не так, но повторная переустановка, смена материнской платы и переконфигурация системы ничего не дали. При оснащении системы PCI GeForce4 MX 440 при таком низком разрешении у платформы на Athlon XP по каким-то странным причинам возникают "узкие места".



Если результаты этих тестов можно принимать как отражение производительности Athlon 64, то осенью нам следует ожидать появление прекрасного игрового процессора.

Производительность кодирования видео - DiVX/XMpeg 4.5

Если раньше подобные задачи были уделом только "профессионалов", сегодня кодированием видео занимаются многие домашние пользователи. Причём требования приложений по кодированию являются одними из самых высоких среди программ на ПК.

Мы начали тестирование с "быстрого" преобразования фрагмента DVD (если быть более точным, главы 40 первого эпизода "Звёздных войн") в файл DiVX MPEG-4. Мы использовали последний кодек DiVX (5.03) совместно с Xmpeg 4.5 для кодирования на разрешении 720x480.

Скорость кодирования была установлена в Fastest, обработка звука выключена, а все остальные настройки были выставлены по умолчанию. Мы записывали последнюю частоту кадров, когда индикатор процесса кодирования достигал 100%.



Кодирование видео всегда было сильной стороной архитектуры Pentium 4. Несмотря на улучшения в Opteron, фундаментально архитектура осталось очень похожей на K7. Хотя мы и наблюдаем улучшение производительности кодирования DivX, Pentium 4 с технологией HyperTreading остаётся недосягаемым.

Производительность кодирования видео - Windows Media Encoder 9.0

Для нашего теста кодирования видео мы взяли Windows Media Encoder 9.0 и закодировали ту же самую главу DVD первого эпизода "Звёздных войн" в поток 2 Мбит/с DVD VBR. Время указано в минутах, меньшее время естественно лучше:



Ситуация становится немного более позитивной для AMD в нашем тесте Windows Media Encoder 9. Но Pentium 4 всё ещё недосягаем.

Производительность 3D-рендеринга - 3dsmax R5

Для наших тестов 3ds max 5 мы выбрали все тестовые сцены, которые поставлялись с программой: SinglePipe2.max, Underwater_Environment_Finished.max, 3dsmax5_rays.max, cballs2.max и vol_light2.max.





Улучшение производительности Opteron по сравнению с Athlon XP меняется в разных сценах от практически нулевого до заметного.

Производительность 3D-рендеринга - Lightwave 3D 7.5

Если 3dsmax 5 и оптимизирован под SSE2, его уровень оптимизации и близко не находится к тому количеству работы, которая была проделана NewTek во время выпуска Lightwave 7.0b. Улучшения производительности новой оптимизированной под SSE2 версии достигли более 20% в тестовых сценах NewTek.

Мы выбрали три теста, два из которых менее оптимизированы под SSE2, а третий - оптимизирован в больше степени.



В оптимизированных под SSE2 тестовых сценах Lightware, ядро Opteron SSE2 смогло выдать производительность, опасно близкую к Pentium 4.



Здесь мы наблюдаем ситуацию, когда Athlon XP обгоняет Opteron, хотя различие невелико и его можно отнести к погрешности измерения и отсутствию оптимизированных под производительность материнских плат.


И вновь мы наблюдаем, что в окружении SSE2 движок Opteron SSE2 вовсе не такой и плохой.

Заключение

В качестве итога приведём диаграмму улучшения производительности Opteron по сравнению с Athlon XP на равной частоте.



Учитывая, что большинство наших тестов не было особо чувствительно к увеличению размера кэша и к росту пропускной способности памяти, по результатам мы можем предположить очень большой потенциал будущего настольного процессора Athlon 64. Если AMD сможет выпустить Athlon 64 даже на частоте 2 ГГц, он будет вполне конкурентоспособен с Pentium 4 3,0C. Нам придётся несколько подождать, прежде чем мы узнаем, сможет ли AMD сохранить свою конкурентоспособность с Prescott, который выйдет чуть позже в этом году.

Судя по результатам, мы вправе ожидать высокой производительности от пары Opteron и nForce3 Pro. Для игроманов-"беспредельщиков" с безразмерным кошельком подобная система наверняка будет интересной, хотя мы прибережём окончательные выводы до появления в наших руках игровой платформы с производительной картой AGP.

В заключение следует отметить достойную производительность Opteron SSE2, поскольку AMD наконец-то смогла повысить свой вес в тех областях, которыми прежде монопольно правила Intel. Конечно, до сих пор существуют сферы, типа кодирования видео, где архитектура Pentium 4 продолжает доминировать. Следует помнить, что ядро Opteron во многом близко к K7, и никакие улучшения в задержках памяти и увеличение размера кэша не приведут к смене ситуаций с приложениями, которые попросту быстрее работают на архитектуре Intel NetBurst.

Anandtech

Электронные компоненты. Бесплатная доставка по России
Для комментирования материалов с сайта и получения полного доступа к нашему форуму Вам необходимо зарегистрироваться.
Имя