Главная arrow Процессоры arrow GeForce 460GTX и необходимость SSE. Глобальное исследование процессорозависимости. Часть 2.  
23.02.2012 г.
GeForce 460GTX и необходимость SSE. Глобальное исследование процессорозависимости. Часть 2.
Автор max1024   
09.11.2010 г.
После написания первой части статьи о работе GeForce 460GTX на платформе Pentium-I стало очевидным, что причина невозможности запуска разнообразного софта заключается в отсутствии поддержки у процессоров AMD K6 и Intel Pentium MMX набора команд SSE. Чтобы развеять все споры на этот счет я решился на 2-й этап своего тестирования. Для моих экспериментов мне дали на время Pentium-III платформу в виде:
CPU – Intel Pentium-III Celeron 1.2Ghz (ядро Tualatin)
MB – Acorp 694TA (VIA Apollo Pro133T)
RAM – 2 по 256Mb SDRAM PC133
EVGA GeForce 460GTX 1Gb c переходным мостом
HDD – Seagate Barracuda IV 40Gb
Блок питания – FSP ATX-450 450W

Для разнообразия эксперимента я решил добавить к сравнению флагмана 2001-го года GeForce 3 Ti500 производства Leadtek. Частоты 240/500Mhz, 64 Mb видеопамяти, поддержка шейдеров v 1.1, Карта работала в режиме AGP 2х что дает в теории 533MB/s пропускной способности интерфейса. Посмотрим что победит 4-х кратное преимущество пропускной способности интерфейса AGP над PCI или технологичность архитектур GPU. Справочно: количество транзисторов GTX460 в 32 раза больше чем у GeForce3.
Еще не был разрешен в первой части статьи вопрос с использованием ускорением CUDA. Написанный Mathematic'om бенчмарк Cuda Factorial Benchmark v.4.0.1 на платформе Pentium-I у меня не пошел, не ясно как обстоят дела с ускорением HD video с использованием CUDA.
Так же для первой части у меня были подготовлены игры, которые не пошли, очевидно по техническим причинам, посмотрим что даст наличие SSE - DOOM3, Richard Burns Rally, Stalker:COP. Итак начнем.

   
GeForce 460GTX Vs GeForce 3 Ti500 (так и хочется добавить Fight!!! )
Чтобы посмотреть как сдерживает PCI интерфейс GeForce 460GTX и что дает его 4-х кратное преимущество GeForce 3 Ti500 запустим 3Dmark2001SE.

   


   


   Awesome GeForce Ti 500! Я думаю победа GeForce Ti 500 в этом тесте именно из-за более скоростного AGP порта, но все-таки шейдерная архитектура GeForce 460GTX дает о себе знать в 4-м тесте Nature, где преимущество GeForce 460GTX над GeForce Ti 500 практически равно двум, по количеству кадров в секунду, но победы это 460-му это не принесло.

   Посмотрим какая будет расстановка сил в 2003-м 3Dmarke.

   


   


   Шейдеры, шейдеры, шейдеры вот из-за них Ti 500 и проиграл GTX460-му, хотя по количеству fps в первом тесте он одержал победу, но отсутствие поддержки шейдерной модели 2.0 и колоссальная мощь FERMI сделали свое дело. Что же, дальше GeForce 460GTX будет выступать в гордом одиночестве.

   


   



   Что же в 2005-м мой тандем выступает чуть быстрее, чем Pentium 4 1.8Ghz в паре с GeForce GeForce 6600 LE, а в 2006-м как Pentium 4 3.0GHz с GeForce 6600 GT.

   Посмотрим на результаты в Unigene Heaven Benchmark v.1.0
Запуск производился с минимальными настройками в разрешении 640*480 и с максимальными в 1280*1024.

   


   


   Кто у нас самое слабое звено? CPU или PCI интерфейс? Мне кажется что последний.

   От синтетики перейдем к играм.
Интересно можно ли поиграть в Stalrer Call of Prypiat? Настройки и результат видны ниже.

   


   Игрушке сразу не хватает всего, и мощного cpu, и скоростного обмена данными между CPU и GPU, единственное что радует, так это максимальный fps, а ведь его и могло не быть

   
DOOM3 и Richard Burns Rally, средний fps. Первый может использовать шейдеры 3.0, вторая 1.1

   


   Ну наконец-то хоть во что-то можно будет поиграть хотя fps на пределе играбельности, и когда в кадре куча монстров то «средний» fps падает до минимального, но играть все же можно.

   Практическая польза от CUDA.
В обсуждении первой части статьи было масса высказываний о бесполезности данной конфигурации. Отчасти я соглашусь, а отчасти нет. Просили меня проиграть какое-нибудь FullHD видео. Пожалуйста.
Итак тестовое видео это Трансформаторы: Месть падших, FullHD rip 1080p, кодек AVC, размер рипа 13.8Gb, поток 13.2 Mb/s. Рип воспроизводился последней версией KMplayer, в котором было включено аппаратное ускорение. Так получилось, что данный рип к тому же воспроизводился по локальной сети, что также повлияло на загрузку cpu.

   


   Очень хороший результат, загрузка cpu не превысила и 65%. Я так же пробовал воспроизводить FullHD remux весом более 20Gb, в нем загрузка cpu была даже чуть меньше, что и понятно.

   Теперь посчитаем факториал с помощью Cuda Factorial Benchmark v.4.0.1

   


   Превосходство GPU над CPU более чем в 32 раза! Вот она реальна польза
Весь софт, что задействует CUDA при расчетах, может давать результат, а если учесть, что на большинстве устаревших материнских плат по 5 слотов PCI то перспектива, хоть и туманная надеюсь что есть

   Выводы.
Из 2-х частей моего тестирования видно, что процессорозависимость ярко выражена, ну это и младенцу понятно при таком раскладе, мощнее cpu - выше результат, возможно пропускная способность PCI интерфейса еще сильнее влияет на производительность при более сильном cpu, что же проверить это можно, только установив GeForce 460GTX в AGP порт.
Продолжение следует …
 
След. »
Поиск
Google
Thanks for the best phone cards in USA! Low rates, great connectivity and wide selections of phone cards.