Amd radeon hd 6900 series характеристики


Видеокарты AMD Radeon серии HD 6900 (AMD Cayman) | Страница 2

На момент публикации, видеокарты AMD Radeon HD 6970 смогут конкурировать с недавно представленной GeForce GTX 570. Radeon HD 6950 займет свою нишу, где им будут противостоять видеокарты GeForce GTX 560, анонс которых намечен на январь:

После замещения Radeon HD 5800 двумя новыми линейками, видеокарты AMD выстроились в настолько плотный ряд, что производительность AMD Radeon HD 6950 находится уже в пограничной зоне с Radeon HD 6870.

Еще один открытый вопрос — а как же почетная корона лидера отрасли? Ответ очевиден — все в порядке, она по прежнему у AMD в лице детища 2-процессорной ATI Radeon HD 5970. К тому же в первом квартале следующего года обновление ждет и флагмана — на смену придет более производительная AMD Radeon HD 6990.

Остается разобраться с ценами и характеристиками свежих предложений:

GeForce GTX 460 768MBRadeon HD 6850GeForce GTX 460 1GBRadeon HD 6870Radeon HD 6950GeForce GTX 570Radeon HD 6970GeForce GTX 580GPUТехпроцессПлощадь ядраКол-во транзисторов, млрд.шт.Shader UnitsShader Processor CounterTMUROPsЧастота GPUОбъем / тип памятиРазрядность интерфейса памятиЧастота памятиРекоменд. стоимость
GF104RV940Pro (Barts Pro)GF104RV940XT (Barts XT)RV970Pro (Cayman Pro)GF110RV970XT (Cayman XT)GF110
40 нм40 нм40 нм40 нм40 нм40 нм40 нм40 нм
332mm2255мм2332mm2255мм2389мм2520мм2389мм2520мм2
1,951,701,951,702,643,002,643,00
336960336112014084801536512
336192336224352480384512
5648565688609664
2432323232403248
675 МГц775 МГц675 МГц900 МГц800 МГц732 МГц880 МГц772 МГц
768 МБ GDDR51024 МБ GDDR51024 МБ GDDR51024 МБ GDDR5 2048 МБ GDDR51280 Мб GDDR52048 МБ GDDR51536 Мб GDDR5
192 бит256 бит256 бит256 бит256 бит320-бит256 бит384 бит
900 МГц1000 МГц900 МГц1050 МГц1250 МГц950 МГц1375 МГц1002 МГц
$160$180$200$240$299$349$369$499

ru.hw-lab.com

AMD Radeon HD 6900

Главная — Обзоры — Видеокарты — Обзор AMD Radeon HD 6900

Конкуренция – один из важных двигателей прогресса, особенно когда речь идет о мировом рынке, а реальных конкурентов у каждого из производителей – только один. Особенное место занимает соревнование производителей на более богатых покупателей, которые могут больше заплатить. Плавно переходим к тебе видеокарт, ведь именно о них только что упоминалось, а именно о Radeon и NVIDIA. Недавно у нас была возможность поближе увидеть NVIDIA GeForce GTX 580/570, но теперь стоит оценить, что же в таком случае предлагает нам AMD и как правильно выбрать видеокарту?

Чтобы заинтересовать платжеспособных покупателей, любому бренду нужно время от времени создавать что-то новое, чтобы оставаться в центре внимания. И речь идет не только о количественном производстве, а и качественном. Сколько бы компания не наращивала производительность своих продуктов, нужно делать радикальные, существенные изменения в технологиях. Этот вопрос некоторое время мучил AMD, поскольку особенно новых решений у них не было. Но компания сумела выйти их ситуации - Radeon HD 6900 на чипах Cayman имели очень много отличий от предыдущих версий.

Архитектура новых устройств отличается в первую очередь структурой VLIW4, а раньше использовалась VLIW5, если вы ощущаете разницу. Если не ощущаете, или вообще не понимаете, что это за VLIW4 такое, расскажем детально. Несколько ранних поколений состоят из процессоров, каждый из которых делится на 5 исполнительных блоков – 4 одинаковых (для математических действий с дробными числами), и 1 отличающийся (способный исполнять разные хитрые тригонометрические и не только тригонометрические функции). Особенности данной структуры – для правильного выполнения кода, его перед тем нужно хорошо наладить и правильно организовать, иначе эти блоки ничего делать с кодом не будут. Поэтому AMD приняли решение переработать структуру и удалить ненужные блоки, но зато увеличить количество процессоров, таким образом и была выбрала структура VLIW4. Она более эффективна а дает возможность установить больше процессоров на одной и той же площади

Геометрический прогресс

Одним из недостатком давних и не очень давних GPU AMD была невысокая производительность во время обработки геометрии, а именно намного меньшая скорость работы при тесселяции, чем у ускорителей NVIDIA. Чтобы эту проблему как-то одолеть, AMD предприняли решение усилить Cayman, и ввели второе устройство, чтобы распределить процессы обработки графики на два потока, а не в один, как было раньше. В дополнение к этому, тесселятор 8-го поколения и так в 2-3 раза производительнее, чем его предыдущие варианты. Благодаря эти двум нововведениям, AMD удалось достичь ускорения процесса обработки геометрии на 30-70%, что является довольно существенным результатом. Диапазон от 30 до 70 настолько широкий потому, что разной может быть загрузка тесселяторов, в зависимости от изображения.

Кроме перечисленного, AMD ввели в свои чипы Cayman поддержку сравнительно нового алгоритма, предназначенного для сглаживания изображений. Имеет этот алгоритм название EQAA, а для качественного сглаживания он использует не полноцветные шаблоны цветности, а данные о примитивах. Cayman поддерживает также и другую эффективную технологию - Morphological Anti-Aliasing, которая проводит сглаживание путем нахождения контрастных зон с помощью фильтров, эта функция есть в Radeon HD 6800.

PowerTune

И NVIDIA, и AMD в последнее время бурной поддержки экологии заинтересованы в как можно меньшем потреблении энергоресурсов их устройствами. На практике потребление электричества обычно бывает намного выше, чем указано в характеристиках видеокарт.Отвлечемся на NVIDIA – их GeForce GTX 570/580 имеет специальный блок наблюдения за количеством тока, который проходит через адаптеры, так вот если этот блок замечает повышенное потребление энергии, он снижает рабочие частоты в 2 раза. AMD решила пойти еще дальше, использовав для этого технологию под названием PowerTune. В этом случае также используется блок, который встроен в GPU и постоянно следит за потреблением энергии, а если потребление будет слишком высокое, то в этот же момент частоты будут также снижены, но всего на 10%, а не в 2 раза. Мы получаем своеобразный аналог Intel Turbo Boost, только с противоположным направлением работы. Параметры TDP, которые указываются в характеристиках устройств, можно считать не максимально возможными, а максимально разрешенными.

PowerTune может настраивать пользователь по своему желанию, совершается эта настройка на панели Overdrive в специальной программе под названием Catalyst Control Center. Значение можно менять от -20% до +20%, стандартное значение, как уже упоминалось, 10%.

Видеокарты

Линейка Cayman располагает двумя моделями - Radeon HD 6970 и Radeon HD 6950, одна из которых в некоторой мере бюджетная, а другая немного высшего класса. По своей цене более дорогая из них находится между NVIDIA GeForce GTX 580 и NVIDIA GeForce GTX 570, а более дешевая – между той же 570-й GeForce сверху, а также братской Radeon HD 6870 и конкурирующей GeForce GTX 470 снизу. Самым «модным» устройством от AMD по прежнему можно считать Radeon HD 5970.Обе этих модели имеют общие элементы – они используют одинаковый вид печатной платы, а также системы охлаждения. Длина этих плат равна 10,5 дюймов, поэтому корпус для них нужен широкий, просторный. Пластиковый кожух закрывает практически всю поверхность рассматриваемой видеокарты. Радиатор для охлаждения в свою очередь накрывает GPU и все чипы памяти, ему помогает центробежный вентилятор – он выносит весь накопившийся горячий воздух наружу. Производительности системы охлаждения вполне хватает для этой видеокарты, температура GPU поднимается не выше 88-90 градусов по Цельсию, если воздух ниже этих температур, то работы вентилятора вы практически не услышите. Особенно это касается Radeon HD 6950 – тишина…

Около разъемов, которые служат для переключения мостиков CF, можно найти переключатель, который имеет два положения, что является нестандартным случаев. Просто Radeon HD 6900 имеет два чипа БИОС, один из них можно перепрошить при желании пользователя, а другой – нет, он зарезервирован видеокартой и в случае проблем позволит использовать начальные, не испорченные пользователем настройки.

Результаты тестов

Главным образом стоит проанализировать результаты тестирования Unigine Heaven: в ходе этого тестирования нагрузка дается на тесселяторы, притом довольно большая. Новые Radeon могут поконкурировать с NVIDIA, поскольку в этом виде тестирования Radeon HD 6970 показывает практически одинаковые с GeForce GTX 570 результаты. Новая модель Radeon HD 6950 показывает результаты более чем на 35% лучше, чем Radeon HD 5870.Тесты «на игры» показывают, что практически всегда AMD Radeon HD 6970 более медленный, чем конкурирующее с ним устройства, иногда это заметное невооруженным глазом. Наверное, при выходе новых версий Catalyst в списке «Что изменилось» мы прочитаем слова о намного высшей производительности во время игр

Если говорить о Radeon HD 6950, эта модель довольно-таки помогает компании AMD держаться на плаву. При цене и качестве этой модели, конкурентов у нее пока быть не может, а уровень производительности подходит для игры в большинство современных шутеров, квестов и стратегий.

Выводы

Появление новых видеокарт AMD, несомненно является важным этапом в развитии как самой компании, так и индустрии в целом. Имеет место не только количественный, но и качественный прогресс от переработанной структуры процессоров. AMD, благодаря определенным усилиям, удалось получить более мощные устройства на основе старых, менее производительных. Ярой и непредсказуемой конкуренции с NVIDIA, правда, не было, но AMD всегда может сделать еще один интересный маркетинговый ход – снизить цены.

Ваши вопросы и комментарии

www.compline-ufa.ru

AMD Radeon HD 6900: конкуренция обостряется

Ежегодное обновление графических архитектур AMD и NVIDIA в 2010 г. оказалось не совсем таким, как всегда: вместо радикального обновления видеокарт и привычного уже большого роста производительности обе компании решили уделить внимание уже существующим GPU, оптимизировав и доработав их с целью устранения основных недостатков и удешевления конечных видеокарт. В частности, о представленных ранее AMD Radeon HD 6800 сложно сказать, что они задают новую планку производительности – они скорее приносят достигнутые прошлым поколением возможности в сегмент middle-end, являющийся наиболее массовым.

Тем не менее, интерес к продуктам высшего класса для энтузиастов продолжает сохраняться, и тут обоим вендорам пришлось серьезно постараться, чтобы удовлетворить эту требовательную категорию потребителей. Мы уже рассматривали NVIDIA GeForce GTX 580 и GTX 570 – новую инкарнацию топовых видеокарт компании на доработанной архитектуре Fermi, а теперь наконец пришло время для ответного хода AMD – акселераторов Radeon HD 6900 на базе чипов Cayman.

В свете незначительного усовершенствования ядер Barts (Radeon HD 6800) по сравнению с Cypress (Radeon HD 5800), вопрос о том, как же AMD планирует нарастить производительность будущих топовых GPU, стоял очень остро: особенных предпосылок к радикальному изменению архитектуры не наблюдалось. Однако компании все же удалось нас удивить: Cayman очень значительно отличаются от своих предшественников.

Новшества в AMD Cayman: от VLIW5 к VLIW4

Новые графические процессоры AMD переведены с архитектуры VLIW5 (Very Large Instruction Word) на VLIW4. Разъясним: уже несколько поколений GPU этого вендора строятся из процессоров (SIMD Engines), которые делятся на пять исполнительных блоков: четыре одинаковых ALU, осуществляющих вычисления с плавающей точкой с 32-битной точностью, и один дополнительный более «умный» T-блок, способный также исполнять трасцендентные инструкции (математические функции тангенса, арктангенса, косинуса, возведения в степень и вычитания и т.п.). У NVIDIA в архитектуре Fermi есть аналогичные устройства, называемые Special Function Unit. Нюанс такого решения состоит в том, что для оптимального исполнения кода этими блоками необходимо тщательно его отлаживать и специальным образом организовывать, иначе они просто будут простаивать, а исполнение будет полностью осуществляться обычными ALU. Принцип параллелизации исполнения кода в архитектурах AMD базируется на инструкциях (Instruction Level Parellelism): пять ALU в пределах одного SIMD-процессора могут одновременно исполнять пять одинаковых инструкций, что в рамках одного потока встречается не так уж часто.

SIMD-процессор с архитектурой VLIW4
Схема GPU Cayman
Оптимизированные механизмы работы с памятью

По данным AMD, в подавляющем большинстве случаев ALU действительно простаивали (средняя загруженность – 3,4 из 5), потому было принято решение избавиться от мало востребованных T-блоков, взамен нарастив число процессоров в целом. Таким образом, теперь GPU строится из SIMD-процессоров, которые состоят из четырех одинаковых обычных ALU, а в случае, если все же возникает необходимость исполнить сложную инструкцию, три из них виртуально объединяются и делают это за один такт. Освободившееся место разработчики просто использовали для наращивания количества процессоров: вместо 20 в Cypress их теперь 24.

У этого подхода есть и достоинства, и недостатки. Основной «плюс» перехода на VLIW4 – более эффективное управление загрузкой GPU: традиционный рендеринг отлично распараллеливается, и большее число одинаковых исполнительных блоков будут выгодней, нежели наличие иногда задействуемых «умных». Недостаток же состоит в том, что оптимизированные для использования расширенных ALU шейдеры, встречающиеся в некоторых играх, могут на Cayman исполняться медленнее, чем на Cypress. К тому же для целей GPGPU – еще одной ключевой сферы, на которую обращено пристальное внимание и AMD, и NVIDIA, – возможность быстрого исполнения сложных инструкций довольно важна. Однако для графического подразделения AMD игровые видеокарты – основной приоритет, потому было принято именно такое решение. К тому же вышеописанная возможность исполнения нескольких потоков одновременно и большее число SIMD-процессоров вполне могут сделать Cayman более выигрышным GPU для нужд GPGPU, нежели Cypress и Barts.

Возвращаясь к изменениям в GPU, отметим также, что в его составе появился усовершенствованный диспетчер потоков, способный теперь обслуживать несколько исполняемых «ядер» одновременно. У NVIDIA Fermi также есть такая возможность, однако есть и ограничения: хоть GPU и способен проводить вычисления нескольких ядер одновременно, все они должны генерироваться одним и тем же приложением в рамках одного и того же контекста (состояния) GPU. Если же на обработку запускаются два ядра от разных приложений (к примеру, GPGPU-рендеринг видео одновременно с Direct3D), видеокарте приходится постоянно переключаться между контекстами, уделяя внимание то одному ядру, то другому (а не одновременно), а это влечет огромные потери производительности. В AMD Cayman применен другой подход: драйвер осуществляет виртуализацию GPU для каждого исполняемого ядра, таким образом никакое из приложений, задействующих его, просто не знает о существовании других, работая будто бы с собственным процессором и собственной виртуальной памятью. Трансляцией очереди команд графическому процессору занимается драйвер, а расположенный в GPU асинхронный диспетчер потоков обрабатывает и реорганизует очередь инструкций таким образом, чтобы потери от исполнения разнородных потоков были минимальными. Единственное «но»: аппаратно-то в GPU такие возможности есть, но пока нет программного API с поддержкой этого нововведения (DirectCompute в нынешней ревизии ее не содержит, и AMD возлагает все надежды на OpenCL).

Также из усовершенствований вычислительной части GPU отметим оптимизации интерфейсов памяти: каждый SIMD-процессор содержит 8 КБ эксклюзивного кэша L1 и 32 КБ локального буфера, ядро оснащено четырьмя массивами кэша L2 по 128 КБ и 64-килобайтовым глобальным буфером. Выборка и запись данных из локального в глобальный буфер может осуществляться «на лету», не выходя из GPU в память видеокарты. Введение второго DMA-блока в контроллере памяти также ускоряет обмен данными с ней.

Значительно доработаны растеризаторы: теперь обработка 16-битных данных происходит вдвое быстрее, 32-битных – в 2-4 раза, в зависимости от типа данных.

Вдвое больше геометрии

Одним из слабых мест прошлых поколений GPU AMD была низкая производительность при обработке геометрии, в частности, радикально меньшее быстродействие при тесселяции, нежели у NVIDIA Fermi. AMD усиливает Cayman введением второго устройства Graphics Engine: теперь сборка вершин и геометрии, тесселяция и растеризация осуществляются в два потока. К тому же тесселятор 8-го поколения сам по себе работает в 2-3 раза быстрее, чем прошлая его инкарнация в Cypress. Итоговый чистый прирост производительности от увеличения скорости обработки геометрии составляет 30-70%, в зависимости от того, насколько сильно обрабатываемая сцена загружает тесселяторы.

Принцип работы EQAA

В Cayman AMD вводит поддержку нового для себя алгоритма сглаживания изображения: Enhanced Quality Anti-Aliasing (EQAA). Под этим названием скрывается не что иное как знакомый нам еще со времен NVIDIA G80 Coverage Sample Anti-Aliasing – алгоритм, использующий для повышения качества сглаживания не полноценные семплы цветности и глубины, а информацию о примитивах. Если пиксель находится на границе двух примитивов (перекрывается ими) – для него цвет усредняется не только по полноценным семплам RGB+Z, но и по выбранным дополнительно только цветовым. В идеальном случае качество сглаживания должно быть равно достигаемому при мультисемплинге более высокой ступени (4xEQAA = 8xMSAA) при очень незначительном снижении производительности, т.к. памяти на эти дополнительные семплы тратится намного меньше. Кроме того, Cayman поддерживают и Morphological Anti-Aliasing – простую технику сглаживания посредством выявления контрастных зон с помощью пост-процессингового фильтра, представленную с Radeon HD 6800.

PowerTune

Как и NVIDIA, AMD серьезно озаботилась проблемой энергопотребления своих видеокарт при высокой нагрузке, когда устройства зачастую значительно превышают заявленный для них TDP. Напомним, что в NVIDIA GeForce GTX 570/580 введены блоки мониторинга потребляемого видеокартами тока, которые при обнаружении повышенной нагрузки и выявлении драйвером запущенных приложений для стресс-тестирования (FurMark, OCCT) снижают частоты вдвое. AMD пошла дальше конкурента, внедрив технологию PowerTune. Встроенные в GPU блоки постоянно оценивают уровень потребляемой им энергии, и в случае превышения TDP драйвер «на лету» немного снижает тактовые частоты (не вдвое, как на GeForce GTX 580/570, а примерно на 10%). Фактически перед нами полный аналог Intel Turbo Boost, только работающий диаметрально противоположно. Соответственно, и параметр TDP, заявляемый AMD, стоит скорее считать не абсолютно максимальным, а максимально разрешенным. Решение это абсолютно логично: вместо того, чтобы устанавливать тактовые частоты видеокарт заведомо ниже потенциально достижимых данным GPU с целью гарантированного сбережения ее от перегрева и повреждения в случае максимально возможной нагрузки, AMD теперь может задать более высокую исходную частоту, т.к. все равно чаще всего GPU не загружен полностью и не потребляет максимальный ток. Если же вдруг такое все-таки случается – драйвер просто подстраивает частоту, удерживая видеокарту в рамках TDP.

PowerTune можно настраивать в панели Overdrive утилиты Catalyst Control Center, доступны значения от -20% до +20%. Как несложно понять, таким образом регулируется порог срабатывания алгоритма. Отметим, что в штатном режиме PowerTune срабатывает крайне редко и влияет на производительность в большинстве приложений очень слабо – в пределах 1-2 кадров/с. Полностью отключить эту систему нельзя, однако, очевидно, сторонние производители видеокарт смогут модифицировать порог ее активации для своих предразогнанных моделей, а вот как быть сторонникам экстремального разгона – пока неясно.

Знакомство с AMD Radeon HD 6900

Итак, рассмотрим представленные AMD видеокарты. В семейство Cayman входят две модели – Radeon HD 6970 и Radeon HD 6950. Позиционируются они довольно интересно: топовая модификация располагается между NVIDIA GeForce GTX 580 и GTX 570, а младшая занимает собственную нишу между GeForce GTX 570 (сверху) и парой Radeon HD 6870 и GeForce GTX 470 (внизу). Рекомендованные цены установлены на уровне $369 и $299, соответственно. Топовой же моделью в линейке AMD продолжает оставаться Radeon HD 5970, появления его наследника HD 6990 на базе двух GPU Cayman стоит ожидать только в I квартале 2011 г.

Графический процессор Cayman XT в AMD Radeon HD 6970 содержит 1536 активных ALU, сгрупированных в 24 SIMD-массива по 16 SIMD-процессоров, 96 текстурных блоков и 32 растеризатора. Тактовая частота составляет 880 МГц. Видеокарта оснащается 2 ГБ памяти GDDR5 с тактовой частотой 1375 МГц (5500 МГц QDR), обращение к которой осуществляется по шине шириной 256 бит. Уровень TDP этого одночипового флагмана составляет 250 Вт – на 62 Вт выше, чем у Radeon HD 5870, и на 100 Вт выше заявленного для Radeon HD 6870.

Младшая модификация оснащается GPU Cayman Pro, в котором активны 22 SIMD-массива, что составляет 1408 ALU и 88 текстурных блоков, количество растеризаторов осталось прежним – 32. Процессор работает на частоте 800 МГц, 2 ГБ памяти GDDR5 – на 1250 МГц (5000 МГц QDR), ширина шины также сохранена на уровне 256 бит. TDP AMD Radeon HD 6950 установлен на уровне 200 Вт. В простое со сниженными частотами обе видеокарты потребляют 20 Вт.

Обе модификации используют одинаковый дизайн печатной платы и системы охлаждения, потому рассматривать их будем вместе. Длина плат составляет 10,5” (26,7 см) – для них потребуется просторный корпус. Пластиковый кожух прямоугольной формы полностью накрывает всю видеокарту, дизайнерских изысков вроде своеобразного оформления отверстий воздухозаборника, как на Radeon HD 5870, нет. Система охлаждения представляет собой полностью накрывающий GPU и чипы памяти массивный радиатор, подошва которого – ставшая так популярной среди разработчиков СО испарительная камера. Продувается радиатор традиционным центробежным вентилятором, весь горячий воздух выводится за пределы корпуса. Отметим, что, в отличие от NVIDIA, AMD все же не стала пытаться уместить все видеовыходы на одной стороне крепежной планки и отдавать вторую половину на вентиляционную решетку: тут она занимает всего четверть планки. Эффективность СО вполне достаточна: алгоритм управления оборотами настроен таким образом, чтобы удерживать температуру GPU на уровне 88-90 оС, а до того момента кулер остается практически неслышимым. В особенности это относится к Radeon HD 6950: с охлаждением ее СО справляется вообще без проблем, а вот старшую модель при максимальной нагрузке в FurMark все же нельзя назвать тихой. Отдельно стоит отметить, что алгоритм явно не учитывает возможность увеличения порога срабатывания PowerTune: если в штатном режиме кулер Radeon HD 6970 работает громко, но постоянно, то при поднятии порога на 20% он начинает постоянно раскручиваться и замедляться, следуя колебаниям температуры и срабатываниям PowerTune. Звук при этом, соответственно, довольно неприятно пульсирует.

Питание видеокарт обеспечивается двумя разъемами, для Radeon HD 6970 это один 8-контактный и один 6-контактный, для младшей версии – два 6-контактных. VRM организован по схеме 6+2, о нехватке питания или неподключенном разъеме призван сигнализировать установленный на плате пьезодинамик.

Графические интерфейсы представлены двумя DVI, один из которых работает в режиме Dual-Link, второй – Single-Link, одним HDMI 1.4a и двумя mini-DisplayPort 1.2. Об особенностях этой ревизии DisplayPort мы уже писали.

Обе видеокарты поддерживают построение массивов CrossfireX вплоть до Quad Crossfire с четырьмя видеокартами. Возле разъемов для подключения мостиков CF можно увидеть неожиданный переключатель, имеющий два положения. Дело в том, что Radeon HD 6900 содержат два чипа BIOS, один из которых поддается перепрошивке пользователем, а второй заблокирован и позволяет в случае неполадок загрузиться с гарантированно стабильными настройками. Вполне возможно, в дальнейшем появится возможность регулировать (или совсем отключать) PowerTune именно редактированием BIOS – тогда наличие такой меры предосторожности более чем оправданно.

Из дополнительной функциональности Radeon HD 6900 ничего нового выделить мы не можем, набор технологий все тот же: поддерживаются панорамный вывод 3D-изображения Eyefinity, стереоскопическая технология HD3D, аппаратное воспроизведение и обработка MPEG-4/ASP, MPEG-4/AVC, MPEG-4/MVC, VC-1 и MPEG-2 посредством движка UVD3.

Перейдем к тестированию

Прежде всего обратим внимание на тест Unigine Heaven: тяжелая нагрузка на тесселяторы ранее делала это приложение настоящим козырем NVIDIA Fermi. Как видим, усовершенствования, проведенные AMD в новых GPU, позволяют им наконец потягаться с соперниками: Radeon HD 6970 идет практически вровень с GeForce GTX 570, у которой блоков тесселяции не 2, как в Cayman, а целых 15. Подчеркнем, что в данном случае нельзя говорить, что Cayman настолько быстрее Fermi в тесселяции: именно в данном тестовом приложении с используемыми им коэффициентами его двух блоков восьмого поколения достаточно для паритета с GeForce GTX 570/580. В целом же геометрическая мощь видеокарт NVIDIA намного выше. Что касается сравнения поколений архитектур ATI/AMD, то тут прогресс налицо: превосходство Radeon HD 6950 над Cypress в виде Radeon HD 5870 составляет 36%.

Переходя к комплексным и игровым тестам, мы сталкиваемся с несколько противоречивой ситуацией. Обе используемых нами версии 3DMark показывают, что Radeon HD 6970 «промахивается» мимо назначенной ей ниши между GeForce GTX 580 и GTX 570, располагаясь сразу под ними. В то же время Radeon HD 6950 работает именно так, как и обещалось, обеспечивая заметный отрыв от GeForce GTX 470 и Radeon HD 6870.

Игровые тесты показывают, что в большинстве случаев AMD Radeon HD 6970 все же оказывается медленнее своих прямых конкурентов, причем иногда очень заметно: обратите внимание на слабо объяснимый провал в Dirt 2. Мы склонны связывать такие результаты с недостаточной отлаженностью драйверов: значительное изменение архитектуры явно потребует оптимизации ПО для наиболее эффективной работы. Вероятнее всего, в списках изменений следующих версий Catalyst мы увидим много сообщений о повышении быстродействия Cayman в тех или иных играх.

Что касается Radeon HD 6950, то эта модификация радует намного больше флагмана: при ее позиционировании и цене на сегодняшний день конкурентов ей попросту нет, а обеспечиваемый ей уровень производительности более чем достаточен для подавляющего большинства современных игр.

Выводы

Технические характеристики видеокарт

В целом новые топовые видеокарты AMD, бесспорно, можно считать новым витком эволюции графической архитектуры компании. Если с технической точки зрения Radeon HD 6800 нас не смогли порадовать, будучи простой доработкой уже существующих GPU, то Radeon HD 6900 действительно содержат серьезно переработанные процессоры. Больший уклон на производительность в среднестатистических расчетах позволил AMD нарастить мощность ядер, тем самым ускорив видеокарты относительно прошлого поколения. К сожалению, острой борьбы с NVIDIA за пальму первенства все же не получилось (уж слишком быстра GeForce GTX 580), однако в рукаве AMD еще остается традиционный козырь – возможное снижение цен. Правда, в случае Radeon HD 6900 оно вряд ли будет таким агрессивным, как с видеокартами прошлого поколения: GPU Cayman заметно сложнее, себестоимость его выше, а следовательно, и «пространства для маневра» у AMD меньше.

Одним словом, революции не произошло, и, в отличие от 2009 года, на этот раз AMD вступает в новый год на позиции догоняющей. Что ж, нам, как конечным потребителям, такая конкуренция лишь на руку.

itc.ua

Некоторые подробности о видеокартах AMD Radeon серии HD 6900 утекли в сеть

Слайды с внутренних конференций AMD утекли в сеть, приоткрывая некоторые подробности о видеокартах AMD Radeon серии HD 6900.

Видеокарты AMD серии HD 6900 получат по 2 Гб памяти GDDR5 с частотой более 5 ГГц, тепловыделение вложиться в 225 Вт у Radeon HD 6950 и 300 Вт у Radeon HD 6970.

Пропускная способность шины памяти превышает 160 Гб/с, блоков растеризации (ROP) — все так же 32.

Серьезные изменения коснулись самой архитектуры ядра:

Блок геометрии удвоен. Потоковые ядра основаны на новой микроархитектуре VLIW4, а количество модулей SIMD увеличится. Шина памяти останется все так же 256-битной. Блок растеризации обновлен.

Вместе с делением, блок геометрии приобрел модули тесселяции нового поколения:

Слайд об уровне тесселяции говорит о существенном повышении производительности видеокарт AMD Radeon HD 6970 в сравнении с видеокартами Radeon HD 5870:

Если сравнить графики со слайдом, демонстрирующем уровень тесселяции в видеокартах AMD Radeon HD 6800, то можно прийти к выводу о значительных улучшениях тесселяции на видеокартах Radeon серии HD 6900 в тяжелых режимах:

Новая архитектура потоковых процессоров VLIW4 позволила добиться уровня производительности предыдущей модели VLIW5, но при этом один потоковый процессор получился на 10% компактней:

Среди других изменений в архитектуре можно найти новый Диспетчер, теперь работающий асинхронно, а так же некоторые улучшения контроллера памяти:

Еще один слайд рассказывает об улучшениях модуля растровых операций:

Производительность в операциях над целыми числами увеличена в два раза, производительность в операциях над числами с плавающей запятой увеличилась в 4 раза.

Еще одно важное новшество — интегрированный в графический процессор контроллер питания:

Новая схема призвана регулировать энергопотребление видеокарты путем динамического переключения частот вместе с напряжением.

ru.hw-lab.com

Видеокарты AMD Radeon серии HD 6900 (AMD Cayman)

Уже больше года продукцию AMD в секторе высокопроизводительных видеокарт с поддержкой API DirectX 11 представляло семейство Cypress. Из-за задержек конкурирующей стороны, видеокарты AMD HD 5850 и HD 5870 довольно продолжительное время монопольно властвовали в этом секторе. Анонс архитектуры NVIDIA Fermi и последующий рост популярности продукции конкурентов заставил AMD задуматься о видеокартах следующего поколения.

Как и потребителям, так и AMD, хотелось увидеть новинки с графическим процессором, изготовленным по технормам 28 нм. Все уже давно знают, что графические процессоры для AMD изготавливаются компанией TSMC. В свою очередь последняя несколько затянула запуск производственной линии с более передовыми технормами. В итоге AMD пришлось пересмотреть свои планы на второе поколение видеокарт с поддержкой DX11. В довольно сжатые сроки AMD удалось создать графический процессор AMD Barts, дебют которого состоялся 22 октября 2010 года. Видеокарты AMD Radeon HD 6850 и HD 6870 удачно вписались в свой сегмент рынка, дело оставалось за производительными решениями, которые уже давно ждали.

В начале ожидалось, что видеокарты AMD Cayman будут представлены в ноябре, но в последний момент анонс был отложен на пятидесятую неделю текущего года. Теперь, когда вы читаете эти строки, можно с уверенность сказать — анонс состоялся.

Видеокарты AMD Cayman представляют две новинки — Radeon HD 6950 и Radeon HD 6970:

 

 

 

 

 

ru.hw-lab.com

Видеокарты AMD Radeon серии HD 6900 (AMD Cayman) | Страница 4

Не смотря на то, что архитектура ядра Cypress фактически отправлена на покой, проводить сравнение придется именно с ней. Ядро AMD Barts хоть и унаследовало основные достоинства предыдущей архитектуры, но по уровню производительности никак не дотягивает AMD Cypress. В принципе этого и не требовалось — видеокарты с графическим процессором Barts позиционируются чуть ниже. Спрос с ядра Cayman уже другой — новые графические процессоры должны были превзойти производительность Cypress, окончательно вытеснив их из линейки продукции AMD.

При условии того, что ядро Cayman пришлось строить на основе все тех же технорм 40нм, перед инженерами AMD стала непростая задача — выдавить максимум производительности при ограничениях возможных размеров ядра, соответственно и количестве используемых транзисторов.

Изрядно потрудившись, инженеры AMD все же нашли пути в более рациональной организации вычислительных конвейеров графического процессора:

Новая архитектура была переработана от начала до конца:

  • На входе удвоен блок геометрии
  • В центральной части процессора потоковые процессоры (SP) сменили архитектуру с VLIW5 на VLIW4, блоки операций с шейдерами получили 24 модуля SIMD, 96 модулей текстурирования (TMU)
  • В выходе обновились процессоры операций растеризации (ROP)

Разрядность интерфейса памяти была унаследована от предшественников — в AMD отказались от увеличения ширины, все тех же четыре 64-битных контроллера памяти в сумме дают 256-бит. Что бы как то скомпенсировать возможные проблемы пропускной способности интерфейса памяти, видеокарты AMD Cayman приобретут более быструю память GDDR5. Сам контроллер памяти подвергся некоторым изменениям, которые мы рассмотрим ниже.

Архитектура AMD CaymanАрхитектура AMD Cypress

Одним из самых слабых мест архитектуры Cypress являлся довольно слабый модуль тесселяции. Производительность в тесселяции была существенно увеличена у AMD Barts, но достигнутого было однозначно мало, что бы конкурировать с более производительными видеокартами конкурентов. В процессоре Cayman были предприняты более радикальные меры: вместо наращивания размеров блока геометрии, инженерами было принято решение использовать два параллельных блока:

Расширение графического блока

Такое решение вполне оправдано — эффективность использования входного блока выросла вместе с пропускной способностью. Удвоилось и количество обновленных модулей тесселяции, на этот раз уже восьмого поколения.

В сердце графического процессора не менее глобальные изменения. Новая архитектура потоковых процессоров VLIW4 позволила сократить площадь каждого SIMD на 10%, при этом сохранить уровень производительности предыдущей архитектуры VLIW5:

Новый дизайн потокового процессора

При первом взгляде на потоковые процессоры новой архитектуры, возникает ощущение, что сам SP просто напросто урезали:

SP архитектуры VLIW4

На самом деле это не совсем так. Возросла функциональность каждого модуля, к тому же они стали равноправными. Для сравнения нашлась иллюстрация SP архитектуры VLIW5:

SP архитектуры VLIW5

Одними из главных причин смены архитектуры потоковых процессоров с одной стороны стали ограничения в размере ядра / кол-ве транзисторов, с другой стороны асинхронная архитектура VLIW5 очень часто в полной мере не использовалась приложениями из-за трудностей оптимизации кода. Кроме изменений размеров SP, архитектура VLIW4 приносит теоретический рост производительности в операциях с двойной точностью и снова таки — некоторые улучшения для разработчиков в упрощения менеджмента планировщика и регистров для компилятора и упрощения, связанные с симметричной архитектурой.

На выходе обновленный процессор операций растеризации (ROP) удвоил производительность в 16-битных целочисленных операциях, производительность в 32-битных операциях с плавающей запятой возросла в 2-4 раза, операции записи теперь группируются:

Обновленные модули растеризации

Как видим, расширили и донышко графического процессора. В теории, окно каждого блока было расширенно, позволяя более эффективно использовать графический процессор. Но где то за рамками доступной информации остались изменения в организации кросс-бара и буферов, без которых часть улучшений могут остаться только в теории. Были какие то изменения в этом направлении или нет — могут ответить только сами инженеры AMD, мы же рассмотрим доставшуюся информацию.

Как уже говорилось, видеокарты Cayman используют более скоростную память, что бы компенсировать ограниченную пропускную способность интерфейса. Необходимость изменений в контроллере памяти назревала давно, и Cayman все же их получил, вот только для каких целей…

В свете последних событий, AMD все же решила извлечь преимущества от покупки ATI для своего процессорного подразделения. Ставка сделана на общие вычисления (GPGPU). По мнению AMD в мире центральных процессоров назрел кризис. Дальнейшее наращивание производительности центральных процессоров ограниченно технологическими аспектами производства. И в то время, когда все гадают как быть дальше — в AMD увидели выход «под ногами». По замыслу AMD, ключевым моментом в увеличении производительности процессоров могут стать видеокарты. Архитектура видеокарт действительно дает некоторые преимущества в арифметических операциях. NVIDIA уже давно активно продвигает свои ускорители, основанные на собственной платформе общих вычислений CUDA, и достаточно успешно. В свое время упустив этот рынок, AMD сделала более широкую ставку на индустриальные платформы. С одной стороны компания всячески поддерживает и продвигает открытый стандарт OpenCL, с другой стороны старается максимально использовать возможности общих вычислений, заложенных в API DirectX 11 — DirectCompute. О войнах в мире общих вычислений нам предстоит отдельный разговор, а сейчас стоит вернуться к нашим видеокартам.

И так в процессорах Cyaman улучшения для не графических вычислений оказались достаточно серьезными:

  • Диспетчер теперь стал асинхронным. Дало это не много ни мало много-поточность вычислений, и не менее значимую возможность использования потоками вычислений индивидуального выделенного виртуального адресного пространства в защищенном режиме.
  • Контроллер памяти получил двунаправленный режим DMA.
  • Группировка операций чтения в шейдеры.
  • Прямая выборка в LDS.
  • Улучшения диспетчера потоков.
  • Более быстрые операции с двойной точностью. Но зачем? В мире обычной графики операции с двойной точностью встречаются чуть чаще чем никогда. А в мире профессиональных решений такие операции без ECC никому не нужны. Воспримем этот пункт на тонкий намек на поддержку коррекции ошибок в будущих поколениях графических процессоров AMD.

ru.hw-lab.com


Смотрите также