Что готовит нам AMD и Nvidia в 2016 году на рынке графических адаптеров

Для поклонников персональных компьютеров и заядлых геймеров 2015 год был поистине удивительным. Компания  Nvidia выпустила достаточно мощную видеокарту Titan X, а спустя пару месяцев – еще более производительную  GeForce GTX 980 Ti. Компания AMD тоже в долгу не осталась и представила не уступающую по производительности Fury X, которая хоть и базировалась на прошлогоднем GPU "Fiji", но вместе с тем получила ряд инноваций по сравнению с видеокартами прошлого поколения. В этом же году AMD и Nvidia обещают, что мы все станем свидетелями колоссального скачка в производительности видеокарт, увидим новые решения от обеих компаний, которые перевернут наше представление о компьютерных играх..

NVIDIA Pascal

На конференции GPU Technology Conference 2016 NVIDIA  все таки решила представить архитектуру нового поколения Pascal — GP100. Дженсен Хуанг перед представлением нового продукта рассказал о затратах на разработку новой архитектуры, которые составили без малого 2-3 млрд. долларов США.  Первым ускорителем на основе Pasca стал графический процессор Tesla P100, предназначенный, в первую очередь, для использования в сверхмасштабируемых центрах обработки данных (ЦОД).  Утверждается, что GP100 является самой крупной микросхемой, произведенной по 16-нм техпроцессу FinFET — площадь кристалла составляет 610 мм2, на которых умещаются 15,3 млрд транзисторов. Это почти вдвое больше, чем у GM200 (Maxwell) и AMD Fiji. Стандартные спецификации NVIDIA GP100 включают 60 потоковых процессоров, 240 текстурных блоков, а также 3840 ядер CUDA FP32 и 1920 ядер CUDA FP64 (то есть соотношение 32- и 64-разрядных блоков равно 2:1). Последняя особенность позволяет GP100 демонстрировать хорошие показатели производительности при обработке данных как с одинарной, так и с двойной точностью, что делает его одинаково подходящим как для «повседневной» высокоскоростной обработки данных (графика и т. п.), так и для научных расчётов, в том числе для работы с архитектурами глубинного обучения, к которым относятся нейронные сети. Заявленные разработчиками показатели быстродействия GP100 следующие: 5,3 Тфлопс в вычислениях FP64, 10,6 Тфлопс при операциях FP32 и 21,2 Тфлопс в режиме FP16 (половинная точность). Однако первый адаптер на базе GP100 — Tesla P100 — обладает слегка заниженными характеристиками: число потоковых процессоров уменьшено до 56, текстурных блоков — до 224, 32-битных ядер CUDA осталось 3584, а 64-битных — 1792. При этом на плате вместе с графическим процессором установлены четыре микросхемы CoWoS HBM2 видеопамяти с пропускной способностью до 720 Гбайт/с. Согласно стандарту «JESD235 High Bandwidth Memory (HBM) DRAM standard» HBM2 состоит из 2, 4 или 8 слоев, таким образом, емкость одного чипа составит от 2 до 8 Гбайт. Поскольку 4 таких чипа уже использовались в GPU Fury, такое же количество чипов ожидается и у новых графических ускорителей Pascal, таким образом общий объем памяти у новых видеокарт составит до 32 Гбайт.

В случае Tesla P100 объем составляет 16 GB. Можно с уверенностью сказать, что HBM2 позволит производителям видеокарт увеличить пропускную способность вдвое, а объем памяти в 8 раз. Напряжение останется прежним и составит 1,2 В. У AMD уже есть опыт и налаженные связи для производства видеокарт с HBM. С технической точки зрения новая технология потребует больших усилий от производителей, потому как память типа High-Bandwidth Memory (HBM), на сегодняшний день все еще весьма дорога. Как следствие, в ближайшие годы скорее всего компания NVIDIA будет использовать память HBM, только в топовых решениях, в остальных видеокартах продолжат использовать память GDDR5, но также будут применять улучшенную версию данного типа памяти, известного как GDDR5X. Поскольку GDDR5X по сути является «расширенной» версией GDDR5, соответствующие микросхемы смогут работать в режимах низких и высоких тактовых частот (GDDR5) c 32B/16n выборкой данных. Сверхбыстрые режимы работы GDDR5X будет поддерживаться исключительно в режиме ultra-high speed mode и потребует использования новых контроллеров памяти. GDDR5X-микросхемы будут использоваться аналогичное количество сигнальных контактов, что и GDDR5, и будут выпускаться в аналогичных BGA-упаковках. Однако достоверно не ясно, будут ли новые микросхемы поконтактно совместимы с GDDR5. Новые чипы будут функционировать при пониженном напряжении питания в 1,35 Вольта против 1,5 Вольта у обычной GDDR5, что снизит энергопотребление обновленной памяти по сравнению с оригиналом в определенных ситуациях. Тем не менее, маловероятно, что GDDR5X будет существенно более экономичной, чем GDDR5. Так как GDDR5X во многом продолжит использовать инфраструктуру GDDR5, память данного типа не потребует применения дорогостоящих кремниевых соединительных подложек (silicon interposer) как HBM, но и не позволит строить миниатюрные графические карты с огромной производительностью. Кроме того, GDDR5X микросхемы емкостью 4–8 Гбит обещают быть дешевле в производстве, чем многослойные сборки памяти HBM первых поколений.

 


 

На данный момент известно, что  флагманские видеокарты от NVIDIA на новой 16 н.м архитектуре Pascal получат названия GeForce X80, NVIDIA GeForce X80 Ti и NVIDIA GeForce X80 TITAN. 

Технические характеристики

Название
Nvidia X80Ti Nvidia X80 Nvidia X80Titan
Процессор
GP 104 GP 100 GP 100
Tехпроцесс
16 н.м
Потоковые процессоры
4096 5120 6144
Текстурные блоки
256 320 384
Конвейеры растровых операций (ROP)
128 160 192
Тактовая частота GPU (базовая)
 1000 МГц 1025 МГц  1025 МГц 
   Тактовая частота GPU (Boost)
 -
Объeм памяти   
 6ГБ  8ГБ 16ГБ 
Тип памяти   
 GDDR 5   GDDR 5 HBM 2 
   Ширина шины памяти
 384 бит 512 бит 4096 бит
   Частота памяти
 8000МГц 8000МГц  1000МГц 
Версия DirectX
12,0
   Тепловой пакет
 175Вт  225Вт 225Вт 

AMD Polaris

Подразделение Radeon Technologies Group корпорации Advanced Micro Devices официально представило новую архитектуру графических процессоров Polaris. Новая технология является четвертой итерацией семейства архитектур Graphics Core Next (GCN) и представляет собой наиболее радикальное обновление GPU AMD с 2011 года. Первые графические процессоры на базе Polaris появятся в середине 2016 года и предложат новый уровень производительности, а также ряд новых возможностей. Архитектура Polaris для AMD — огромный шаг вперед, но при этом её будут сопровождать и новинки от Radeon Technologies. К примеру, GPUOpen предоставит разработчикам дополнительные возможности для оптимизации игр под ПК и повышения качества визуальных эффектов на всех платформах. Также нас ждет масса дисплей-ориентированных технологий, например, HDR-панелей и систем FreeSync для HDMI и DisplayPort 1.3. Radeon Technologies также планирует выкатить единую комплексную систему (надеемся, что регулярного) обновления драйверов и ПО через Radeon Software Suite. Начиная с Polaris, компания AMD планирует показать, что современный графический процессор — нечто большее, чем просто графическое ядро. Нынешние GPU содержат множество ядер, блоков и движков: мультимедийных, дисплейных, кэшей, контроллеров памяти, управления питанием и т.д. Это уже получается практически готовая система-на-чипе (SoC — system-on-chip), и вся она идет под именем Polaris, а не только графическая ее часть. Хотя функциональных изменений в Polaris не слишком много, о чем говорят даже сами представители компании AMD, но кое-что всё же изменилось. Основными особенностями новой архитектуры, с точки зрения графических задач, являются следующие изменения: четвертое поколение архитектуры GCN, блок для ускорения отбрасывания геометрических примитивов, аппаратный планировщик, предвыборка команд (prefetch), улучшенная эффективность исполнения шейдеров, новые алгоритмы сжатия данных в памяти. Когда AMD говорит о двукратном или даже большем увеличении производительности Polaris относительно решений текущего поколения, каждый задаётся логичным вопросом: какая часть из этого прироста обеспечивается применением куда более совершенного техпроцесса, а какая — архитектурными изменениями? Конечно, пока что слишком рано отвечать на этот вопрос, но технический директор AMD Джо Макри (Joe Macri) оценивает прирост от техпроцесса примерно в 75%. То есть, основной вклад в возросшую производительость принесет именно техпроцесс.

Архитектура Polaris получит новые контроллеры памяти, что даст возможность увеличить ПСП благодаря поддержке новых и более быстрых типов памяти вроде HBM2 и GDDR5/GDDR5X. Кроме того, AMD обещает внедрить новый кеш второго уровня, что может означать перепроектирования всей подсистемы кешей внутри графических процессоров GCN версии 1.3. Принимая во внимание тот факт, что следующему поколению GPU придется работать с играми в разрешениях 4K (3840 × 2160), а также в VR-приложениях, увеличение ПСП и низкие задержки при работе с памятью придутся как нельзя кстати. К сожалению, в настоящее время AMD не хочет раскрывать детальной информации о подсистемах памяти и кеширования Polaris. Есть некоторые предположения, что одними из самых важных первых графических процессоров архитектуры Polaris будут именно не топовые чипы, а средней мощности, но весьма энергоэффективные и ориентированные на легкие игровые ноутбуки и компактные игровые ПК. Тем более, что производители ноутбуков уже выбирают поставщиков GPU для моделей, запланированных на конец 2016 года и даже на 2017 год. Неудивительно, что именно такой GPU и был продемонстрирован на мероприятии — когда в игре Star Wars Battlefront сравнивался один из GPU архитектуры Polaris и весьма энергоэффективная видеокарта GeForce GTX 950 от NVIDIA. Так, видеокарта Radeon на основе графического процессора архитектуры Polaris, обеспечила 60 FPS при потреблении всей системой порядка 86 Вт (цифры 85-90 Вт на приборе автор видел лично), а GeForce GTX 950 в этих же условиях смогла обеспечить потребление в 140 Вт (140-150 Вт на том же стенде), а это почти вдвое больше. Кроме этого, чип AMD еще и физически примерно вдвое меньшей площади, по сравнению с GM206 (что неудивительно, ведь при его производстве применялся 14 нм FinFET-техпроцесс). И в целом, это весьма неплохой результат для новой графической архитектуры компании AMD.

 


 

Из неофициальной информации, опубликованной различными источниками за последний год известно, что компания AMD планирует выпустить в 2016 году как минимум три новых графических процессора для настольных ПК — Greenland, Baffin, Ellesmere.

Технические характеристики

Название
 Ellesmere  Baffin
Процессор
Polaris 10 Polaris 11
Tехпроцесс
14 н.м
Потоковые процессоры
2560 ?
Текстурные блоки
? ?
Конвейеры растровых операций (ROP)
? ?
Тактовая частота GPU (базовая)
 1000 МГц 800 МГц 
   Тактовая частота GPU (Boost)
 -
Объeм памяти   
8ГБ  4ГБ 
Тип памяти   
 GDDR 5   GDDR 5
   Ширина шины памяти
 256 бит 128 бит
   Частота памяти
 6000МГц 7000МГц 
Версия DirectX
12,0
   Тепловой пакет
 ? ?

Можно сказать, что наступивший 2016 год должен стать решающим как для Nvidia так и для AMD.  Обе компании должны показать индустрии, что они все еще могут быть сильными конкурентами на рынках графических процессоров. Мы относимся к Polaris с осторожным оптимизмом. В том, что первые тестовые образцы ориентированы на рынок мобильных систем, есть логика, учитывая возможность вернуть утраченную долю рынка, выпустив хорошее железо раньше конкурентов. И хотя в своей демонстрации компания выбрала процессор, предназначенный для тонких и легких ноутбуков в надежде заинтересовать своих OEM- клиентов еще на этапе проектирования, представители AMD признались, что готовят "старшую" версию чипа ближе к дате премьеры первых графических процессоров, которая, предположительно, будет предназначена для энтузиастов. Сейчас рыночная доля дискретной графики AMD составляет порядка 20%, и с выпуском Polaris компания надеется усилить свои позиции на рынке графики настольных ПК. Что касается конкурента в лице Nvidia, то в июне компания представит видеокарты GTX 1080/1070, а их официальный выпуск состоится в третьем квартале. Видеокарты семейства Pascal мейнстрим уровня станут доступными в четвертом квартале.

Добавить комментарий

Не флудить, реклама в комментариях запрещена

Защитный код
Обновить

Вход на сайт