Haswell в сегменте мобильных систем

В прошлом году компания Intel анонсировал 22-нм полупроводниковые кристаллы Ivy Bridge, которые сменили своих предшественников — 32-нм Sandy Bridge. Различия между представителями двух поколений процессоров заключались в модернизации графической подсистемы, тогда как вычислительные ядра претерпели минимальные изменения. Если архитектура Intel Core третьего поколения была "тиком", представлявшим собой переход на новый техпроцесс, в случае Haswell мы получаем новую процессорную архитектуру, то есть "так". Что касается техпроцесса, то он не изменился по сравнению с предшественником Ivy Bridge: размер структур составляет 22 нм, также используются и транзисторы с тремя затворами. Intel в новой архитектуре доработала вычислительные ядра, кэш и графическое ядро. 

Вводить новую архитектуру всегда непросто, поскольку сложно предусмотреть все параметры и характеристики работы. К счастью, Intel не стала полностью отказываться от архитектуры Sandy Bridge, последнего "така", сохранив векторы развития микро-архитектуры Core. Конечно, вычислительные ядра, кэши, графический процессор, контроллер памяти и некоторые другие компоненты подверглись серьезной оптимизации, что привело к более высокой производительности, а также к лучшему энергосбережению.С выходом новых процессоров на архитектуре Haswell, для ноутбуков мы получили несколько весьма интересных разработок, которые не связаны с архитектурой.

Новая архитектура

Львиная доля усилий разработчиков была потрачена на снижение энергопотребления, и, надо сказать, с точки зрения мобильных систем усилия эти прошли далеко не впустую. Как оказалось, ноутбуки на базе процессоров Haswell работают от батареи примерно на 50 процентов дольше, чем аналогичные конфигурации на базе Ivy Bridge. Столь впечатляющий прогресс стал возможен благодаря комплексу мероприятий, проведенных не столько с самим процессором, сколько с платформой и инфраструктурой в целом. Во-первых, важную роль сыграла общая интеграция компонентов платформы: в процессорный кристалл перекочевала значительная часть схемы преобразователя питания, а для ультрамобильных применений был спроектирован специализированный SoC-вариант процессора, содержащий на той же подложке второй кристалл — набор системной логики. Кроме того, подобные решения BGA поддерживают не только память DDR3L RAM, которая возможна и в двухчиповых вариантах, но и более эффективную по энергопотреблению LPDDR3. Во-вторых, Intel провела значительную работу с основными производителями контроллеров, указав им на необходимость качественной поддержки состояний сна и глубокого сна.

 

Попутно разработчики рассчитывают, наконец, добиться от производителей дисплейных матриц поддержки функции Panel Self Refresh, позволяющей сохранять изображение на экране без его постоянного обновления со стороны графического ядра. Также на руку сыграл и выход операционной системы Windows 8, ядро которой, как известно гораздо заботливее относится к обработке прерываний, по возможности стараясь избегать разрозненных транзакций, пробуждающих процессор или устройства. И наконец, в Haswell появился новый набор ACPI-состояний сна S0ix, похожих по уровню энергопотребления на S3/S4 (когда в пассив отправляются все составляющие платформы за исключением системной памяти), но со временем перевода системы в полностью рабочее состояние на уровне нескольких миллисекунд. Кроме того, добавились также и новые состояния простоя процессора C7 и далее, достигаемые при видимой работоспособности системы, но при которых с основной части CPU может быть полностью снято питающее напряжение. Вместе с тем Новое процессорное ядро получило поддержку расширенного набора инструкций AVX2, FMA3 и BMI. В множество инструкций AVX2 входят 256-битные SIMD-команды для обработки целых чисел, разреженные операции с памятью и различные перестановки и сдвиги компонентов векторов. Но львиная и самая важная доля нового набора команд — принципиально новые вещественночисленные FMA-инструкции (Fused Multiply-Add), которые фактически одновременно включают в себя пару операций — умножение и сложение. Естественно, их выполнение старыми средствами вызвало бы значительные простои процессора, поэтому для них теперь сделано два отдельных порта и выделенные исполнительные устройства. В результате Haswell может выполнять по две сдвоенные FMA-инструкции за такт. В какой-то мере внедрение быстрого исполнения FMA-команд является ответом Intel на растущую популярность вычислений на графических процессорах. Желание сделать работу процессора с AVX2-инструкциями максимально гладкой заставило разработчиков Haswell задуматься об увеличении скорости работы кеш-памяти. Новые команды предполагают вдвое более быструю, чем ранее, обработку данных. Поэтому для поддержания баланса в новой микроархитектуре симметрично увеличена пропускная способность кеш-памяти первого и второго уровней. В результате кеш первого уровня стал способен отрабатывать два 32-байтных чтения и одну 32-байтную запись за такт. Кеш же второго уровня может принимать и отдавать за такт по 64 байта данных. И в том и в другом случае имеет место двукратное увеличение пропускной способности по сравнению с процессорными микроархитектурами прошлых поколений. Конечно, будет весьма интересно посмотреть, до какой степени производители ноутбуков смогут задействовать потенциал новых решений. В любом случае, новые разработки кажутся весьма интересными и перспективными на мобильном рынке, так что во второй половине года нас ждет много сюрпризов.

Модельный ряд

С представлением Haswell Intel решила изменить схему именования своих процессоров - по крайней мере, частично, поскольку загадочные аббревиатуры по-прежнему остались. Но добавились интересные буквы. В дополнение к ранее известным добавкам "X" и "M" в будущем нам придется столкнуться и с процессорами "H". Если под "M" подразумеваются "нормальные" 2- и 4-ядерные процессоры с обычным графическим ядром HD, то в случае процессоров "H" Intel планирует устанавливать новую high-end графику Iris. По тактовым частотам у Haswell особых изменений не произошло - здесь новые процессоры четвертого поколения Core во многом идентичны Ivy Bridge. Новая топовая модель Intel Core i7-4930MX работает на базовой частоте 3,0 ГГц с максимальной частотой 3,9 ГГц в случае нагрузки на одно ядро. Кэш L3 составляет 8 Мбайт. Интересный прогресс можно наблюдать с тепловым пакетом, поскольку мы впервые получили отклонение от привычных уровней TDP. Причем Intel сдвинула планку теплового пакета не вниз, а вверх - теперь для топового процессора он составляет 57 Вт. Впрочем, окажут ли два ватта какое-либо влияние на практике, мы всё же сомневаемся. Похожий сдвиг мы наблюдаем и с другими процессорами "M", которые получили тепловой пакет TDP 47 Вт. Процессор Core i7-4900MQ работает на частотах 2,8-3,9 ГГц, как и модель Extreme Edition он может гордиться кэшем L3 8 Мбайт. Ещё на 100 МГц медленнее (в обычном режиме и в Turbo) работает процессор Core i7-4800MQ, кэш L3 которого был также урезан на 2 Мбайт. Все процессоры "M" (включая Extreme Edition) получили новую схему модельных номеров без Iris Graphics. По структуре именования процессоров "M" принципиальных изменений по сравнению с предыдущим поколением не произошло, их можно легко соотнести с процессорами Ivy Bridge. Что касается двуядерных процессоров на архитектуре Haswell то на данный момент анонсировано несколько процессоров в первую очередь GPU Core i7 с пониженным энергопотреблением равным 15-37Вт имеющих индекс U. Далее идут процессоры семейства Core i5 Intel Core i5 4330M , Intel Core i5 4400E, Intel Core i5 4300M Intel Core i5 4258U.

Интегрированная графика

Учитывая первостепенность мобильных применений своих процессоров, Intel в последние несколько лет проводит последовательные улучшения встраиваемой в них графики и стремится к тому, чтобы ее собственный ускоритель смотрелся не хуже решений других разработчиков, включая и тех, которые графическими решениями занимаются целенаправленно. В Ivy Bridge мы уже видели почти двукратный рост графической производительности по сравнению с процессорами предыдущего поколения, произошедший одновременно с внедрением поддержки всех современных версий программных интерфейсов. Микроархитектура Haswell обещает поднять скорость работы графического ядра еще примерно вдвое. Если производительность графики, интегрированной в CPU, будет близка к уровню младших и средних GPU конкурентов, надобность в последних отпадет целиком и полностью. С новыми процессорами Haswell компания Intel представила и переработанные графические ядра, которые позволили бы более-менее конкурировать с графическим ядром процессоров AMD, и бюджетными дискретными видеокартами Nvidia.   Новое графическое ядро существует в трех вариантах — GT1, GT2, GT3. Первое будет применяться в недорогих бюджетных процессорах типа Pentium и Celeron, второе  GT2 применяться во всем спектре линейки Core 4xxx, в то время как GT3 появится только в определенных топовых процессорах, где потребуется применение мощного встроенного видео. Сама по себе архитектура графического ядра в процессорах Haswell изменилась не сильно, если сравнивать с Ivy Bridge. Однако в некоторых из них произошел резкий скачок в количестве исполнительных блоков.  Если не считать отдельных оптимизаций графического конвейера, направленных на перенесение части нагрузки с драйвера на аппаратные блоки и на увеличение производительности большинства специализированных функциональных блоков, выполняющих в конвейере 3D-рендеринга подготовительные операции, новое графическое ядро сильно похоже на ядро из процессоров предыдущего поколения с добавленной поддержкой DirectX 11.1. Главное же преимущество нового дизайна — наличие существенно большего количества универсальных исполнительных устройств. Если максимальная версия графики Ivy Bridge располагала 16 исполнительными устройствами (включающими по 4 ALU каждое), то количество исполнительных устройств в графическом ядре Haswell может доходить до 40 штук. Увеличение мощности исполнительного кластера графического ядра заставило разработчиков дизайна задуматься и о том, чтобы узким местом не стал этап наложения текстур. Поэтому скорость работы текстурного блока в Haswell была симметрично увеличена. Intel обещает четырехкратный рост скорости текстурирования по сравнению с графикой Ivy Bridge, и это — вполне достаточное усиление, если учесть рост мощности остальной части движка.  Без улучшений не осталось и одно из любимых детищ Intel — встроенный в графическое ядро аппаратный видеокодер Quick Sync. Разработчики рассматривают его как один из путей снижения энергопотребления процессоров, так как Quick Sync позволяет высвобождать вычислительные ядра от энергоемких и весьма распространенных задач кодирования и декодирования видео, перенося их выполнение на специализированный и экономичный узел. Поэтому в каждой новой версии процессорного дизайна производительность Quick Sync поднимается, а число поддерживаемых этой технологией форматов растет. Так, Haswell в дополнение к уже освоенным форматам будет способен на аппаратном уровне работать с SVC (Scalable Video Coding — производная AVC H.264), декодировать MJPEG (motion JPEG) и кодировать видео в формате MPEG2. При этом будет обеспечена полноценная совместимость при кодировании и декодировании с видео в разрешении 4K (4096x2304, 4096x2160 и 3840x2160), которое в настоящее время приобретает всё большую популярность.

 

Все графические процессоры – GT1, GT2 и GT3, как уже отмечалось, построены на основе модульной архитектуры. В качестве вычислительной единицы модуля выступает блок EU. Сам по себе единичный EU состоит из двух блоков, состоящих из 4-х SIMD ядер каждое. Десять таких блоков, вместе с текстурным процессором, кэшем входят в состав вычислительного модуля. Самый слабый, Haswell GT1, будет иметь только 10 вычислительных блоков EU. Второе ядро — GT2 имеет 20 вычислительных блоков EU и используется в графических ядрах HD 4200 / 4400 / 4600. Самое мощное графическое ядро GT3 имеет 40 вычислительных блоков EU и два варианта исполнения – Iris 5100 и Iris Pro 5200. Впрочем, несмотря на все принятые меры, производительность GT2 HD 4600 GT3 HD 5000 показалась Intel недостаточной, чтобы привлечь на сторону собственных интегрированных ядер самых требовательных пользователей. Поэтому для производительных игровых мобильных систем Intel создала специализированную  модификацию GT3e. В процессорах с таким ядром, которые будут образовывать отдельную мобильную H-серию, встроенное графическое ядро GT3 будет дополняться быстрой eDRAM-памятью объtмом 128 Мбайт и 512-битной шиной. Идея состоит в том, что существенные ограничения на скорость встраиваемых видеоядер накладывает недостаточная пропускная способность системной памяти, которая в таких случаях играет также и роль видеопамяти. eDRAM же будет устанавливаться на одну подложку с процессорным ядром и выполнять роль L4-кеша, обеспечивая пропускную способность порядка 64 Гбайт/с. Однако никакого специализированного интерфейса между графическим ядром и eDRAM не предусматривается, так что такой L4-кеш будет буферизировать все обращения в память, а не только инициированные графическим ядром. Тем не менее Intel ожидает, что именно эта добавка сможет вывести Haswell по графической производительности на один уровень с NVIDIA GeForce GT 650M. Но следует понимать, что добавление к процессорному кристаллу дополнительного кристалла eDRAM заметно увеличивает энергопотребление и стоимость процессора, поэтому CPU с GT3e предполагается использовать исключительно в высокопроизводительных ноутбуках, где речь об экономичности, компактности и бюджетности не идет. А значит, компания AMD со своими APU поколения Richland пока что не будет ощущать особого давления со стороны конкурента. Количество кадров в секунду, которое показывает GT3e впечатляет. Это графическое ядро вполне способно конкурировать с недорогими дискретными видеокартами для ноутбуков  вроде GeForce GT 640М, GeForce GT 730М.

Заключение

В прошлом году Intel успешно завершила переход на новый техпроцесс 22 нм, и в нынешнем году настала очередь представить на нем новую микро-архитектуру "Haswell". Четвертое поколение микро-архитектуры Core наглядно показывает, что дни стремительного роста производительности остались в прошлом, сегодня Intel занимается оптимизацией и доработкой деталей. В целом, революционного прироста производительности CPU ждать не приходится. Четвертое поколение Core дает преимущество по производительности около восьми процентов по сравнению с предшественником - так что владельцам ноутбуков на Ivy Bridge вряд ли имеет смысл задумываться об апгрейде. Более серьезный прирост, как и в случае перехода с Sandy Bridge на Ivy Bridge, нас ждет по производительности интегрированного GPU. например новый iGPU HD4600 заметно обходит предыдущее графическое решение HD4000. Но, опять же, для владельцев мощных ноутбуков с 4-ядерным CPU производительность iGPU вряд ли будет актуальна, поскольку обычно они используют скоростные дискретные GPU. 

Tags: ,

Добавить комментарий

Не флудить, реклама в комментариях запрещена

Защитный код
Обновить

Вход на сайт