На своем Tech Day в Лос-Анджелесе компания AMD рассказала подробности об архитектуре Zen 5, которая лежит в основе процессоров Ryzen AI 300 и Ryzen 9000. Напомним, что процессоры будут представлены в июле. Сразу же скажем, что процессоры Ryzen 9000 появятся в продаже с 31 июля. Однако AMD пока не объявила цены.
Первые ноутбуки с процессорами Ryzen AI 300 также должны появиться в конце июля. AMD также раскрыла еще несколько подробностей об этих процессорах под кодовым названием Strix Point, о которых мы поговорим в статье.
В AMD работает в общей сложности 20.000 инженеров, часть из которых также принимали участие в разработке архитектуры Zen 5. Так называемые команды базового дизайна работают в Санта-Кларе и Остине, они поддерживают разработку в офисе на Восточном побережье в Бостоне. Именно здесь создают базовые проекты архитектуры и SoC-дизайна. После выпуска первых чипов в Фолсоме проводят верификацию.
Как и в случае с Zen 4, дизайн Zen 5 с самого предусматривал классические ядра Zen (Zen 5) и компактные Zen 5c. Однако, как и в предыдущем поколении, ядра Zen 5c используются только в APU (Ryzen AI 300), а позже и в процессорах EPYC.
Архитектура Zen 5
Прежде чем перейти к архитектуре Zen 5, AMD хотела бы сказать несколько слов о поддержке SMT (Simultaneous Multithreading), поскольку Intel не будет ее использовать, по крайней мере, для Lunar Lake и архитектуры Lion Cove. Два типа ядра, то есть Zen 5 и Zen 5c, по-прежнему не имеют различий по набору инструкций, и AMD рассматривает SMT как возможность улучшения эффективности. Хотя для реализации SMT требуется около 5-10% площади ядра, в зависимости от приложения можно добиться значительно более высокой производительности. AMD также отмечает, что SMT можно просто отключить, что и делают в некоторых продуктах.
AMD также сказала несколько слов о растущей конкуренции со стороны ARM: в 1996 году компания разработала свой первый собственный x86-процессор, K5. С тех пор технология x86 продолжает развиваться. Майк Кларк, отец архитектуры Zen, работает над дизайном x86 уже 31 год. По мнению AMD, процессоры на базе инструкций x86 также должны быть гораздо более гибкими, чем кажется на первый взгляд. ARM опирается на так называемую архитектуру RISC с ограниченным набором команд, в то время как CISC x86 в этом отношении более гибкая. Но у всего есть свои преимущества и недостатки. Однако AMD не видит очевидных недостатков x86 по сравнению с ARM в этом сегменте.
AMD уже представила некоторые подробности об архитектуре Zen 5 на выставке Computex 2024 в начале июня. Но теперь информации стало немного больше.
Zen 5 будет выполнять больше инструкций за такт. Для достижения этой цели приняли различные меры. В частности, расширили блоки диспетчеризации и исполнения, а также увеличили их количество. Блок предсказания переходов делает больше предсказаний за такт, а также с большей точностью. Все это увеличивает пропускную способность блока предсказания переходов.
Пропускная способность кэша инструкций L1 удвоена, а задержка уменьшена. Блок декодирования по-прежнему имеет ширину 4-way, но теперь их два. На стороне блока исполнения теперь шесть ALU вместо прежних четырех в Zen 4, плюс три блока умножения.
Кэш данных L1 теперь имеет размер 48 кБ (32 кБ в архитектуре Zen 4). Увеличение емкости сопровождается расширением до 12-way, благодаря чему задержка загрузки сохранилась на уровне четырех тактов. Кэш L1D может выполнять четыре операции доступа чтения и две записи.
Объем кэша L2 по-прежнему составляет 1 МБ на ядро, но при ширине 16-way он обеспечивает вдвое большую пропускную способность. Таким образом, в иерархии кэшей AMD удваивает пропускную способность от кэша L2 к блокам с плавающей запятой.
Теперь блоки с плавающей запятой полные 512-битные. Что позволяет AMD выполнять наборы инструкций AVX-512 на полной тактовой частоте.
Архитектура RDNA 3.5
Архитектура RDNA 3 впервые увидит свет в APU AMD, таких как серия Ryzen AI 300. Процессоры Ryzen 9000, напротив, остаются с интегрированным графическим блоком RDNA 2, что вполне разумно для их области применения. Процессоры для настольных ПК нацелены лишь на обеспечение самых простых графических возможностей. А процессоры Ryzen AI 300 (Strix Point) – это совсем другая история.
По сравнению с настольной реализацией архитектуры RDNA 3, AMD внесла несколько незначительных изменений в RDNA 3.5, но они в основном связаны с тем, что архитектура предназначена для мобильных процессоров. По словам AMD, компания извлекла выгоду из сотрудничества с Samsung, а южнокорейский производитель чипов получил соответствующую лицензию от AMD и внедрил графику RDNA в свои SoC.
Внесенные изменения касаются удвоения частоты выборки текстур, а также удвоения частот интерполяции и сравнения. То есть AMD внесла некоторые коррективы, которые мы также увидим в архитектуре RDNA 4 и которые устраняют ограничения RDNA 3.
Кроме того, контроллер памяти архитектуры RDNA 3.5 рассчитан на работу с LPDDR5, а также оптимизирован в области доступа к кэшу. AMD старается выполнять как можно меньше обращений к основной памяти и хранить необходимые данные в кэше.
Как мы уже видели в разделе, посвященном процессорам Ryzen AI 300, AMD показывает прирост производительности от 19 до 32% по сравнению с интегрированной графикой на базе RDNA 2 (Hawk Point) при мощности 15 Вт.
XDNA 2 NPU с 50 TOPS
AMD уже представила NPU в процессорах Ryzen 7040 под названием Phoenix, но он не использовался из-за отсутствия программной поддержки, а также оказался не таким быстрым, как планировалось, из-за ошибки (эта ошибка была исправлена только в Hawk Point). В Strix Point установлен NPU на основе архитектуры XDNA-2, который при 50 TOPS должен быть даже быстрее, чем у процессора Intel Lunar Lake, а также выигрывает у Snapdragon X Elite от Qualcomm.
Суммарная производительность | NPU | CPU | GPU | |
Intel Lunar Lake | 120 TOPS | 48 TOPS | 5 TOPS | 67 TOPS |
Intel Meteor Lake | 32,2 TOPS | 10,6 TOPS | 2,82 TOPS | 18,8 TOPS |
Qualcomm Snapdragon X Elite | – | 45 TOPS | – | – |
Ryzen 7040 (Phoenix) | 33 TOPS | 10 TOPS | – | – |
Ryzen 8040 (Hawk Point) | 39 TOPS | 16 TOPS | – | – |
Ryzen AI 300 (Strix Point) | – | 50 TOPS | – | – |
AMD не оставляет сомнений в том, что в 2024 году и далее будет устанавливать в чипы NPU. Интересно, что NPU будет отсутствовать в процессорах Ryzen 9000. Но в настоящее время все внимание всех трех производителей CPU сосредоточено на ноутбуках с Copilot+.
Однако и AMD NPU не возьмет на себя все задачи, хотя NPU вполне способен выполнять «тяжелые» вычисления ИИ. Пока, однако, основное внимание уделено фоновым задачам в области аудио и видео (видеоконференции). Более «тяжелые» задачи, такие как генерация изображений ИИ, пока будут выполнять на GPU.
По словам AMD, для архитектуры XDNA-2 был выбран иной подход, чем у Intel и Qualcomm. Однако основной режим работы AMD сравнивает с ядрами CPU, что не соответствует тому, как работают NPU других производителей.
При описании архитектуры XDNA-2 мы обратили внимание на то, что AMD разработала собственную иерархию вычислений для движков ИИ (AIE), которая опирается, в том числе, на программируемые межсоединения. Вычисления ИИ можно выполнять на определенном количестве AIE. То есть можно выбрать все AIE или только определенное количество столбцов. AMD называет такой подход пространственным разделением, чтобы на NPU могли одновременно работать разные приложения – например, аудио/видео в реальном времени и LLM. Однако, как и в других NPU, можно запускать разные приложения друг за другом, разделяя доступ по времени.
Чтобы необходимые данные не передавались каждому AIE раздельно, в узлах имеются коммутаторы, которые могут копировать необходимые данные несколько раз, так что повторное обращение к памяти не требуется. AIE можно назначить на другие задачи в режиме реального времени, если предыдущая задача была завершена.
Для увеличения вычислительной производительности AMD также увеличила количество AIE с 20 до 32. Кроме того, NPU имеет на 60% больше кэша, два MAC на AIE и другие улучшения. Таким образом, производительность Phoenix с 10 TOPS и Hawk Point с 16 TOPS увеличивается до 50 TOPS. Для повышения эффективности отдельные группы AIE и даже отдельные AIE можно отключать через Power Gating.
Еще одним важным компонентом архитектуры XDNA 2 стал новый тип данных, который вводит AMD. А именно Block FP16, который будет доступен для разработчиков программного обеспечения уже в третьем квартале. Преимущество использования Block FP16 заключается в том, что с этим типом данных производительность идентична 8-битным типам данных (FP8, INT8), но должен точность будет почти такая же, как у 16-битных типов данных (FP16, INT16).
Производство по техпроцессам 4 и 3 нм
Архитектура Zen 5 найдет применение в процессорах Ryzen AI 300, Ryzen 9000 и EPYC. Процессоры Ryzen AI 300 используют один монолитный кристалл, но в случае CPU Ryzen и EPYC, как обычно, применяют дизайн чиплетов.
Для процессоров Ryzen AI 300 и Ryzen 9000 AMD выбрала 4-нм техпроцесс TSMC (N4P). Также были упомянуты некоторые улучшения в металлическом слое, хотя тактовые частоты существенно не увеличатся, по крайней мере, для процессоров Ryzen 9000.
Интересно отметить, что AMD также говорит о процессорах Zen 5, изготовленных по техпроцессу 3 нм. Однако AMD не уточнила, какие именно это будут чипы. Возможно, AMD будет использовать 3 нм для CCD с ядрами Zen 5c. Но, по слухам, существует и дизайн с ядрами Zen 5. Однако на Tech Day не было никакой дополнительной информации об этом.
Серия Ryzen 9000 или Granite Ridge
Одной из самых важных новинок для потребителей и, в частности, наших читателей, являются процессоры Ryzen 9000. Они уже были представлены на выставке Computex. В плане базовых спецификаций ничего не изменилось.
Модель | Ядра / Потоки |
CCDs | Макс. частота | Кэш L2 | Кэш L3 | Память | TDP |
---|---|---|---|---|---|---|---|
Ryzen 9 9950X | 16 / 32 | 2 | 5,7 ГГц | 16x 1 Мбайт | 2x 32 Мбайт | DDR5-5600 | 170 Вт |
Ryzen 9 9900X | 12 / 24 | 2 | 5,6 ГГц | 12x 1 Мбайт | 2x 32 Мбайт | DDR5-5600 | 120 Вт |
Ryzen 7 9700X | 8 / 16 | 1 | 5,5 ГГц | 8x 1 Мбайт | 32 Мбайт | DDR5-5600 | 65 Вт |
Ryzen 5 9600X | 6 / 12 | 1 | 5,4 ГГц | 6x 1 Мбайт | 32 Мбайт | DDR5-5600 | 65 Вт |
Слухи о том, что Ryzen 7 9700X будет модернизирован с 65 до 120 Вт, не подтвердились. В принципе, можно сказать, что AMD теперь использует режим Eco в качестве стандартного для некоторых моделей. Как уже говорилось выше, процессоры Ryzen 9000 выйдут 31 июля. Однако на данный момент AMD все еще не называет цену.
Однако AMD раскрыла еще несколько деталей. Процессоры Ryzen 9000, имеют на 15% меньшее тепловое сопротивление и на 7 °C меньшую температуру при том же TDP. Однако причина кроется не в изменении распределителя тепла или структуры корпусировки, а в оптимизации Floor Plan, то есть расположения ядер. AMD смогла более эффективно избежать горячих точек и лучше распределила температурные датчики.
Вместе с новыми процессорами выйдет и новая версия AGESA, большая часть которой уже поставлена производителями материнских плат. Помимо прочего, тактовую частоту памяти увеличат до 8000 MT/s.
Что касается разгона процессоров, то здесь все осталось по-прежнему. Однако появились новые функции памяти, например, разгон памяти «на лету», поскольку у платформы Intel это уже есть. Пользователь может переключаться между несколькими профилями через Ryzen Master, не выключая компьютер. Например, выбрать низкие тайминги для игр или более высокую тактовую частоту для приложений, требующих высокой пропускной способности памяти. Информация хранится в профилях Memory Optimised Performance Profiles. Теоретически AMD может поддержать эту функцию для процессоров Ryzen 7000 – достаточно внести небольшие изменения в прошивку. Неизвестно, будет ли AMD в дальнейшем предлагать Memory Optimised Performance Profiles. По словам представителей компании, сбор отзывов продолжают.
Новая функция разгона – Curve Shaper. Это функция, с помощью которой можно более точно настроить кривую напряжение-частота. PBO (Presicion Boost Overdrive) также получила дополнительные улучшения. И для Curve Shaper, и для Memory Optimised Performance Profiles верно одно: поддержка на старте будет только у процессоров Ryzen 9000. Теоретически, поддержка может появиться и у предшественников.
Ожидаемые в сентябре материнские платы 800-й серии, особенно с чипсетами X870E и X870, получат улучшенную маршрутизацию дорожек от сокета к слотам DIMM. Что также позволит повысить тактовую частоту памяти.
Материнские платы с чипсетом B850 можно назвать улучшенной альтернативной предыдущим платам A620. Здесь также возможен разгон процессора и памяти. Для материнских плат с чипсетом B840 остается только разгон памяти.
Уже неоднократно подчеркивалось, что AMD будет поддерживать сокет AM5 как минимум до 2027 года. В частности, на Zen 5 Tech Day AMD заявила, что поколения Zen будут поддерживать Zen 4, Zen 5, Zen 6 и Zen 7. Это означает, что за серией Ryzen 9000 последует как минимум два поколения.
Соответственно, AMD также спроектировала AM5 для дальнейшего развития в области памяти DDR и линий PCI Express.
Перейдем к некоторым бенчмаркам производителя: независимые тесты будут доступны не позднее 31 июля. На диаграммах, представленных AMD, Ryzen 9 9900X опережает Core i9-14900K по производительности в приложениях и играх. Поддержка AVX-512 дает явное преимущество, особенно в приложениях, которые его используют. Интересно, что здесь AMD «лидирует» только с процессором Ryzen 9 9900X. Ryzen 9 9950X, скорее всего, будет еще немного быстрее.
С остальными моделями дело обстоит следующим образом: Ryzen 7 9700X обгоняет Core i7-14700K, Ryzen 5 9600X – Core i5-14600K. AMD проводит странное сравнение с Ryzen 7 9700X, который в среднем на 12% быстрее Ryzen 7 5800X3D, но есть и игры, которые на новой модели идут медленнее. AMD делает акцент на том, что Ryzen 5 9700X обходится 65 Вт, в то время как Ryzen 7 5800X3D требует 105 Вт.
Ryzen AI 300 или Strix Point
На выставке Computex компания AMD также представила процессоры Ryzen AI 300. Несколько больше подробностей мы узнали на Zen 5 Tech Day.
Модель | Ядра / Потоки |
Тип ядра | Базовая частота | Частота Boost | Кэш | TDP | cTDP | CUs |
---|---|---|---|---|---|---|---|---|
Ryzen AI 9 HX 370 | 12 / 24 | 4x Zen 5 8x Zen 5c |
2,0 ГГц | 5,1 ГГц | 36 Мбайт | 28 Вт | 15 – 54 Вт | 16 |
Ryzen AI 9 365 | 10 / 20 | 4x Zen 5 6x Zen 5c |
2,0 ГГц | 5,0 ГГц | 32 Мбайт | 28 Вт | 15 – 54 Вт | 12 |
Strix Point имеет ядра Zen 5 и Zen 5c, которые AMD упаковывает в классический и компактный кластер. На Tech Day AMD много говорила об искусственном интеллекте – как и все компании, производящие аппаратное и/или программное обеспечение в настоящее время.
По этой причине AMD, видимо, сочла нужным подчеркнуть, что производительность процессора не связана с производительностью ИИ. Как мы уже видели в собственных бенчмарках производителя и первых утечках, производительность интегрированного GPU значительно выше, чем у конкурентов и предшественника.
Систему управления питанием адаптировали для дальнейшего повышения эффективности. Phoenix и Hawk Point были в большей степени рассчитаны на максимально возможную тактовую частоту, в то время как Strix Point использует другой подход. Здесь больше C-состояний (Active Power Down C-States C8 и C11), но переключение между ними не обязательно происходит чаще, ведь переключение всегда означает, что придется задействовать ресурсы.
NPU можно отключать (даже его части), как и отдельные ядра CPU. Межсоединения также потребляют много энергии в режиме бездействия, здесь внесли оптимизации с помощью интеллектуального управления питанием. Впрочем, больше никаких подробностей не приводится.
AMD также приводит собственные бенчмарки для процессоров Ryzen AI 300, которые изменились лишь в некоторых деталях по сравнению с показанными на Computex значениями или проводились на другом оборудовании. Обновление до двенадцати ядер, естественно, помогает AMD с многопоточной производительностью. Благодаря сильной архитектуре Zen 5 однопоточная производительность также находится на высоком уровне. Уже были признаки того, что архитектуру RDNA 3.5 начнут использовать в Radeon 890M.
ИИ не должен затмевать собой все остальное
На Tech Day доминировала одна тема: искусственный интеллект. Для нас это сюрпризом не стало, но в очередной раз было жаль, насколько другие темы отодвинуты на задний план. На самом деле, создавалось ощущение, что даже процессоры Ryzen 9000 отодвинули на задний план по сравнению с серией Ryzen AI 300 – флагманский продукт этого года, по крайней мере, до выхода моделей X3D.
Вся приведенная выше информация об архитектуре Zen 5 и RDNA 3.5, а также другие подробности – это далеко не полный перечень того, что AMD может предложить в плане информации, но больше сообщить было просто нечего. До выхода процессоров Ryzen 9000 мы не ожидаем никаких других подробностей, кроме цены. Однако мы, по крайней мере, сможем получить в тестах собственное представление о том, как будет вести себя, например, быстрая оперативная память и какое влияние окажет новая классификация TDP на сравнение с CPU Intel.
Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).
Мы рекомендуем ознакомиться с нашим руководством по выбору лучшего процессора Intel и AMD на текущий квартал. Оно поможет выбрать оптимальный CPU за свои деньги и не запутаться в ассортименте моделей на рынке.