Процессоры Intel Core i9-7940X и i9-7960X: 14 и 16 ядер в рамках платформы LGA2066

Мeтoдикa тeстирoвaния кoмпьютeрныx систeм oбрaзцa 2017 гoдa

В нaчaлe этoгo гoдa мы пoзнaкoмились сo стaршим прoцeссoрoм для услoвнo-нaстoльнoгo сeгмeнтa: Core i9–7980XE Extreme Edition. С тoчки зрeния абстрактного технического прогресса его появление сложно переоценить: ранее HEDT-платформа Intel ограничивалась максимум 10 ядрами, поскольку на нее шли лишь «младшие» кристаллы серверных семейств, но с выпуском Skylake-X появились и Core i9 на «среднем», включающий уже 18 ядер. Причем новое семейство оказалось достаточно плотным, поскольку компания в его рамках запустила пять моделей процессоров с шагом в 2 ядра, включая и вышедший в первой волне Core i9–7900X (он использовал более простой кристалл). И лишь этот Core i9–7900X имеет рекомендованную цену в $999, когда-то характерную для экстремальных процессоров, а остальные заметно дороже. Соответственно, если привязываться к стоимости, то аналогов на рынке эти модели не имеют: AMD со своим HEDT-семейством официально укладывается в «штукубаксов». Тем не менее, среди моделей AMD Threadripper есть процессоры с 12 и 16 ядрами, т.   е. каждое ядро покупателю достается существенно дешевле, чем в продуктах Intel.

Другой вопрос — насколько эти ядра покупателю вообще нужны. «Настольное» программное обеспечение утилизирует «сверхмногоядерность», мягко говоря, далеко не всегда. Причем даже если программа формально является многопоточной, фактически это «много» до сих пор может означать, например, «четыре». При этом интерактивному ПО нужно обеспечить хотя бы один быстрый поток, который мог бы реагировать на действия пользователя без задержек, а для этого желательно иметь быстрые ядра — и по архитектуре, и по частоте. Но много «быстрых» ядер будут иметь слишком высокое энергопотребление и тепловыделение, и полностью решить эту проблему не удастся никогда, а «турбонаддув» лишь сглаживает ее. Да и микроархитектура Skylake-X весьма специфическая: рассчитана она как раз на многоядерные процессоры специального назначения, но имеет много отличий от того, что все привыкли видеть в Core последние 10 лет и подо что, собственно, оптимизировались все программы в течение этого времени.

С другой стороны, так или иначе, а весь привычный софт работать будет. И появление подобного семейства интересно уже тем, что можно взглянуть на ПО с другой стороны: проверить, как оно масштабируется.

Конфигурация тестовых стендов
Процессор
Intel Core i9–7940X
Intel Core i9–7960X
Intel Core i9–7980XE
Название ядра
Skylake-X
Skylake-X
Skylake-X
Технология производства
14 нм
14 нм
14 нм
Частота ядра, ГГц
3,¼,3
2,8/4,2
2,6/4,2
Количество ядер/потоков
14/28
16/32
18/36
Кэш L1 (сумм.), I/D, КБ
448/448
512/512
576/576
Кэш L2, КБ
14×1024
16×1024
18×1024
Кэш L3, МиБ
19,25
22
24,75
Оперативная память
4×DDR4–2666
4×DDR4–2666
4×DDR4–2666
TDP, Вт
165
165
165
Количество линий PCIe 3.0
44
44
44
Цена

В наши руки попало еще два Core i9 «старшей» подлинейки, так что для полного комплекта не хватает только 12-ядерного i9–7920X. Впрочем, он не так уж и нужен: все эти процессоры основаны на одном кристалле и отличаются лишь количеством активных ядер и блоков кэш-памяти третьего уровня. Ну, и частотами, конечно, тоже — однако с ними в современных условиях все не так просто. В частности, максимальная частота у процессоров практически одинаковая (с точностью до 2%), но она в наших тестах практически никогда не достигается вследствие отсутствия однопоточной нагрузки. А все остальное будет определяться количеством реально задействованных ядер. В каких-то случаях процессоры вообще будут вести себя одинаково с точки зрения производительности и энергопотребления, в каких-то — немного по-разному. И обе эти ситуации нам интересны.

Процессор
Intel Core i7–7800X
Intel Core i9–7820X
Intel Core i9–7900X
Название ядра
Skylake-X
Skylake-X
Skylake-X
Технология производства
14 нм
14 нм
14 нм
Частота ядра, ГГц
3,5/4,0
3,6/4,3
3,¾,3
Количество ядер/потоков
6/12
8/16
10/20
Кэш L1 (сумм.), I/D, КБ
192/192
256/256
320/320
Кэш L2, КБ
6×1024
8×1024
10×1024
Кэш L3, МиБ
8,25
11
13,75
Оперативная память
4×DDR4–2666
4×DDR4–2666
4×DDR4–2666
TDP, Вт
140
140
140
Количество линий PCIe 3.0
28
28
44
Цена

Помогут нам в этом три модели, основанные на младшем кристалле. В принципе, мы с ними уже давно и хорошо знакомы, так что заострять на них внимание не будем.

Процессор
Intel Core i5–8400
Intel Core i7–8700K
Название ядра
Coffee Lake
Coffee Lake
Технология производства
14 нм
14 нм
Частота ядра, ГГц
2,8/4,0
3,7/4,7
Количество ядер/потоков
6/6
6/12
Кэш L1 (сумм.), I/D, КБ
192/192
192/192
Кэш L2, КБ
6×256
6×256
Кэш L3, МиБ
9
12
Оперативная память
2×DDR4–2666
2×DDR4–2666
TDP, Вт
65
95
Количество линий PCIe 3.0
16
16
Цена

И еще добавим в сравнение двух представителей решений для массовой платформы — Core i5–8400 и i7–8700K. Почему именно такая пара? Core i5–8400 в психологическом смысле занимает сейчас позицию, на которой ранее находился i7–7800X (а еще ранее — младшие модели процессоров для LGA2011–3): это самый дешевый шестиядерный процессор Intel. Пожалуй, это вообще самый дешевый шестиядерный процессор на текущий момент: AMD Ryzen 5 1600 немного дороже (но и производительнее, конечно). Правда, то, что ядра бывают разными, ныне знают все, но нам просто интересно оценить, чем придется расплачиваться за экономию. А Core i7–8700K — в какой-то мере прямой конкурент i7–7800X, причем не только более дешевый, но и более производительный. Правда, он поддерживает меньший объем памяти, да и линий PCIe у него меньше, но этим его недостатки исчерпываются. Такой радикальной разницы, как во времена предыдущей версии HEDT-платформы, больше нет.

Методика тестирования

Методика подробно описана в отдельной статье. Здесь же вкратце напомним, что базируется она на следующих четырех китах:

Подробные результаты всех тестов доступны в виде полной таблицы с результатами (в формате Microsoft Excel 97—2003). Непосредственно же в статьях мы используем уже обработанные данные. В особенности это относится к тестам приложений, где все нормируется относительно референсной системы (AMD FX-8350 с 16 ГБ памяти, видеокартой GeForce GTX 1070 и SSD Corsair Force LE 960 ГБ) и группируется по сферам применения компьютера.

Игровые тесты мы сегодня использовать не стали, поскольку считаем применение Skylake-X в игровом компьютере бессмысленным, особенно учитывая уровень их цен. Понятно, что они справятся с такой нагрузкой, но на это способны и более дешевые модели. Лучше уж «вложиться» в видеосистему, да и прочую обвязку. А если игры являются побочной нагрузкой, то тем более ориентироваться на них не стоит — смотреть надо на основные сферы применения.

iXBT Application Benchmark 2017

В обзоре младшей тройки процессоров для LGA2066 мы отмечали их отличную масштабируемость в задачах такого рода. Увы, несложно заметить, что выше 10 ядер она «ломается»: 7940Х не сумел обогнать 7900Х и радикально отстал от 7960Х, который оказался самым быстрым. Собственно, будь у нас в наличии 7920Х, так он бы наверняка попросту отстал от 7900Х. В общем, разбиение задачи на большое количество потоков до сих пор оказывается сложным делом, а управление тактовыми частотами при такой нагрузке легко способно «помочь» как раз процессорам с меньшим количеством ядер. До 8–10 ядер все просто, да и то потому, что 8 потоков вычислений, например, на восьми же физических ядрах исполняются быстрее, чем на 4–6 ядрах с поддержкой в виде Hyper-Threading.

Представители компании любят повторять, что «Skylake-X — процессоры для датацентров», имея в виду, конечно, в первую очередь старшие Xeon для LGA3647, где ядер еще больше, да и контроллер памяти шестиканальный. Впрочем, «унюхав» подходящую задачу, процессоры на «младшем» и «среднем» кристаллах ведут себя аналогично «старшему» — архитектура-то одинаковая. Но и в данном случае хорошо заметно, что масштабируемость «младшего» намного лучше. Возможно и потому, что самые младшие процессоры на его базе компания специально ограничила, в результате чего они не столь уж убедительно выглядят на фоне Coffee Lake. Но хотя бы прирост от количества ядер в их случае весомый и заметный. Выше он тоже есть, но за счет влияния тактовой частоты становится уже куда менее линейным.

Два случая, когда много ядер просто не нужно. Во всяком случае, если считать, что «много» — это больше, чем в старших процессорах для массовой платформы. Причем если в работе с видео какой-никакой прирост производительности при увеличении количества ядер наблюдается (пусть и не всегда предсказуемый, и совсем нелинейный), то с фото все просто. Да и Core i5–8400 здесь бы вполне хватило, если бы не особенности Photoshop — в двух других программах он проиграл остальным испытуемым буквально процентов 10.

Распознавание многостраничного документа на практике превращается в много распознаваний одностраничных, т.   е. задача параллелится идеально. Примерно как 3D-рендеринг. Правда, после 10 ядер (и, соответственно, 20 аппаратных потоков) одновременно темпы увеличения производительности резко снижаются. Но это нормально.

А иногда бывает и такое — когда все Skylake-X неубедительно выглядят на фоне современных решений для массовой платформы. Здесь к тому же наблюдается странный экстремум результатов в районе 14 ядер — 16 было бы куда более понятным значением, так что нужно будет еще поэкспериментировать.

В части программ этой группы i9–7940X, напротив, проигрывает очень многим процессорам — в том числе, и близким родственникам. Но вообще эти приложения достаточно благосклонны к Skylake-X: в кои-то веки i7–7800X сумел обойти i7–8700K. Впрочем, при этом хорошо заметен перегиб в районе восьми ядер: производительность растет и дальше, но медленно, а вот до восьми — растет быстро.

В общем и целом, результаты такие. Сразу видно, что «шесть ядер» бывают разными — в чем и ранее сомнений не было, но мы это наглядно продемонстрировали. Более-менее «переварить» большее количество ядер современные программы могут, но о эффективном наращивании производительности можно говорить лишь при наличии не более чем 10 ядер, т.   е. в рамках «младшего» кристалла Skylake-X. На его базе выпускаются три процессора для LGA2066, а на среднем — четыре. Но если первую тройку еще можно как-то упорядочить разумным образом, то выше — разве что по цене:) Вот цена меняется линейно, как и количество ядер. А производительность — как попало.

Энергопотребление и энергоэффективность

Понятно, что сдерживающим фактором является потребление энергии и тепловыделение. В обзоре Core i9–7980XE Extreme Edition мы уже отмечали, что компании удалось удержать тепловыделение на том же уровне, что был присущ «младшему» кристаллу, хотя и его низким назвать не получается даже из вежливости. И это в штатном режиме (на самом деле, процессорам для LGA2066 «разрешено» запрашивать с VRM до 600 Вт)! А как охлаждать получившегося «огнедышащего монстра», да и справится ли с ним вообще плата и блок питания — это оставлено на усмотрение пользователя. Впрочем, в штатном режиме процессоры укладываются в те же 200 Вт, что и ранее. Правда, минимальные требования к системе охлаждения гарантируют даже меньший теплоотвод: 165 Вт начиная с i9–7940X и 140 Вт для i9–7920X и устройств на «младшем» кристалле. В принципе, первое почти однозначно адресует нас к системам жидкостного охлаждения, поскольку официально воздушные кулеры рассчитаны на рассеивание меньшего количества тепла.

И, кстати, поскольку производительность при этом все-таки растет (напомним, что энергопотребление мы измеряем одновременно с ней, а не в сферическом вакууме), то «средний» кристалл можно считать более энергоэффективным, нежели «младший», а Core i9–7980XE является лидером и по этому параметру —, но только в рамках платформы LGA2066, которую вообще сложно отнести к энергоэффективным. В этом смысле она проигрывает даже LGA2011–3, а все HEDT-платформы всегда отставали и от массовых.

Итого

В принципе, если кому-то еще оставалось непонятно, почему Intel во всех версиях HEDT-платформы ограничивалась только «младшими» кристаллами, то можно считать этот материал окончательной точкой. Почему в младшей тройке процессоров мы наблюдали неплохую масштабируемость? Да просто потому, что процессоры, способные одновременно выполнять восемь потоков вычисления, стали более-менее доступны массовому покупателю восемь-девять лет назад. Чуть позднее желающие смогли приобрести и шесть ядер, выполняющих до 12 потоков — подороже, но за сопоставимые деньги. Соответственно, у производителей программного обеспечения уже тогда появились стимулы при необходимости «утилизировать» и 8–10 потоков. А больше — только в каких-нибудь специализированных программах, с которыми редко сталкивается пользователь обычной настольной системы и даже необычной: после того, как в один сокет начало «помещаться» до восьми процессорных ядер, двухсокетные рабочие станции начали исчезать с рынка. А дальше простая арифметика: 8 потоков кода более эффективно «пережует» процессор с восемью физическими ядрами, нежели его массовый «собрат» с четырьмя + Hyper-Threading. Это все и наблюдали. А то, что такой 8-ядерный процессор мог работать и с 16 потоками, до последнего времени было неважно. Но как только обострилась конкурентная борьба и Intel вслед за AMD «двинул» процессоры с 12+ ядрами в условно-настольный сегмент — вот тебе, бабушка, и Юрьев день.

Очевидно, что со временем программисты смогут освоить любые ресурсы — главное их доступность. Но произойдет это не завтра, и, скорее всего, уже совсем на других системах. Пока же старшие модели Core i9, равно как и Ryzen Threadripper, на сколько-нибудь массовое распространение не претендуют. Некоторые покупатели, впрочем, из их появления могут извлечь немалую практическую пользу — ведь «сверхмногоядерность» подешевела, что при наличии для нее целевых задач как минимум не является недостатком. Остальных же на всякий случай придется отпугивать ценами — во избежание сильного удивления и проявления других эмоций после покупки 🙂

Еще одной проблемой платформы LGA2066 является высокое энергопотребление —, а следовательно, и тепловыделение. Мы обеспечили всем процессорам намного более комфортные условия по охлаждению, чем требует Intel (более 200 Вт вместо минимальных 140–165 Вт), однако… вполне возможно, что «старшей» четверке и этого мало. Поэтому в ближайшее время мы попробуем проверить, нет ли возможности улучшить производительность дальнейшими вложениями в систему охлаждения, «не трогая» настройки.

Комментирование и размещение ссылок запрещено.

Комментарии закрыты.