Бескомпромиссный процессор для интерактива в короне

Автор
Сообщение
На сайте c 29.01.2014
Сообщений: 98
г.Воронеж
Цитата Kenzo80:
В смысле? 170000 это вменяемые деньги?

За такую производительность да. Тем более, что это не 5000-7000 баксов за xeon W-3275. Можно ли за 170000 эти деньги купить что то мощнее, или хотя бы сопоставимое?

На сайте c 22.04.2017
Сообщений: 960

Цитата t0931:
Цитата Kenzo80:
В смысле? 170000 это вменяемые деньги?

За такую производительность да. Тем более, что это не 5000-7000 баксов за xeon W-3275. Можно ли за 170000 эти деньги купить что то мощнее, или хотя бы сопоставимое?

учитывая что топовый процессор в линейке epic 2 поколения от амд стоит 7000 долларов и у него 64 ядра и 128 потоков в турбобусте их частота 3.2,то такие же деньги покупать ксеон как-то не айс.

Да,ксеон можно гнать,на при рендере кол-во потоков попредпочтительнее...В добавок этот ксеон не масштабируемый,а этот epic поддерживает двухпроцессорные системы,но это удовольствие будет стоить слишком много...

На сайте c 31.03.2011
Сообщений: 9936
Renderfarm
egor98 с эпиком все сложно, гнать можно только при помощи подключения спец приблуды в VRM, которая будут регулировать вольтаж, прямого разгона из биоса нет, смотрите канал der8auer и без кастомной воды делать это строго не рекомендуется, охлаждать надо не только камни, но и VRM, на охлад потратите еще тыщ 100-200, тепловыделение камней вырастает до  500 ватт при умеренном разгоне с каждого, при экстремальном до киловатта с каждого
На сайте c 29.11.2010
Сообщений: 629
Уфа
Цитата Slazzo:
motnahp1 вы писали код под с/с++? всем насрать на что думает ОС, и очередь на кэш или память тоже зависит от софта,

То есть по вашему софт сам раскидывает нагрузку по потокам? ОС распределяет по потокам и процесс запрашивающий данные из КП 2го процессора может работать на 1м процессоре, только из-за того что ОС неправильно распределила потоки, т.е. взяла первый попавшийся свободный поток и воткнула туда этот процесс и скорость исполнения процесса упала до скорости шины между этими процами, не считая задержек. Запустите любой однопоточный процесс и увидите что это не процесс задает какие ядра загрузить собой, а ОС. Если бы софт сам задавал какой поток использовать (возьмем для примера 3dsmax), то вы бы не могли в диспетчере задач по своему применять загрузку потоков ("задать соответствие") к процессу.

ПС. Я давно уже не писал (лет 15 наверно), но не думаю что принципиально машинный код сильно изменился.

На сайте c 10.06.2008
Сообщений: 66
Россия

Аналогичная проблема на процессора Intel Xeon E5 4669. 

Приходится искать методики оптимизации рабочих процессов, никак иначе не выходит исправить ситуацию. 

Так же присматриваюсь к процессорам Threadripper 3970X. Судя по их производительности и частоте работы каждого ядра это должно исправить ситуацию. 

На сайте c 29.11.2010
Сообщений: 629
Уфа
Цитата AntonValiev:
Аналогичная проблема на процессора Intel Xeon E5 4669. 

Попробуй поиграться в БИОС с настройками "Cluster-On-Die", "Early snoop" и прочими, связанными с NUMA. Это должно снизить задержки.

Цитата AntonValiev:

Так же присматриваюсь к процессорам Threadripper 3970X. Судя по их производительности и частоте работы каждого ядра это должно исправить ситуацию. 

Ситуация не изменится, она лишь скомпенсируется более высокой частотой, бОльшим кэшем и меньшим расстоянием между кристаллами.

На сайте c 10.06.2008
Сообщений: 66
Россия
Цитата motnahp1:
она лишь скомпенсируется более высокой частотой, бОльшим кэшем и меньшим расстоянием между кристаллами.

Это ли нельзя назвать изменением ситуации? Насколько сильно она скомпенсируется? 

Если посмотреть на данные однопоточных задач Cinebench R15 у рипера 3970X то там в районе 200 балоов. На системе 4669 показывает 101. Не является ли это двукратной разницей? 

На сайте c 31.03.2011
Сообщений: 9936
Renderfarm
AntonValiev у трипперов в синебенче вообще какая то дичь в результатах, которая никак не соотносится с производительностью в рендер движках, в р15 у 3970x больше 7000, а в короне и вирее рендерит, как проц с 5200
На сайте c 29.11.2010
Сообщений: 629
Уфа
Цитата xpp_nd_ruphus:
AntonValiev у трипперов в синебенче вообще какая то дичь в результатах, которая никак не соотносится с производительностью в рендер движках, в р15 у 3970x больше 7000, а в короне и вирее рендерит, как проц с 5200

скорее всего это из-за объема кэша, т.е. в CB все влезает в огромный кэш и рендерит оч.быстро, а в чем-то более серьезном уже пассует. Либо все дело в "оптимизациях" под конкретный софт, т.е. в том же CB могут временно увеличивать частоту с выходом за пределы, т.к. время исполнения маленькое.

Цитата AntonValiev:
Это ли нельзя назвать изменением ситуации? Насколько сильно она скомпенсируется? 

нельзя просто взять и сказать что и насколько, т.к. в данном случае речь о межпроцессорной связи, которая иногда не связана с общей производительностью (например финального рендера). Если взять тот же CBr15, то 2-процессорная система на 2011-3 практически не теряет в производительности даже с одним модулем памяти (2й проц обращается к памяти 1го), т.е. в данном случае межпроцессорной связью вообще можно пренебречь. И по однопотоку так же тут невозможно судить об этом.

На сайте c 10.06.2008
Сообщений: 66
Россия

xpp_nd_ruphus Все тесты относительны и имеют некоторую погрешность из за многочисленных факторов. 

Тот же coronabench показал результаты процессора e5 4669 более лучшие по сравнению с платиной 8260. А в тестах короны, которая выложена здесь на сайте чуть более лучший результат показал как раз процессор 8260. (Не могу точно назвать цифры, давно проводились тесты)

Да и в целом одинаковые процессоры имеют не малый разбег по результатам. Планирую слезть с ксеона на что то более быстрое в однопоточных задачах, но пока не определился на что именно и пока, исходя из имеющихся данных Ryzen 3950 или риппер 3970X будут более предпочтительны для этого. 

На сайте c 29.11.2010
Сообщений: 629
Уфа
Цитата AntonValiev:
e5 4669

уточните, у вас v3 или v4? Кстати у них как раз таки как и у триппера 2 процессора, т.е. логически 2 кольцевые шины объединены шиной типа QPI ли IF. Вы даже можете сделать так что ОС будет думать что в системе стоит 4 физических процессора (узла).

На сайте c 10.06.2008
Сообщений: 66
Россия

Цитата motnahp1:
уточните, у вас v3 или v4?

Цитата motnahp1:
Вы даже можете сделать так что ОС будет думать что в системе стоит 4 физических процессора (узла).

Да, но что это может дать? 

На сайте c 29.11.2010
Сообщений: 629
Уфа
Цитата AntonValiev:
Да, но что это может дать? 

ОС будет нагружать соответствующую ноду, с обращением только к локальным сегментам этой ноды, т.е. обращение к КП соседнего процессора/кэша/памяти будет происходить гораздо реже и задержки должны снизиться. Попробуйте поставить "Cluster on DIE" и NUMA - enabled

Например во времена бума майнинга, я ставил режим CoD и производительность возрастала в 1.5 раза , т.к. ОС раскидывала 4 задачи на 4 процессора и все они использовали лишь свои сегменты и никто никому не мешал.

На сайте c 22.06.2017
Сообщений: 167

тоже столкнулся с такой проблемой. 9700k прекрасно работает в интерактиве, но рендерит никак. а вот 2х 2696 неплохо считает , но во время интерактива редактировать сцену не так комфортно. поставил -36 в настройках макса, но по моему ничего особо не поменялось. 

возможно если сделать хак буста , чтобы камни держали 3,8 по всем ядрам - это решит проблему? 

или просто не собирать сцены на нем, а только рендерить.

Upd

Хотя, прямо сейчас собираю сцену, -36 threads в короне ситуацию все же немногоулучшило. сложно точно сказать. ну хотя бы частота не так критично падает, когда начинаешь в мат эдиторе ковыряться

На сайте c 31.03.2011
Сообщений: 9936
Renderfarm

nogot хз у меня есть машины на 2696v3,  с интерактивом ни в вирее ни в короне проблем не наблюдаю от слова совсем, но и видюхи при этом 8 гиговые

и при этом проблем нет и на супер тяжелых сценах, 2696в3 с анлоком максимальным и шиной 104

PS на 8160es при более низких частотах так же проблем не вижу

На сайте c 22.06.2017
Сообщений: 167
Цитата xpp_nd_ruphus:
У меня на 2696 тоже там стоит 8гб видюха 1080
В целом вчера отключение потоков в короне помогло я считаю. А вот анлок не сделан , ещё.
А андервольтинг сделан? Если сделан , на сколько ? 
На сайте c 31.03.2011
Сообщений: 9936
Renderfarm
nogot насчет андервольта не в курсе, там биос кастомный, флешнул и все, тольео шину на 104 поднял сам, охлад супермикро 90мм, для этого сокета самое лучшее решение на воздухе, за кулера по 7к отдал в апреле за штуку
Читают эту тему: