Прошу совета. Нестабильность системы в нагрузке.

Автор
Сообщение
На сайте c 10.07.2013
Сообщений: 4
Москва
Салют!

История такова, что в последние пару месяцев участились вылеты макса во время рендера. Вылетает по-разному: чаще с ошибкой, бывает синий экран с зависанием всего, реже - просто убивается процесс без каких-либо оповещений, и из последнего - полное отключение компьютера будто питание отключили. Если задавать последовательный рендер через Batch render, мог рендерить полчаса - час и потом слетал. Чем больше сцена, тем быстрее происходил вылет. Глобально макс вылетал всегда, но не часто, связи какой-то не видел. Копать начал с поиска корявых объектов в сцене и текстур, безрезультативность чего привела к зачистке макса и короны с переездом на более свежие версии, макс с 2020 на 2022, корону с 4й на 7ю. Вылеты участились ещё больше. Переустановил прежние версии, всё откатилось на состояние до переустановок. Следующей мыслью было - проблема с питанием в нагрузке и/или охлаждением.
Вспомнились проблемы после сборки этого ПК 2 года назад, когда с первого запуска система подлагивала и макс тоже слетал при рендере. Тогда я заменил БП на помощнее, обновил биос, и поставил в нём ограничения на частоту в 3,6MHz, и вольтаж в 1,1, что, как тогда казалось, решило проблемы.
К данному моменту сделал 2 вещи:
1. Во время рендера замерил температуру - перевалила за 103 градуса, при том что у моего проца рабочая температура до 95 градусов.
2. Повысил частоту до 4,2MHz и вольтаж до 1,25 - всё стало значительно хуже, рендер начинается, пару секунд картинка считается и потом макс слетает. Вылет с перегревом связать не могу, так как температура не успевает перерасти рабочую, вылетает раньше.
Сейчас вернул ограничения на прежние значения - всё как раньше, рендерит, слетает как до всех манипуляций. В любом случае буду менять термопасту и заменю кулер на получше (сейчас стоит базовый из коробки с процессором), организую получше продув корпуса. И биос обновлю.

Собственно вопрос в том, почему при урезании частоты и напряжения макс работает стабильнее? Проблема с питанием всё-таки? Что имеет смысл проверить?

Характеристики системы:
- AMD Ryzen 9 3900X,
- 64gb RAM (2х16 Kingston HyperX FURY Black, 2х16 Kingston Fury Beast Black RGB - последние добавил три месяца назад),
- Radeon RX 5500 XT,
- материнка ASRock X570 Pro4,
- БП Cougar GX 800W,
- Win10.

Буду рад любым советам и идеям. Заранее спасибо!
На сайте c 24.06.2014
Сообщений: 4507
Цитата isidzu:
Во время рендера температуру перевалила за 103 градуса
Цитата isidzu:
AMD Ryzen 9 3900X,

У него стоковый PL2 145вт.

Я не представляю что там надо за охлад поставить что бы он НАСТОЛЬКО грелся.

По моему даже если кусок сала положить на процессор он и то холоднее должен быть smiley-lol.gif

95 Градусов это уже Троттлинг (tJMAX). В идеале должен быть нагрев до 80 градусов.

Даже в душном корпусе, душной квартире, летом.

3900X/5900X/3950X/5950X жрут одинаково в рендере до 145вт.

Соответственно их охлаждать надо с помощью норм кулеров. А именно :

Dark Rock Pro 4 (именно Pro), Noctua NH-D14, NH-D15, Deepcool Assassin III, Deepcool AK620.

На худой конец любая 280мм вода, даже дешманская сойдет.

Если у вас что то из перечисленного стоит - то явно проблемы с установкой.

Либо нанесением пасты либо креплением либо забыли наклейку с подложки снять.

1.25V это много для 4.2Ггц. Хотя это зависит от того куда вы смотрите.

На VID (который уже учитывает VDroop) или на VCore который дает плата.

В общем то у меня был 3900Х и мне хватало 1.175 VID под 4.2Ггц при линейном LLC.

Только вот если вы долго рендрили при 95 градусах, то проц уже мог деграднуть, тогда напруга нужна выше.

Но в таком случае надо сначала решить проблему нагрева и охлаждения.

Цитата isidzu:
Собственно вопрос в том, почему при урезании частоты и напряжения макс работает стабильнее? Проблема с питанием всё-таки? Что имеет смысл проверить?

Короче - 4.2Ггц во время рендера для 3900X это уже разгон.

3900Х в стоке при нагрузке на 24 Потока рендрит в районе 3.9-4.0Ггц при 1.15V примерно.

Если вдруг вы ПОВЕЛИСЬ на маркетинговую уловку про 4.6Ггц то держу в курсе :

4.6Ггц это имеется ввиду однопоточный буст в легкой нагрузке при 1.4-1.5V на ядро.

То есть. Когда у вас загружено ядро процессора на половину (1 из 24 потоков).

То есть например когда вы сидите в Paint, Excel, иногда Браузере, Блокноте, Проводнике. Тогда да может самое удачное ядро (одно) прыгать до 4.6ггц. При нагрузке на все ядра - Вольтаж проседает, в том числе и из за VDroop, частоты тоже проседают. Соответственно 3900Х в стоке должен рендрить примерно на 4ггц при 1.15V (VID, после VDroop-а). И греться при этом на перечисленных мною кулерах выше 75 градусов - он не должен.

Внутри процессора порядка 40 датчиков. Часть из которых работают на внутренние нужды. Есть так называемые Hot Spot-ы которых вы можете и не видеть. К тому же там система предсказания нагрева есть. Все это сделано что бы уберечь процессор от повреждений. Когда вы видите температуру в 95 градусов - это уже плохо. Это уже уровень срабатывания троттлинга. Если плата/проц видят (или понимают наперед) что не смогут удержать температуру - они просто тушат систему. Либо она виснет. Либо Синий экран с ошибкой "Clock Watchdog чего-то там".

Если вы длительное время рендрили с такими температурами - то у вас уже может деграднул проц. Деграднул - не значит помер или покачеленный он теперь. Просто надо будет снизить частоту чутка. Починить охлад и все ок будет.

На тему деградации можете послушать - https://youtu.be/ExwP2j3mqCY?t=323  

Там как раз речь идет про деграднувший 3900Х smiley-biggrin.gif

На сайте c 10.07.2013
Сообщений: 4
Москва
Earanak, Огого! Очень обстоятельно! smiley-shok.gif Огромное Вам спасибо! smiley-give-rose.gif Буду мозговать. Этот комп был первый который я собрал, и думал тогда что кулера из коробки с процем хватит для него и какую-то пасту недорогую помню брал. Похоже при сборке накосячил либо с её нанесением, либо плёнку забыл снять, либо ещё что-то... Потому что вспоминаю, что видимо изначально всё было не очень хорошо, когда впервые на нём запускал макс, офигел от того что он до 95-97 греется при частоте 4600 в нагрузке. После ограничения тогда частоты до 3600 и вольтажа до 1,1 температура стояла в районе 88 градусов. Видимо за 2 года проблема с охлаждением стала более явной и скорее всего да, процессор деградировал. В общем-то заказал Deepcool Assassin III, пасту Arctic Cooling MX-4, через пару дней вскрою посмотрю как там у камушка дела. А до этого почитаю статью что Вы прислали и видосик.
Ещё раз, огромное спасибо! smiley-good.gif
Читают эту тему: