13900k WHEA ребуты/зависания

Автор
Сообщение
На сайте c 16.10.2017
Сообщений: 676
Цитата v01ce:

Сейчас скинул всё в сток, так чуть более стабильно работает система. Пока думаю, что делать, но работать на 128 невозможно. Как система работала без сбоев месяцами - ума не приложу.. может и правда какой нибудь контроллер медным тазом накрылся.

Мать на контроллер памяти давала 1.35 напряжение, контроллер несколько месяцев работал, а потом деградировал. Тот что SA. Попробуйте биос поменять, откатить. В этой матери - некоторые биосы ОЧЕНЬ неадекватные и как вам уже сказали - сильно завывышают напругу.

На сайте c 24.06.2014
Сообщений: 4507

Если посмотреть какую область занимает (SA) System Agent, то я не удивился бы что этот вольтаж еще и потребление и нагрев повышает )) Но это лишь в теории. Не тестил, лень.

На сайте c 12.10.2019
Сообщений: 184

Цитата rainmangrizzli:
Мать на контроллер памяти давала 1.35 напряжение, контроллер несколько месяцев работал, а потом деградировал. Тот что SA. Попробуйте биос поменять, откатить. В этой матери - некоторые биосы ОЧЕНЬ неадекватные и как вам уже сказали - сильно завывышают напругу.

Мне проще её сдать продавцу, чем ещё убивать месяцы на поиски проблемы.
Основной вопрос сейчас в том, что действительно косячит - память, проц или мать. Пока склоняюсь, что мать. Именно поэтому и пытаюсь методом исключения и замены двигаться дальше

Цитата Earanak:
. Если руками не настраивать то это все упирается в повезло/не повезло.

А я как раз и пытаюсь  не биться головой об стену, особенно там, где нет у меня компетенций и органичен временный ресурс на курение форумов, а вычислить проблемный элемент и заменить его. Есть у вас компетенции и время для этого - здорово, я вот прям завидую. В моём случае сейчас стоит проблема выявления косячных комплектующих и замена их на более предсказуемые. И если на том же годлайке у меня косяков не будет, мне проще во временный ущерб бюджету купить такую же железку, и забыть про проблему, чем ещё полгода настраивать и жить на форумах.

На сайте c 24.06.2014
Сообщений: 4507
Цитата v01ce:
где нет у меня компетенций и органичен временный ресурс на курение форумов

Я скидывал все настройки. Скрины с биоса.  Подробно описывал проблему. Чего там курить то, вбить руками пару вольтажей, вбить сопротивления  (попробовать 80-34-00, на скрине чуть другие) и проверить не ушла ли проблема. Тайминги можно не трогать. Только частоту и Gear1 режим указать.

Ну не знаю уж, какие пол года на форумах smiley-unknw.gif

SA может пойти ниже 1.25V, вплоть до 1.2V, чем ниже тем лучше.

Вольтаж SA/VDDQX/DRAM при запущенной системе можно смотреть через HWINFO64.

Ладно. Я уже не знаю что тут я могу больше сделать smiley-unknw.gif

На сайте c 12.10.2019
Сообщений: 184
Цитата Earanak:
Чего там курить то, вбить руками пару вольтажей

В том-то и дело, что вбил и не завелось. Совсем. Пробовал и по 10 раз перечитывал те посты.

Даже в стоке комп заводится с 10 раза только после обесточивания через розетку. Если в стоке не работает, не говоря уже о 3200+, то явно косяк, с которым можно убиться, чтобы решить проблему или просто выявить её, зафиксировать, и пусть с ней уже бъётся продавец. Я мазохист, наверное, но не настолько :)

Мы уже обсуждали, что возможно у меня вышел из строя контроллер памяти, но при смене материнки с памятью проблема вроде ушла. А т.к. память проверял всячески и она нормально ехала на другом компе и проходила все тесты аж на 4000 (тоже, кстати, был томагавк, но на 5900х), остаётся, что такая материнка. Ну зачем я должен пинать и уговаривать мёртвую лошадь, чтобы она встала, если её можно просто заменить на живую.

На сайте c 24.06.2014
Сообщений: 4507
Либо я проглядел где вы писали об том что уже пробовали мои настройки либо вы об этом впервые написали smiley-unknw.gif Ну тогда точно всё, не знаю чем помочь. Может и вправду с платой чет не так.
На сайте c 12.10.2019
Сообщений: 184

Цитата Earanak:
Либо я проглядел где вы писали об том что уже пробовали мои настройки либо вы об этом впервые написали  Ну тогда точно всё, не знаю чем помочь. Может и вправду с платой чет не так.

Я просто сейчас пытаюсь методом исключения выявить проблему. Если память работала и тесты проходила, если проц на другой материнке и с другой памятью вполне себе комфортно работает, то остаётся материнка. Самое удивительное для меня, что стресс тесты проходят, пока комп работает. и большой ОССТ, и там же линпак, и сайнбенч, и все, что пробовал. Если же включаю рендеринг - на этапе денойза или, что удивительно, сохранения картинки виснет напрочь.

Ну как вариант либо просто несовместимость чего то с чем то из этих 3х элементов

Цитата Earanak:
Может и вправду с платой чет не так.

У меня больше вопрос, как выявить косяк и понять, что именно работает некорректно.

Память я исключу тем что тупо куплю другой набор :)

Остаётся проц и материнка.

В прежней сборке машинка просто не хотела включаться после зависаний, пока не вытащишь питание из БП, что не есть показатель корректной работы. БП при этом  вроде как не самый фиговый - CoolerMaster MWE GOLD 1250W

Из чего я предполагаю, что с мат.платой всё же какая-то беда, при условии, что машина ловила постоянно криты KernelPower 41.

Но вставив проц аж в MSI Godlike (повезло, дали "покататься"), врубив DDR5 память на А-die на 5200 в автомате 4*32Гб, 3 дня был полёт идеальный. Без фризов и прочей нечисти. Но за последние 2 дня словил опять 2 WHEA, причём зависало уже не в конце рендера. а при его старте. А самое интересное - если раньше корректно можно было открывать тяжелую сцену и работать во второй открытой, параллельно слушая в фоне ютубчик, то сейчас ютуб тормозит так, будто проблемы с контактами динамика (шум, треск, будто елозят микрофоном по одежде вместо звука или как будто включаешь-выключаешь постоянно штекер), а мышка, подключённая по USB зависает или просто замедляется.

И в итоге я как-то совсем растерялся. При этом, я включал самые тяжелые тесты ОССТ на новой машинке, проверил память - полный порядок.

Если подскажут, хотя бы, как и чем сейчас можно выявить проблему, алгоритм - я бы прям вот благодарен был и в карму б накидал

На сайте c 24.06.2014
Сообщений: 4507

При проблемах с фризами, звуком, тормозами видео рекомендуют делать замер DPC Latency. Например через LatencyMon - https://www.resplendence.com/download/LatencyMon.exe  

Сама по себе программа тяжеловесная, и сама по себе может вызывать затупы. Обычно ее запускают на 2-3 минуты пока идет видео на ютубе. Или в момент начала тормозов. А потом уже сортируют столбцы в разных вкладках и смотрят что тормозило. Она показывает затупы в драйверах, аппаратные прерывания, проблемы с конкретными ядрами проца. Иногда помогает выяснить причину тормозов.

Обычно DPC Latency плавает в районе 50-150. Изредка может прострелить на миллисекунду nVidia Драйвер или Сеть до 300-400, ничего страшного. Страшно когда значения до 2000+ доходят. Вот когда до 2000+ доходит на каком нить системном драйвере или процессе типа SVHost/Ntoskrnl - тогда сложно определить причину. Так как на этих процессах куча всякого висит. Но обычно все равно помогает погуглить, например написать в гугле - "high dpc latency afd.sys". У меня только чего не бывало связано с ISR/DPC/Hard Pagefaults... И USB клава фризила весь комп и вебкамеры драйвер тормозил весь комп и ТВ-тюннер в PCI-E слоте тупил. Всякое бывало когда я ремонтом компов занимался.

Если есть проблема с планировщиком винды, кольцевой шиной проца или кэшом третьего уровня - можно попробовать отключить в биосе ВСЕ E-Ядра и посмотреть не исправиться ли ситуация с фризами и прочим smiley-unknw.gifЕсли исправиться, то копать в эту сторону как то. Пытаться крутить NB-частоту и Uncore вольтаж. Или смотреть версию винды или план электропитания в винде (который влияет на Intel Thread Director).

Вообще конечно... Найти бы мастера который этим займеться. И сдать на диагностику. Или сервисцентр адекватный. А то сидеть так долго можно еще гадать ))

Кстати на счет DDR5, у нее есть рудимент в виде ECC, не особо полноценного ECC, тем не менее... Если есть какие то траблы с IMC (КП) или самой памятью или самим механизмом коррекции. То может конвейер команд сбрасываться для корректировки. Из за чего могут появляться фризы и залипания звука в том числе. Правда это достаточно редкий эффект. Когда комп как бы на грани когда ECC еще вывозит но когда как бы уже ошибок такое количество что комп тупит. Но это уже больше про разгон и нюансы... Нюансов то много может быть. Я лишь наугад предполагаю. 

Читают эту тему: