1 points par GN⁺ 2024-02-25 | 1 commentaires | Partager sur WhatsApp

Échec de décompression Oodle dû à l'instabilité des processeurs Intel

  • RAD a identifié un problème pouvant provoquer des échecs de décompression d'Oodle Data ou des plantages dans les jeux créés avec l'Unreal Engine.
  • Ce problème affecte principalement les processeurs Intel 13900K et 14900K, et dans une moindre mesure les 13700, 14700 et processeurs associés.
  • Seule une petite partie de ces processeurs présente ce comportement.
  • Le problème résulte d'une combinaison entre les réglages du BIOS et les fréquences d'horloge élevées ainsi que la consommation électrique de ces processeurs, ce qui entraîne une instabilité du système et un comportement imprévisible sous forte charge.

Un problème matériel, pas un bug logiciel

  • Il ne semble pas qu'un bug logiciel dans Oodle ou Unreal soit à l'origine du problème.
  • Les réglages du BIOS sont trop optimistes, si bien que certains processeurs fonctionnent en dehors de leur plage de fonctionnement sous forte charge, avec des fréquences et une consommation électrique qui provoquent l'exécution d'instructions erronées.
  • La décompression d'Oodle Data doit effectuer des vérifications supplémentaires de l'intégrité des données, ce qui lui permet de détecter très rapidement les incohérences, contrairement à d'autres codes de gameplay, de simulation, d'audio ou de rendu.

Type d'échec fréquent au lancement des jeux basés sur Unreal Engine

  • Le type d'échec le plus courant est le message d'erreur "DecompressShader(): Could not decompress shader (GetShaderCompressionFormat=Oodle)".
  • Le problème ne touche pas uniquement Oodle, et les systèmes affectés par cette instabilité échouent également sur les programmes standards de benchmark et de stress test.
  • Les programmes qui sollicitent fortement le processeur sur de nombreux threads peuvent provoquer des plantages ou un comportement imprévisible.

Solutions de contournement pour résoudre le problème

  • Il n'y a pas d'accès aux informations du processeur permettant de diagnostiquer précisément la cause et la meilleure solution.
  • De nombreux fabricants de cartes mères/BIOS livrent des réglages qui poussent les processeurs en dehors de leur plage de fonctionnement sûre.
  • Comme seul un petit nombre de processeurs est concerné, certains utilisateurs ont réussi à retourner leur processeur au fabricant et à en obtenir un nouveau sans ce problème.
  • D'autres solutions de contournement nécessitent l'utilisation d'utilitaires de réglage ou la modification des paramètres du BIOS.
  • L'utilisation d'Intel XTU pour abaisser le multiplicateur des Performance Cores de x55 à x54 ou x53 est signalée comme une solution efficace pour de nombreuses personnes.

Recommandations de modification des réglages du BIOS

  • Si l'overclocking est activé, le désactiver, et éviter d'utiliser l'overclocking "AI" ou "automatique".
  • Rechercher sur ark.intel.com les limites correctes du processeur, puis régler les limites de puissance et la tension dans les plages de sécurité recommandées par Intel.
  • Désactiver les réglages BIOS de type "turbo amélioré" ou "multithreading amélioré", comme "ASUS MultiCore Enhancement" ou "ASUS Performance Enhancement 3.0".

Étapes supplémentaires de dépannage pour les cartes mères Intel, ASUS, Gigabyte et MSI

  • Installer Intel XTU et exécuter le test AVX2.
  • En cas d'échec du test AVX2, essayer les modifications spécifiques des réglages du BIOS pour les cartes mères ASUS, Gigabyte et MSI.

Pas de support direct pour les utilisateurs finaux

  • Il n'est pas possible d'assurer directement le support des utilisateurs finaux des jeux affectés par ce problème, et il est recommandé d'utiliser les canaux de support officiels de l'éditeur du jeu ainsi que des fabricants du processeur et de la carte mère.

Avis de GN⁺

  • Ce problème est important pour les utilisateurs de certains processeurs Intel, et il peut être nécessaire d'ajuster les réglages du BIOS pour assurer la stabilité du système.
  • Modifier les réglages du BIOS peut être risqué ; les utilisateurs doivent donc faire preuve de prudence et privilégier un support officiel.
  • Cet article fournit des mesures concrètes pour résoudre des erreurs logicielles causées par un problème matériel, et offre des informations utiles aux utilisateurs confrontés à ce type de difficulté.

1 commentaires

 
GN⁺ 2024-02-25
Avis Hacker News
  • Partage son expérience avec un AMD Threadripper 3970X et le processus de résolution du problème. A enquêté sur le problème en collaboration avec AMD pendant plusieurs mois et a reçu une compensation de la part d’AMD. Utilise désormais le système avec une image BIOS personnalisée fournie par AMD. Le problème semble relever de la responsabilité de Gigabyte.
  • Le CPU Intel 13900k était défectueux, et des problèmes survenaient avec les paramètres par défaut. Le système plantait fréquemment, et beaucoup de temps a été consacré à résoudre le problème. Le CPU a été remplacé et une demande de RMA (service de retour/réparation) a été faite auprès d’Intel, mais Intel a tenté d’esquiver la RMA en invoquant le support de Linux. La RMA a été menée via un organisme européen de protection des consommateurs, puis un nouveau système a été acheté et l’ancien vendu. N’a pas l’intention d’acheter des produits Intel à l’avenir.
  • Mentionne de façon sarcastique qu’il faudrait désactiver l’hyperthreading, le mode turbo, les états C, les cœurs d’efficacité, etc. pour atténuer les problèmes de sécurité, ce qui revient à revenir à un jeu de fonctionnalités vieux de 20 ans.
  • A monté un nouveau système avec un CPU i9 149kf et une carte mère Asus Formula, mais a rencontré des difficultés avant d’obtenir un fonctionnement stable. Avec les paramètres par défaut, il y avait des plantages de jeux, des échecs de compilation du noyau et d’emacs, entre autres. A stabilisé le système en limitant le turbo à 5.4GHz et en activant des réglages limitant la puissance maximale et la température. Le système est désormais stable, mais exprime sa déception de ne pas pouvoir exploiter pleinement les performances annoncées.
  • Évoque un billet classique de Raymond Chen.
  • Se remémore le problème du CPU Pentium III 1.13 GHz.
  • Le décompresseur Zstd est souvent le premier à interagir avec des données transmises via le réseau, ce qui le rend très sensible aux bit flips. Même avec les vérifications d’erreurs activées, il détecte les problèmes matériels plus souvent que d’autres processus. Zstd n’inclut qu’une somme de contrôle des données d’origine pour garantir leur intégrité, ce qui rend plus difficile de déterminer si les données compressées ont été corrompues.
  • Cela semble être une page créée pour répondre aux plaintes non sollicitées d’utilisateurs essayant de remonter des journaux d’erreurs « oodle ». Cela rappelle le cas de SQLite en 2006.
  • Partage son expérience après avoir acheté une carte mère ASUS TUF. Il voulait des fonctionnalités basiques, mais les réglages du BIOS poussaient à un overclocking excessif, ce qui l’a obligé à ajuster manuellement plusieurs paramètres, y compris les timings de la RAM.
  • Exprime sa surprise qu’Epic Games ait acquis RAD.