6 points par GN⁺ 2025-01-07 | 1 commentaires | Partager sur WhatsApp
  • Détection d’anomalies de séries temporelles : revue des dix dernières années

    • Avec les progrès des technologies de collecte de données et l’augmentation des flux de données en continu, l’importance de l’analyse des séries temporelles s’est renforcée. En conséquence, la détection d’anomalies de séries temporelles est devenue une activité clé dans des domaines variés tels que la cybersécurité, les marchés financiers, l’application de la loi et la santé.

    • La littérature traditionnelle en détection d’anomalies a surtout mis l’accent sur des mesures statistiques, mais la hausse des algorithmes d’apprentissage automatique ces dernières années exige des caractéristiques à la fois structurées et générales pour les méthodes de recherche en détection d’anomalies de séries temporelles.

    • Cette revue regroupe et résume les solutions existantes de détection d’anomalies dans le contexte des séries temporelles à l’aide d’une classification centrée sur les processus. Elle propose également une taxonomie originale des méthodes de détection d’anomalies, effectue une méta-analyse de la littérature, et donne un aperçu des tendances générales de la recherche en détection d’anomalies de séries temporelles.

1 commentaires

 
GN⁺ 2025-01-07
Commentaires Hacker News
  • La Matrix Profile de l’UCR est un outil très efficace pour l’analyse de séries temporelles. Pour trouver des motifs et des anomalies, elle ne nécessite pas d’ajuster la taille de fenêtre ni le seuil comme les méthodes traditionnelles, et peut être utilisée dans de nombreux contextes, de la donnée de capteurs de production à l’analyse ECG jusqu’à la détection de séismes.

  • Utilisation de la fonction offset de Prometheus pour définir une règle d’enregistrement de la moyenne hebdomadaire. Dans des systèmes où l’activité varie selon un cycle hebdomadaire, la moyenne d’une métrique est calculée puis comparée à la valeur actuelle afin de définir un seuil dynamique. GitLab fournit une explication détaillée de cette approche.

  • Cela ne prend pas en compte les travaux des dernières années. Un modèle basé sur les séries temporelles appelé Granite TS fonctionnait bien ; le modèle d’anomalies prévoit les N prochaines étapes, puis vérifie à quel point les mesures réelles s’écartent de la prédiction.

  • Dans le domaine des technologies de l’eau, les dispositifs IoT surveillent le débit, détectent les fuites et estiment la consommation d’eau par appareil. La détection de fuites consiste à identifier des anomalies de séries temporelles, et plusieurs distributions peuvent être nécessaires selon la saison en raison de la variation de température des canalisations.

  • J’ai essayé d’appliquer la détection d’anomalies dans un projet de suivi de performances, mais il n’y a pas de solution open source ou commerciale adéquate. Il y a beaucoup d’opportunités dans ce domaine.

  • La complexité de la génération de données, l’imperfection des systèmes de mesure, et les interactions avec des acteurs malveillants causent des comportements anormaux. Ces événements apparaissent comme des anomalies dans les données collectées.

  • Je gère une startup de détection d’anomalies de séries temporelles pour les machines industrielles et développe une solution qui fonctionne hors ligne. Si vous êtes intéressé par les logiciels industriels sensibles à la sécurité, n’hésitez pas à me contacter.

  • Les travaux de Eamonn Keogh sur le TSAD sont intéressants.

  • Je suis perplexe sur la raison pour laquelle le SVM est classé comme « Distribution-Based ». En général, il n’est pas censé estimer une densité sans modèle ou une distribution basée sur un modèle.

  • Il y a 10 ans, pendant mon master, j’ai construit un système de prévision de pannes en ligne et développé un système qui détecte et agit avant que l’exception n’apparaisse. J’avais beaucoup de travail à faire dans ce domaine, mais je ne peux pas m’y replonger.