xLSTMTime: Long-term Time Series Forecasting With xLSTM
- Ces dernières années, les modèles fondés sur les transformeurs ont affiché des performances remarquables en prévision multivariée de séries temporelles à long terme (LTSF). Ils restent toutefois confrontés à des problèmes tels que des besoins de calcul élevés, la difficulté à capturer les dynamiques temporelles et la gestion des dépendances de longue portée
- L’émergence de LTSF-Linear, avec sa structure linéaire simple, a montré des performances supérieures à celles des modèles fondés sur les transformeurs, conduisant à réévaluer l’utilité des transformeurs pour la prévision de séries temporelles
- Pour y répondre, cet article présente les résultats de l’application de l’architecture récente xLSTM (extended LSTM) à la LTSF. xLSTM présente un potentiel adapté à la LTSF grâce à un exponential gating et à une structure mémoire modifiée de plus grande capacité
- L’architecture LTSF que nous avons adoptée, xLSTMTime, surpasse les approches actuelles. Une comparaison des performances entre divers modèles de pointe et xLSTMTime sur plusieurs jeux de données réels démontre ses excellentes capacités de prévision
- Nos résultats suggèrent que des architectures récurrentes affinées peuvent constituer une alternative compétitive aux modèles fondés sur les transformeurs pour les tâches de LTSF, et qu’elles pourraient redéfinir le paysage de la prévision de séries temporelles
Le résumé de GN⁺
- Cet article introduit xLSTM pour dépasser les limites des modèles fondés sur les transformeurs et montre d’excellentes performances en prévision de séries temporelles à long terme
- xLSTMTime démontre des capacités de prévision supérieures aux modèles existants grâce à un exponential gating et à une structure mémoire modifiée
- Cette recherche remet en lumière le potentiel des architectures récurrentes pour la prévision de séries temporelles et propose une nouvelle alternative aux modèles fondés sur les transformeurs
- Parmi les projets aux fonctionnalités similaires, on peut citer Prophet de Facebook et DeepAR d’Amazon
1 commentaires
Avis de Hacker News
Il est vrai que ces dernières années, les modèles fondés sur les transformers ont attiré l’attention pour la prévision multivariée de séries temporelles à long terme, mais je me demande s’ils sont généralement meilleurs que les modèles qui ne reposent pas sur le deep learning.
D’après ce que j’avais compris, ce n’était pas le cas, même si je ne suis pas ce domaine de très près.
Les modèles de deep learning sont bons pour apprendre la saisonnalité, mais ont tendance à mal gérer les tendances complexes ou les chocs.
Les données économiques et financières ont souvent une saisonnalité simple et des tendances complexes, ce qui semble pénaliser assez fortement le deep learning.
Je suis d’accord avec cet article. Les bonnes architectures de séries temporelles en deep learning que j’ai utilisées ressemblaient plutôt à de simples extensions de MLP ou de réseaux récurrents, comme DeepAR ou N-BEATS, tandis que les architectures fondées sur les transformers étaient vraiment médiocres, y compris les modèles de fondation fondés sur des transformers qui affluent ces temps-ci.
Cela dit, même entre modèles de deep learning, les écarts de performance étaient très importants entre transformers, LSTM bidirectionnels, MLP classiques, VAE, etc.
Il disait que les architectures à base de transformers donnaient des performances correctes sur les tâches de séries temporelles avec relativement peu d’efforts par rapport aux modèles à arbres.
D’après ce que j’ai compris, avec un réglage suffisant des paramètres, les modèles à base d’arbres peuvent généralement battre les transformers. Mais des modèles comme TimeGPT obtiennent des performances correctes sans réglage poussé, ce qui les rend attrayants pour une implémentation rapide.
Une partie de mon travail consiste justement à construire des modèles de nowcasting et de prévision économiques. Je travaille sur des indicateurs économiques comme l’inflation et le PIB, ainsi que sur des indicateurs financiers comme la liquidité de marché.
Je n’ai pas encore lu l’article, mais j’adhère totalement au ton général selon lequel « les transformers sont excellents dans ce qu’ils font bien, mais les modèles de la famille LSTM restent aussi très précieux ».
Quel est le rapport avec le modèle de prévision météo fondé sur l’IA de Google ?
https://deepmind.google/discover/blog/graphcast-ai-model-for...
À noter que Graphcast surpasse toutes les prévisions déterministes globales traditionnelles, au moins pour la prédiction de grands motifs à l’échelle du globe. C’est sur des métriques comme Z500, pour des horizons d’environ 3 à 10 jours.
L’ECMWF dispose d’AIFS, dérivé de Graphcast, et il est très probable que lui, ou quelque chose de similaire, soit mis en production opérationnelle d’ici quelques années.
Si c’est présenté comme un outil de prévision, est-ce que cela ne s’applique pas à la classification d’événements dans les séries temporelles ?
Dommage que le lien vers le dataset dans l’article ne fonctionne pas. J’espère qu’il sera corrigé.
Les meilleurs modèles de séries temporelles en deep learning sont probablement internes aux hedge funds et non publics.
Ce qui fonctionne dans un hedge fund peut être mauvais dans d’autres domaines, où la quantité et la nature des données diffèrent et où les biais inductifs nécessaires sont moindres ou différents.
La prévision de séries temporelles fonctionne le mieux dans les domaines déterministes.
Parmi les techniques publiques de LLM, d’IA, de deep learning et de machine learning, aucune ne marche bien sur le marché actions. Vraiment aucune. J’ai tout essayé.
Si la méthode de prévision de séries temporelles de quelqu’un fonctionnait vraiment, il ne la publierait pas.
J’ai lu ça par erreur comme XSLT.
J’ai hâte de voir quelqu’un essayer de faire de la prévision boursière avec ça et perdre toute sa fortune.