LLM agent de 7B paramètres spécialisé pour l’analyse de l’actualité du marché actions coréen et la recherche en investissement
(huggingface.co)Présentation de VELA, un modèle de langage spécialisé pour le marché boursier coréen (KOSPI+KOSDAQ).
Il a été fine-tuné à partir de Qwen2.5-7B-Instruct via un pipeline SFT + DPO.
Pourquoi l’avoir créé
Les LLM financiers existants hallucinaient fortement sur la terminologie du marché coréen,
ou présentaient un problème de language leak en basculant vers le chinois ou l’anglais au milieu des réponses.
VELA corrige spécifiquement ces deux problèmes grâce au DPO.
Données d’entraînement
- SFT : 36 713 échantillons / 2 135 titres (classification d’actualités, signaux de forte hausse/baisse, rapports de sociétés de courtage, tool calling, analyse sectorielle/macro, etc.)
- DPO : 24 779 paires (suppression des fuites en chinois et en anglais, alignement du format Reasoning Trace)
Format de sortie
- Reasoning Trace – processus de raisonnement étape par étape au format JSON (
search→analyze→confidence) - Synthesis Report – rapport de recherche en 7 sections (résumé, indicateurs, flux, impact des actualités, risques, opinion d’investissement)
Performances (sur RTX 3060 12GB)
| Format | Vitesse | Taille | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
Attention : pour une utilisation réelle, vous devez fournir au modèle des sources d’actualités et des données fiables. En l’absence de sources précises, des hallucinations peuvent se produire. Il est conçu pour être utilisé avec https://github.com/unohee/vela-framework .
Interfaces prises en charge
llama-cpp-python / Ollama / vLLM / Transformers / MLX
Licence : Apache 2.0
🤗 https://huggingface.co/intrect/VELA
Les cours en temps réel sont fournis via une API externe, et VELA a été conçu comme une couche de raisonnement au-dessus.
Il est destiné à fournir des informations, et non des conseils en investissement.
3 commentaires
C'est impressionnant ^^
C’est impressionnant ! Est-ce que c’est stable même avec 7B ?
Compte tenu de la taille du modèle, il est clairement meilleur que le modèle de base pour les tâches fondamentales. Il faudrait aussi publier les benchmarks !