8 points par unohee 2026-03-31 | 3 commentaires | Partager sur WhatsApp

Présentation de VELA, un modèle de langage spécialisé pour le marché boursier coréen (KOSPI+KOSDAQ).

Il a été fine-tuné à partir de Qwen2.5-7B-Instruct via un pipeline SFT + DPO.

Pourquoi l’avoir créé
Les LLM financiers existants hallucinaient fortement sur la terminologie du marché coréen,
ou présentaient un problème de language leak en basculant vers le chinois ou l’anglais au milieu des réponses.
VELA corrige spécifiquement ces deux problèmes grâce au DPO.

Données d’entraînement

  • SFT : 36 713 échantillons / 2 135 titres (classification d’actualités, signaux de forte hausse/baisse, rapports de sociétés de courtage, tool calling, analyse sectorielle/macro, etc.)
  • DPO : 24 779 paires (suppression des fuites en chinois et en anglais, alignement du format Reasoning Trace)

Format de sortie

  1. Reasoning Trace – processus de raisonnement étape par étape au format JSON (searchanalyzeconfidence)
  2. Synthesis Report – rapport de recherche en 7 sections (résumé, indicateurs, flux, impact des actualités, risques, opinion d’investissement)

Performances (sur RTX 3060 12GB)

Format Vitesse Taille Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

Attention : pour une utilisation réelle, vous devez fournir au modèle des sources d’actualités et des données fiables. En l’absence de sources précises, des hallucinations peuvent se produire. Il est conçu pour être utilisé avec https://github.com/unohee/vela-framework .

Interfaces prises en charge
llama-cpp-python / Ollama / vLLM / Transformers / MLX

Licence : Apache 2.0

🤗 https://huggingface.co/intrect/VELA

Les cours en temps réel sont fournis via une API externe, et VELA a été conçu comme une couche de raisonnement au-dessus.
Il est destiné à fournir des informations, et non des conseils en investissement.

3 commentaires

 
310writer 2026-04-06

C'est impressionnant ^^

 
ahiou 2026-04-01

C’est impressionnant ! Est-ce que c’est stable même avec 7B ?

 
unohee 2026-04-01

Compte tenu de la taille du modèle, il est clairement meilleur que le modèle de base pour les tâches fondamentales. Il faudrait aussi publier les benchmarks !