- À l’occasion du premier anniversaire de la publication de la série Phi, qui a démontré le potentiel des small language models (SLM), Microsoft a annoncé une nouvelle famille de modèles optimisés pour le raisonnement et spécialisés dans la réflexion en plusieurs étapes
- Malgré leur nombre réduit de paramètres, ils affichent des performances comparables à celles de grands modèles
- Phi-4-reasoning : 14B paramètres, entraîné en SFT (Supervised Fine-Tuning) sur des données de raisonnement de haute qualité
- Phi-4-reasoning-plus : ajoute du RL (Reinforcement Learning) au modèle ci-dessus, avec une précision améliorée grâce à l’utilisation de 1,5 fois plus de tokens
- Phi-4-mini-reasoning : malgré une taille de 3,8B, surpasse des modèles plus de deux fois plus grands sur divers benchmarks mathématiques, et convient aux environnements mobiles et edge
- Dépasse en performances divers modèles comme OpenThinker-7B, Llama-3.2-3B et la famille DeepSeek-R1
- Des résultats comparables ou supérieurs à OpenAI o1-mini, avec une force particulière sur des tests centrés sur les mathématiques comme Math-500 et GPQA Diamond
- Ces modèles sont également proposés sous Phi Silica, une version optimisée pour les NPU sur les Copilot+ PC, permettant une exécution rapide et efficace dans l’environnement Windows
- Disponibles sur Azure AI Foundry et HuggingFace :
- Des API pour développeurs et des outils d’intégration locale sont également fournis, facilitant leur adoption dans divers environnements
Aucun commentaire pour le moment.