Microsoft présente Phi-4, optimisé pour le raisonnement

xguru · 2025-05-02T11:36:01+09:00

À l’occasion du premier anniversaire de la publication de la série Phi, qui a démontré le potentiel des small language models (SLM), Microsoft a annoncé une nouvelle famille de modèles optimisés pour le raisonnement et spécialisés dans la réflexion en plusieurs étapes Malgré leur nombre réduit de paramètres, ils affichent des performances comparables à celles de grands modèles Phi-4-reasoning : 14B paramètres, entraîné en SFT (Supervised Fine-Tuning) sur des données de raisonnement de haute qualité Phi-4-reasoning-plus : ajoute du RL (Reinforcement Learning) au modèle ci-dessus, avec une précision améliorée grâce à l’utilisation de 1,5 fois plus de tokens Phi-4-mini-reasoning : malgré une taille de 3,8B, surpasse des modèles plus de deux fois plus grands sur divers benchmarks mathématiques, et convient aux environnements mobiles et edge Dépasse en performances divers modèles comme OpenThinker-7B, Llama-3.2-3B et la famille DeepSeek-R1 Des résultats comparables ou supérieurs à OpenAI o1-mini, avec une force particulière sur des tests centrés sur les mathématiques comme Math-500 et GPQA Diamond Ces modèles sont également proposés sous Phi Silica, une version optimisée pour les NPU sur les Copilot+ PC, permettant une exécution rapide et efficace dans l’environnement Windows Disponibles sur Azure AI Foundry et HuggingFace : Phi-4-reasoning Phi-4-reasoning-plus Phi-4-mini-reasoning Des API pour développeurs et des outils d’intégration locale sont également fournis, facilitant leur adoption dans divers environnements

(azure.microsoft.com)

3 points par xguru 2025-05-02 | Aucun commentaire pour le moment. | Partager sur WhatsApp

À l’occasion du premier anniversaire de la publication de la série Phi, qui a démontré le potentiel des small language models (SLM), Microsoft a annoncé une nouvelle famille de modèles optimisés pour le raisonnement et spécialisés dans la réflexion en plusieurs étapes
Malgré leur nombre réduit de paramètres, ils affichent des performances comparables à celles de grands modèles
Phi-4-reasoning : 14B paramètres, entraîné en SFT (Supervised Fine-Tuning) sur des données de raisonnement de haute qualité
Phi-4-reasoning-plus : ajoute du RL (Reinforcement Learning) au modèle ci-dessus, avec une précision améliorée grâce à l’utilisation de 1,5 fois plus de tokens
Phi-4-mini-reasoning : malgré une taille de 3,8B, surpasse des modèles plus de deux fois plus grands sur divers benchmarks mathématiques, et convient aux environnements mobiles et edge
- Dépasse en performances divers modèles comme OpenThinker-7B, Llama-3.2-3B et la famille DeepSeek-R1
- Des résultats comparables ou supérieurs à OpenAI o1-mini, avec une force particulière sur des tests centrés sur les mathématiques comme Math-500 et GPQA Diamond
Ces modèles sont également proposés sous Phi Silica, une version optimisée pour les NPU sur les Copilot+ PC, permettant une exécution rapide et efficace dans l’environnement Windows
Disponibles sur Azure AI Foundry et HuggingFace :
Des API pour développeurs et des outils d’intégration locale sont également fournis, facilitant leur adoption dans divers environnements

Microsoft présente Phi-4, optimisé pour le raisonnement

À lire aussi

Aucun commentaire pour le moment.