19 points par xguru 2025-07-17 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Moteur d’inférence basé sur Rust conçu pour exécuter rapidement des modèles d’IA sur les environnements Apple Silicon
  • Architecture hybride exploitant au choix des kernels GPU ou MPSGraph sous-jacent à CoreML
  • Utilise un format de modèle propriétaire, avec la possibilité de convertir et utiliser divers modèles comme Llama3 via l’outil lalamo
  • Surpasse généralement llama.cpp en vitesse, avec notamment un débit de traitement 13 fois plus rapide sur Qwen3-0.6B
  • Les bindings Swift, l’interface CLI et l’API Rust permettent un développement et une intégration flexibles
  • Sa conception modulaire et l’exploitation de la mémoire unifiée des appareils Apple maximisent les performances, tout en assurant la fiabilité et l’extensibilité grâce à des parcours d’inférence vérifiables

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.