Fly.io propose désormais des GPU
(fly.io)L’IA, c’est vraiment génial
- Fly.io est un nouveau service de cloud public qui permet de placer de la puissance de calcul au plus près des utilisateurs.
- Il est désormais possible d’utiliser des GPU pour traiter des charges de travail IA dans un environnement d’edge computing.
- Fly.io permet d’exécuter au plus près des utilisateurs des applications full stack ou une plateforme de développement basée sur l’API Fly Machines.
Cas d’usage concrets avec les GPU de Fly.io
- Il est possible de déployer son propre code et ses modèles préférés sur le backbone cloud de Fly.io.
- Avec les GPU de Fly.io, il est facile de lancer en deux étapes une application GPU exécutant Ollama (les copains de la génération de texte).
- Vous pouvez déployer l’application en ajoutant une configuration à
fly.tomlpuis en exécutant la commandefly apps create sandwich_ai && fly deploy.
La vitesse de la lumière a ses limites
- Démarrer rapidement des GPU, c’est bien, mais Fly.io révèle toute sa valeur pour l’inférence à l’edge.
- On peut prendre l’exemple d’une application où l’utilisateur saisit les ingrédients disponibles dans sa cuisine et reçoit immédiatement une recette de sandwich.
- Fly.io dispose de GPU dans des datacenters du monde entier et permet d’exécuter le même programme dans toutes les régions compatibles GPU.
Seulement quand c’est vraiment nécessaire
- Les GPU sont de puissants dispositifs de traitement parallèle, mais ils ne sont pas bon marché.
- Vous pouvez ajouter une section
servicesau fichierfly.tomlpour définir comment l’application monte et descend en charge. - Il est possible de configurer cela pour ne pas payer le coût du GPU lorsque personne ne demande de recette de sandwich.
Détails
- Des GPU sont proposés dans plusieurs régions aux États-Unis, en Europe et à Sydney.
- Plusieurs options de GPU et de tarification sont disponibles, et par défaut chaque déploiement utilise huit cœurs CPU AMD EPYC.
- Il est possible d’attacher des volumes jusqu’à 500 Go, et des remises sont également proposées pour les instances réservées et les hôtes dédiés.
Avis de GN⁺ :
- Fly.io met l’accent sur l’amélioration de l’expérience utilisateur en proposant un service cloud innovant capable de traiter des charges de travail IA dans un environnement d’edge computing.
- Son offre basée sur les GPU propose une solution qui prend en compte à la fois la rapidité de l’inférence et l’efficacité des coûts, particulièrement adaptée aux applications nécessitant une forte puissance de calcul en temps réel.
- Ce service est une avancée très intéressante et utile, car il améliore l’accessibilité des technologies d’IA et peut aider les développeurs à créer de nouvelles applications innovantes.
1 commentaires
Avis Hacker News