Meta a déjà commencé à travailler sur Llama 4, avec une puissance de calcul nécessaire 10 fois supérieure à celle de Llama 3

xguru · 2024-08-08T09:31:01+09:00

Mentionné par Mark Zuckerberg lors de l’earnings call du T2 2024 Llama 3 est déjà en concurrence avec les modèles les plus avancés, et le développement de Llama 4 a déjà commencé L’objectif est d’atteindre le meilleur niveau du secteur l’an prochain L’entreprise planifie les clusters de calcul et les données nécessaires pour les prochaines années La puissance de calcul requise pour entraîner Llama 4 devrait être près de 10 fois supérieure à celle de Llama 3, et les futurs modèles continueront d’augmenter au-delà Il est difficile de prédire comment cette tendance évoluera, mais à ce stade, compte tenu des longs délais nécessaires pour mettre en service de nouveaux projets d’infrastructure, l’entreprise estime qu’il vaut mieux construire de la capacité avant d’en avoir besoin plutôt que trop tard En augmentant ces investissements, l’entreprise maintiendra l’efficacité opérationnelle à l’échelle de toute la société

(investor.fb.com)

3 points par xguru 2024-08-08 | 1 commentaires | Partager sur WhatsApp

Mentionné par Mark Zuckerberg lors de l’earnings call du T2 2024
Llama 3 est déjà en concurrence avec les modèles les plus avancés, et le développement de Llama 4 a déjà commencé
- L’objectif est d’atteindre le meilleur niveau du secteur l’an prochain
L’entreprise planifie les clusters de calcul et les données nécessaires pour les prochaines années
- La puissance de calcul requise pour entraîner Llama 4 devrait être près de 10 fois supérieure à celle de Llama 3, et les futurs modèles continueront d’augmenter au-delà
- Il est difficile de prédire comment cette tendance évoluera, mais à ce stade, compte tenu des longs délais nécessaires pour mettre en service de nouveaux projets d’infrastructure, l’entreprise estime qu’il vaut mieux construire de la capacité avant d’en avoir besoin plutôt que trop tard
- En augmentant ces investissements, l’entreprise maintiendra l’efficacité opérationnelle à l’échelle de toute la société

1 commentaires

brainer 2024-08-08

À l’origine, dans le deep learning, les ressources de calcul augmentaient en moyenne d’un facteur 10 tous les deux ans, donc je ne pense pas qu’il y ait de quoi être particulièrement surpris.

Meta a déjà commencé à travailler sur Llama 4, avec une puissance de calcul nécessaire 10 fois supérieure à celle de Llama 3

À lire aussi

1 commentaires