2 points par GN⁺ 2024-12-07 | 1 commentaires | Partager sur WhatsApp
  • Collection Llama 3.3
    • Cette collection inclut le convertisseur et le dépôt d’origine de Llama 3.3
    • Mise à jour il y a 8 heures
    • Contient 1 élément au total

1 commentaires

 
GN⁺ 2024-12-07
Avis Hacker News
  • Les performances semblent similaires, voire légèrement meilleures, par rapport à Llama 3.2 405B

    • Selon Zuck, il s'agit de la dernière release de la série Llama 3, et Llama 4 devrait sortir en 2025
    • Cela rappelle la célèbre remarque de Steve Jobs à propos de Dropbox : « c’est une fonctionnalité, pas un produit »
    • Meta open source un modèle puissant, commoditise ainsi l’IA, et peut en retour renforcer les services de Facebook et Instagram
    • Il ne s’agit pas de vendre de l’IA, mais d’utiliser l’IA pour renforcer son cœur de métier
    • Le fait de le proposer en open source permet de bénéficier d’une adoption large et d’un développement étendu
  • Dans nos benchmarks, il obtient de meilleurs résultats que prévu

    • Nous allons creuser davantage, mais c’est impressionnant
  • La discussion continue autour d’un bon client desktop Mac « généraliste »

    • On veut utiliser Ollama, ChatGPT, Claude, Perplexity, etc.
    • On veut utiliser le chat IA dans diverses applications, et il n’est pas nécessaire qu’il s’agisse d’une application desktop
    • MacMind est sympa, mais coûte cher comme frontend pour d’autres API
    • La réponse « ne sois pas radin » est aussi raisonnable
  • Il affiche des performances comparables à GPT-4o sur plusieurs benchmarks

  • Des poids 4bit bitsandbytes, des GGUFs et les poids d’origine en 16bit ont été uploadés sur Hugging Face

    • Il est possible de fine-tuner Llama 3.3 70B deux fois plus vite avec moins de 48 Go de VRAM, tout en réduisant l’utilisation mémoire de 70 %
  • Le prix de 1M de tokens est suivi sur OpenRouter, et il baisse à chaque actualisation

  • L’open sourcing de Llama est un excellent exemple de la stratégie « Commoditize Your Complement »

    • Pour celles et ceux qui ne connaissent pas cette stratégie, un lien vers « Laws of Tech: Commoditize Your Complement » de Gwern est fourni
  • Questions sur le modèle Hugging Face

    • Peut-il être exécuté sur un laptop via JupyterLab ?
    • Quels sont les avantages ?
    • Peut-il être mis à jour régulièrement ?
    • Peut-il être fine-tuné pour un usage spécifique ?
    • Combien de temps et d’efforts faut-il pour fine-tuner le modèle ?
    • Demande d’une URL indiquant si Hugging Face fournit des réponses à ces questions
  • Meta dépasse continuellement les attentes en publiant des modèles open puissants pour viser OpenAI/Anthropic

    • Les grands gagnants sont les développeurs