1 points par GN⁺ 2025-01-30 | 1 commentaires | Partager sur WhatsApp
  • Pourquoi DeepSeek doit passer en open source

    • DeepSeek est un laboratoire chinois de recherche en IA qui a développé R1, un modèle de raisonnement open source.
    • Il a mis au point, à faible coût, un modèle aux performances comparables à celles d’OpenAI, grâce à des méthodes d’entraînement innovantes.
    • En tant qu’entreprise chinoise, il devait passer en open source pour gagner la confiance du marché occidental.
    • L’open source n’est pas seulement une démarche technique, c’est aussi une démarche culturelle.
  • La marchandisation des modèles

    • Les modèles de LLM deviennent de plus en plus des commodités, avec des écarts de performance limités.
    • OpenAI reste le leader, mais des modèles open source comme DeepSeek R1 offrent des coûts bien plus bas.
    • Dans l’infrastructure, l’open source tend à l’emporter sur le long terme.
  • Les avantages de l’open source dans l’infrastructure

    • L’open source est moins cher et personnalisable, mais demande de la maintenance.
    • L’infrastructure a toujours besoin de personnalisation et, plus un produit est technique, plus les ingénieurs préfèrent l’open source.
    • Si des entreprises open source comme Lago réussissent, c’est parce que les ingénieurs peuvent gérer eux-mêmes des systèmes de facturation complexes.
  • L’avenir d’OpenAI

    • OpenAI occupe toujours une place importante sur le marché et conserve son avance sur les LLM et les modèles de raisonnement.
    • Certains affirment que des modèles comme DeepSeek R1 pourraient remplacer OpenAI, mais sans les innovations d’OpenAI, ces modèles n’existeraient probablement pas.
    • R1 pourrait pousser les grands acteurs déjà établis à chercher des méthodes plus efficaces.

1 commentaires

 
GN⁺ 2025-01-30
Avis Hacker News
  • Parmi les grandes startups chinoises de modèles, seule DeepSeek a choisi l’open source sans chercher la commercialisation. Cela lui a permis d’obtenir une promotion naturelle de la part des utilisateurs au sein de la communauté.

    • Le CEO de DeepSeek affirme que l’open source attire les meilleurs talents et renforce la valeur de l’équipe.
    • Cela ressemble à la stratégie d’OpenAI avant qu’elle ne devienne en pratique la division ClosedAI de Microsoft.
  • Les API d’IA chinoises risquent d’être accueillies avec scepticisme en Occident. Il existe des raisons historiques compréhensibles à cela.

    • DeepSeek est critiquée pour censurer certaines questions sensibles liées à la Chine.
  • Selon une note interne de Google, l’open source progresse plus vite et plus efficacement que les équipes fermées.

    • L’avenir des LLM repose sur la recherche partagée, et cela semble extrêmement important.
  • Une entreprise qui porte le mot « open » dans son nom devrait partager au moins les éléments essentiels, même si elle ne partage pas tout.

    • Comme le code source n’est pas fourni, ce n’est pas réellement de l’open source.
  • De la même façon que Linux a réussi sur le long terme, on peut s’attendre à ce que les modèles LLM puissants suivent la même trajectoire.

    • Au final, c’est l’échelle de l’infrastructure qui fera la différence.
  • DeepSeek est un projet annexe d’un hedge fund, et il pourrait en tirer d’importants profits en vendant à découvert les actions NVIDIA puis en publiant tout.

  • DeepSeek a été open sourcé parce que les développeurs voulaient montrer la chose remarquable qu’ils avaient construite.

    • Beaucoup cherchent une motivation financière, mais les personnes qui l’ont réellement créé sont des ingénieurs, pas des hommes d’affaires. DeepSeek est vraiment un projet impressionnant, et ils voulaient montrer ce qu’ils avaient accompli.