1 points par GN⁺ 2025-10-20 | 1 commentaires | Partager sur WhatsApp
  • Le coût du séquençage de l'ADN diminue plus vite que la loi de Moore.
  • Avec Oxford Nanopore MinION, il est possible de séquencer l'ADN à la maison pour environ 1 100 $.
  • L'expérience réelle a inclus des étapes comme le prélèvement sanguin, l'extraction d'ADN et le séquençage par nanopore.
  • En fin de compte, cela a couvert seulement environ 13 % du génome complet, et l'analyse a été limitée par des contaminations et des défauts d'équipement.
  • Malgré cela, j'ai obtenu une expérience significative de séquençage direct d'une partie de l'ADN à faible coût.

Introduction

  • Le coût du séquençage de l'ADN diminue rapidement. Ce qui nécessitait autrefois 13 ans et 2,3 milliards de dollars pour séquencer le génome humain peut désormais être essayé en moins de 48 heures avec seulement du matériel Oxford Nanopore (environ 1 000 $).
  • Autrefois, il fallait envoyer les échantillons à des prestataires tiers peu fiables ; cet article rapporte une tentative de séquençage dans un contexte sans laboratoire dédié.

Vue d'ensemble du processus de séquençage de l'ADN

  • L'objectif est d'obtenir une séquence du génome humain (environ 3 milliards de bases, composées de A, C, G et T) à partir de 10 mL de sang.
  • Résumé des étapes
    • Prélèvement sanguin
    • Extraction d'ADN humain à partir du sang
    • Faire passer l'ADN extrait dans l'équipement Oxford Nanopore par une méthode électrique pour lire chaque nucléotide

Bref historique du séquençage de l'ADN

  • Ère Sanger (1960-2003) : analogique, traitement manuel, progression très lente
    • Utilisation de nucléotides défectueux pour interrompre la réplication de l'ADN, puis séparation de chaque fragment de manière électrique et lecture comme un code-barres.
    • Le déchiffrement du génome humain a pris 13 ans et a coûté 2,3 milliards de dollars.
  • Ère Illumina (2005-début des années 2010) : parallélisation et automatisation
    • Introduction du séquençage par synthèse, avec une amélioration majeure de la vitesse et de l'efficacité du traitement.
  • Ère du séquençage de molécules uniques :
    • Lecture directe des nucléotides de l'ADN via des nanopores électriques, sans avoir besoin de fragmenter l'ADN.
    • Cette expérience a également utilisé cette méthode.

Matériel et coûts nécessaires

  • Kit de démarrage Oxford Nanopore MinION (1 000 $) : séquenceur USB, flow cell et réactifs chimiques de préparation inclus
  • Kit d'extraction d'ADN Zymo (échantillon gratuit)
  • Mini-centrifugeuse (Amazon, 50 $)
  • Consommables de laboratoire (tubes Eppendorf, lancets, pipettes, etc., 50 $)
  • Coût total d'environ 1 100 $

Détails des étapes expérimentales

Étape 1 : Prélèvement sanguin

  • Environ 200 µL (0,2 mL) de sang sont nécessaires ; une petite lancette n'étant pas suffisante, le prélèvement a été réalisé par de multiples piqûres au doigt.

Étape 2 : Extraction d'ADN

  • Le sang contient beaucoup d'impuretés, notamment des globules rouges où l'ADN est largement absent.
  • Il faut isoler l'ADN uniquement des globules blancs, ce qui a été fait à l'aide des enzymes du kit Zymo et d'un filtre de centrifugation.
  • Le processus d'attache des adaptateurs du kit de préparation Nanopore a également été suivi.

Étape 3 : Séquençage avec Nanopore

  • L'ADN préparé est injecté dans le petit port du MinION, puis connecté via USB.
  • Le logiciel MinKNOW effectue le basecalling en temps réel, prédisant A, T, C et G à partir des signaux électriques à l'aide d'un algorithme de réseau de neurones.

Résultats et limites

  • Un total d'environ 1 gigabase de données a été obtenu après avoir séquencé deux fois (environ 13 % des 3 milliards de bases du génome humain).
  • La première tentative a été interrompue par une erreur matérielle, la défaut de la flow cell ayant laissé seulement 623 pores fonctionnels sur 2 048.
  • Une contamination de 25 % par des bactéries et autres a été détectée.
  • Pour l'analyse des SNP (polymorphismes mononucléotidiques), plusieurs passes de séquençage sont nécessaires, mais la plupart des bases n'ont été lues qu'une seule fois.
  • Malgré tout, avec seulement 1 100 $, il a été possible d'obtenir une expérience de séquençage d'une partie significative du génome humain.

Remerciements

  • Remerciements adressés aux amis ayant participé à cette expérience.

1 commentaires

 
GN⁺ 2025-10-20
Avis Hacker News
  • Il est encore difficile de dire que nous sommes entrés dans « l’ère du séquençage par nanopore », et le séquençage par synthèse reste toujours la méthode dominante

    • Il faut découper le génome en petits fragments puis le réassembler à partir de ceux-ci, et plusieurs problèmes surviennent au cours de ce processus
    • Le séquençage par nanopore a encore un taux d’erreur élevé, donc en pratique clinique on utilise toujours le séquençage par synthèse (en particulier Illumina, qui a été technologiquement excellent ces 10 dernières années)
    • Malgré cela, les appareils nanopore sont attrayants parce qu’ils sont petits et peu coûteux, et le taux d’erreur peut être en partie compensé par un séquençage répété
    • Avec la technologie basée sur la synthèse, en passant par un prestataire fiable, il est possible de séquencer un génome complet à 30x de couverture pour moins de 1 000 euros ou dollars ; j’ai même vu des offres à 180 dollars, mais je ne sais pas ce qu’elles valent vraiment
    • Pour un génome humain complet, le nanopore est sans doute encore prématuré, mais pour des usages comme le séquençage de plasmides, c’est déjà très utile
      • Même sans être du secteur, je peux simplement déposer des tubes à l’université et recevoir le résultat par e-mail le lendemain matin pour 15 dollars, tout cela grâce à un workflow basé sur le nanopore
    • Le taux d’erreur peut être compensé par des séquençages répétés, mais il arrive que certaines erreurs soient corrélées
    • Globalement, le séquençage en fragments courts est bien plus rentable ; dans notre startup aussi, le QC de lignées cellulaires avec Illumina ne coûte que 260 dollars
    • La méthode de séquençage dépend de l’objectif ; au NAO, on séquence à bas coût les différents virus présents dans les eaux usées avec les gros flow cells Illumina (25B)
      • En revanche, quand il y a beaucoup de virus cibles comme dans un prélèvement nasal, le nanopore est plus adapté grâce à ses longues lectures et à son faible coût par run
    • Le séquençage clinique en lectures courtes fonctionne déjà très bien, donc il n’y a pas vraiment de raison pour que le nanopore le remplace
    • L’avenir en clinique est dans la détection de variants de taille moyenne à grande, un domaine encore mal élucidé, ce qui explique l’usage important du nanopore en recherche et dans le diagnostic des maladies rares
    • Le SBS (séquençage par synthèse) est extrêmement fiable, mais ce n’est pas parce qu’il a une grande part de marché que le progrès technologique s’est arrêté
      • L’innovation dans le séquençage se joue aujourd’hui autour du ML, de l’analyse simultanée ARN-ADN et de la combinaison lectures longues / lectures courtes
    • En réalité, les laboratoires de diagnostic utilisent eux aussi de plus en plus la technologie nanopore, car la préparation coûte moins cher et la sensibilité atteint le niveau de la qPCR
      • En plus, elle fournit des informations supplémentaires comme la méthylation
      • Il existe aussi récemment un article sur la classification des leucémies aiguës à l’aide du nanopore article
      • Les délais sont un peu exagérés, mais pour le diagnostic l’important est surtout que « ça marche bien »
  • L’idée de cet article m’a semblé intéressante, mais j’ai été un peu déçu à cause des problèmes matériels et du fait qu’ils aient essayé une fois puis abandonné immédiatement

    • Ils disent qu’il n’y avait que 623 pores fonctionnels dès le départ sur le flow cell ; je me demande si c’est courant, et j’aimerais trouver d’autres cas où l’essai a été mené correctement
    • En fait, j’ai moi-même tenté quelque chose de similaire, avec de la salive au lieu de sang, et une extraction d’ADN avec un kit Qiagen
      • Mon flow cell nanopore avait presque tous ses pores fonctionnels ; dans le cas de l’article, cela venait sans doute d’un problème de stockage
    • Le nombre de pores actifs peut varier selon la manipulation ; d’après mon expérience, une mauvaise préparation de l’échantillon entraîne beaucoup de pores inactifs
      • Si l’échantillon n’est pas correctement préparé, les pores peuvent se boucher ou perdre en activité
      • Quand j’analysais autrefois des données Oxford Nanopore, la qualité variait tellement selon la qualité de préparation des échantillons qu’on pouvait deviner quel collègue les avait préparés rien qu’en regardant les données
      • Je suppose que la qualité des échantillons préparés dans le « garage » des auteurs était médiocre
      • À titre anecdotique, un collègue avait même fabriqué un laboratoire de séquençage mobile alimenté par une voiture
      • Et le principal goulot d’étranglement technique qu’il rencontrait, c’était aussi la préparation des échantillons ; côté informatique, ce n’était pas particulièrement difficile
    • Un faible nombre de pores actifs n’est pas vraiment « normal », mais c’est un phénomène assez fréquent
      • D’après mon expérience en NGS, un quart des flow cells étaient défectueux, et ONT avait une politique d’échange si l’autotest du flow cell échouait
    • Cela dépend de l’échantillon, mais en général on a plutôt plus de 1 200 pores actifs, avec au moins 800 garantis
      • Donc dans ce cas, cela vaudrait sans doute le coup de demander un remboursement
    • Ce cas était intéressant parce qu’il montre ce qui se passe « en pratique quand on essaye vraiment »
      • J’ai un peu d’expérience en généalogie génétique, et je m’attendais à beaucoup de problèmes techniques
  • Des sociétés comme Nebula ou Dante proposent un séquençage du génome complet avec 30x ou 100x de couverture pour environ 300 dollars

    • En réalité, le génome à 1 000 dollars existait déjà il y a 10 ans
    • Je m’étais renseigné sur Nebula, mais l’entreprise fait l’objet d’une class action pour avoir transmis des données génomiques à Meta, Microsoft et Google
      • On trouve aussi sur Reddit beaucoup de cas de personnes ayant envoyé leur kit sans jamais recevoir leurs résultats pendant des années
      • Entre les problèmes de qualité du séquençage, les faux positifs des données génomiques DTC et les affaires similaires chez 23andMe, je n’ai pas très envie d’envoyer mon génome à une entreprise privée
    • Le prix minimum du séquençage du génome complet chez DanteLabs est de 399 euros (466 dollars) lien produit DanteLabs
    • Les 2 000 dollars incluent ici le matériel d’extraction d’ADN et le séquenceur lui-même ; les séquenceurs utilisés par des sociétés comme Nebula sont probablement des machines à plus d’un million de dollars
      • Si l’on veut réduire encore le coût, on peut faire du séquençage d’exome au lieu d’un WGS, ou dans certains cas un simple génotypage
      • Il existe peut-être déjà des entreprises capables de faire du WGS à 100 dollars
    • Mais fondamentalement, cela signifie quand même qu’une entreprise devient propriétaire de mes données génomiques
      • Elle peut ensuite faire à peu près ce qu’elle veut au nom de ses « intérêts légitimes », sans compter les risques très réels de piratage ou de revente de l’entreprise
    • Les 1 000 dollars, c’est un « prix d’échelle »
      • Un tarif qui n’est possible qu’à partir d’un certain volume de traitement
  • Sur mynucleus.com, on peut faire un séquençage du génome complet pour 500 dollars avec un simple écouvillon buccal (10 % de réduction avec le code savraj10)

    • Pas besoin de sang, plus de 2 000 évaluations de risque de maladie sont fournies, et si le conjoint fait aussi le test, on peut même obtenir des prévisions pour de futurs enfants
    • Une nouvelle annonce d’investissement devrait être faite bientôt, le téléchargement des données brutes est pris en charge, et l’entreprise affirme respecter les normes de sécurité SOC2 et HIPAA
    • En revanche, je me demande comment empêcher que les données génomiques soient revendues à un tiers si Nucleus fait faillite, comme on l’a vu avec la fuite de données chez 23andMe
      • Je ne vois pas vraiment sur leur site ce qui les différencie en matière de protection de la vie privée
      • Nucleus affirme aussi « ne pas vendre les données », mais 23andMe disait la même chose
      • En réalité, aucune entreprise ne peut inspirer une confiance totale sur ce point
      • Confier son génome à Nucleus juste pour économiser 3 000 dollars mérite réflexion
    • Pour moi, le plus difficile n’est pas de faire séquencer mon génome, mais de devoir faire confiance à un tiers
      • Avec seulement 13 % de couverture comme mentionné dans l’article, aucune analyse génomique n’est réellement utile ; le titre est exagéré
    • Je me demande quel niveau de couverture ils obtiennent réellement
    • C’est impressionnant de voir qu’un service autrefois extrêmement cher ou inaccessible au grand public est désormais disponible pour 500 dollars
    • Je me demande si on peut payer en Monero
  • J’ai utilisé Nebula (qui a depuis changé de marque et coûte plus cher) pour faire séquencer le génome de membres de ma famille aussi, et tout s’est fait assez simplement

    • Avec le plan « Lifetime », j’ai stocké les fichiers FASTQ dans un bucket R2 ; Nebula coûte 250 dollars avec un abonnement récurrent de 50 dollars par mois, qu’on peut résilier immédiatement
    • Mon fichier VCF peut être consulté ici
      • On peut soumettre un variant précis (rs104894396) à un LLM pour analyse, ou le consulter sur SNPedia
    • J’ai aussi fait un dépistage de portage avec ma femme, mais via une autre méthode que Nebula
      • Nous avons découvert que nous étions tous les deux porteurs d’un gène de surdité lié à GJB2, et nous avons donc fait séquencer les embryons de nos futurs enfants pour pouvoir avoir un enfant en bonne santé
    • Si quelqu’un est curieux de voir un véritable exemple de données génomiques, mes données peuvent servir de fichier de test (comme je suis un homme, on peut aussi y vérifier des variants du chrY)
    • J’ai aussi utilisé Dante, et je voulais comparer les résultats des deux sociétés
      • Dante était peu pratique parce que sa façon de relier la séquence à l’utilisateur était différente (avec conservation séparée d’un code)
      • Je n’ai jamais reçu la moindre réponse à mes questions, donc je ne sais pas comment ils fonctionnent réellement
    • La technologie nanopore est elle aussi vraiment fascinante, mais j’ai aussi vu sur Twitter des discussions sur des problèmes de contrôle qualité des appareils
      • J’aimerais un jour comparer cela avec le génome de ma fille
    • Fait amusant, vous avez CYP11B1 rs4541(g;a), ce qui pourrait expliquer que vous n’aimiez pas la réglisse
      • Vous avez aussi CYP17A1 −34 T>C, rs743572(A;G)
      • Selon la combinaison génétique globale, diverses caractéristiques physiques ou comportementales peuvent apparaître
      • Par exemple, une tendance à être en sous-poids, anxieux, à avoir de l’acné à l’adolescence, des étourdissements orthostatiques, une envie de sel ou des troubles du sommeil
      • Il peut aussi y avoir une tendance à des carences en vitamine D, magnésium et vitamines B, pouvant entraîner divers symptômes physiques ou neurologiques (ATM, crampes musculaires, myopie, etc.)
      • Certains gènes permettraient aussi d’inférer un goût pour les jeux de stratégie sur plateau, une probabilité d’être gaucher, le niveau d’intelligence, les habitudes de sommeil ou certains talents visuels
      • Mais un seul variant génétique ne suffit pas à tout expliquer, et il faut impérativement ajuster alimentation et mode de vie avec un médecin (je ne suis pas médecin, seulement programmeur avec une passion pour la biologie et la génomique)
    • Je suis vraiment curieux de savoir pourquoi vous êtes aussi à l’aise avec l’idée de rendre public l’intégralité de votre ADN
  • Malheureusement, le MinION Starter Kit à 1 000 dollars n’est plus vendu actuellement, et le lien de l’article renvoie désormais vers une 404

    • Désormais, les produits MinION avec flow cell commencent à 4 950 dollars
  • Si je devais faire un séquençage ADN, je ne le ferais jamais à moins d’acheter l’équipement et de tout manipuler moi-même entièrement hors ligne

    • Cela crée un risque potentiel non seulement pour mes informations génétiques, mais aussi pour mes futurs descendants et mes liens de parenté
    • Le pire scénario est probablement plus grave qu’on ne l’imagine
      • De plus, sans données épigénétiques, la capacité de prédiction sur la santé reste très limitée
      • Cela pourrait même nuire à la santé en provoquant de l’anxiété ou un effet nocebo
      • En pratique, cela ne sert réellement qu’à confirmer un diagnostic posé par un médecin, et c’est d’ailleurs plus sûr ainsi
  • Le remplacement du PCR (thermocycleur) par une bouilloire électrique m’a fait rire

    • Il y a vraiment eu une époque où l’on amplifiait l’ADN en alternant des récipients d’eau chaude
    • Le résultat aurait sans doute été meilleur en n’extrayant et séquençant que les leucocytes du sang, mais ce n’est pas simple avec une lancette et du mini-matériel
      • Au début des années 2010, lors d’un TP d’initiation à la biologie, j’ai connu le PCR manuel avec bains d’eau alternés et minuteur à œufs
      • Après avoir ensuite utilisé un vrai thermocycleur, j’ai encore mieux compris la valeur de ce type de matériel
  • J’aimerais voir des données après le fameux graphique (2001~2015) montrant que le coût du séquençage chutait plus vite que la loi de Moore

    • Je ne vois que des graphiques allant jusqu’en 2021, et depuis 2015 on dirait plutôt que les progrès ont ralenti
    • Si le nanopore devient plus fiable, une nouvelle rupture pourrait peut-être se produire
    • Le graphique commence en 2001, mais j’ai participé au milieu des années 90 à l’EMBL au développement de séquenceurs à électrophorèse sur film mince
      • À l’époque, quelques centaines de bases par jour représentaient déjà le maximum
    • Le NHGRI semble avoir continué à mettre à jour ce graphique puis s’être arrêté après 2022 à cause de contraintes budgétaires
      • En regardant bien, on peut imaginer qu’un génome à 100 dollars arrivera peut-être d’ici cinq ans
  • Dante et Nebula n’ont pas très bonne réputation, et ySeq affiche huit mois d’attente

    • Le matériel nanopore présenté dans cet article ne fonctionne pas correctement non plus
    • En 2025, faire séquencer son génome en Europe n’est pas si simple