Informations

17.3 : Séquençage du génome entier - Biologie


Compétences à développer

  • Décrire trois types de séquençage
  • Définir le séquençage du génome entier

Bien qu'il y ait eu des progrès significatifs dans les sciences médicales ces dernières années, les médecins sont toujours déconcertés par certaines maladies, et ils utilisent le séquençage du génome entier pour aller au fond du problème. Le séquençage du génome entier est un processus qui détermine la séquence d'ADN d'un génome entier. Le séquençage du génome entier est une approche par force brute pour résoudre des problèmes lorsqu'il existe une base génétique au cœur d'une maladie. Plusieurs laboratoires offrent maintenant des services pour séquencer, analyser et interpréter des génomes entiers.

Par exemple, le séquençage de l'exome entier est une alternative moins coûteuse au séquençage du génome entier. Dans le séquençage de l'exome, seules les régions codantes productrices d'exons de l'ADN sont séquencées. En 2010, le séquençage de l'exome entier a été utilisé pour sauver un jeune garçon dont les intestins présentaient de multiples abcès mystérieux. L'enfant a subi plusieurs opérations du côlon sans soulagement. Enfin, un séquençage de l'exome entier a été réalisé, qui a révélé un défaut dans une voie qui contrôle l'apoptose (mort cellulaire programmée). Une greffe de moelle osseuse a été utilisée pour surmonter cette maladie génétique, conduisant à un remède pour le garçon. Il a été la première personne à être traitée avec succès sur la base d'un diagnostic établi par séquençage de l'ensemble de l'exome. Aujourd'hui, le séquençage du génome humain est plus facilement disponible et peut être réalisé en un jour ou deux pour environ 1000 $.

Stratégies utilisées dans les projets de séquençage

La technique de séquençage de base utilisée dans tous les projets de séquençage modernes est la méthode de terminaison de chaîne (également connue sous le nom de méthode didéoxy), qui a été développée par Fred Sanger dans les années 1970. La méthode de terminaison de chaîne implique la réplication d'ADN d'une matrice simple brin avec l'utilisation d'une amorce et d'un désoxynucléotide régulier (dNTP), qui est un monomère, ou une unité unique, d'ADN. L'amorce et le dNTP sont mélangés avec une faible proportion de didésoxynucléotides marqués par fluorescence (ddNTP). Les ddNTP sont des monomères auxquels il manque un groupe hydroxyle (-OH) au niveau du site auquel un autre nucléotide se fixe généralement pour former une chaîne (Figure (PageIndex{1})).

Chaque ddNTP est marqué avec une couleur différente de fluorophore. Chaque fois qu'un ddNTP est incorporé dans le brin complémentaire en croissance, il met fin au processus de réplication de l'ADN, ce qui se traduit par de multiples brins courts d'ADN répliqué qui se terminent chacun à un point différent au cours de la réplication. Lorsque le mélange réactionnel est traité par électrophorèse sur gel après avoir été séparé en brins simples, les multiples brins d'ADN nouvellement répliqués forment une échelle en raison des tailles différentes. Parce que les ddNTP sont marqués par fluorescence, chaque bande sur le gel reflète la taille du brin d'ADN et le ddNTP qui a terminé la réaction. Les différentes couleurs des ddNTP marqués par un fluorophore aident à identifier le ddNTP incorporé à cette position. La lecture du gel sur la base de la couleur de chaque bande sur l'échelle produit la séquence du brin modèle (Figure (PageIndex{2})).

Premières stratégies : séquençage au fusil de chasse et séquençage final par paire

Dans la méthode de séquençage au fusil de chasse, plusieurs copies d'un fragment d'ADN sont découpées au hasard en de nombreux morceaux plus petits (un peu comme ce qui arrive à une cartouche à balle ronde lorsqu'elle est tirée d'un fusil de chasse). Tous les segments sont ensuite séquencés en utilisant la méthode de séquençage en chaîne. Ensuite, à l'aide d'un ordinateur, les fragments sont analysés pour voir où leurs séquences se chevauchent. En faisant correspondre les séquences qui se chevauchent à la fin de chaque fragment, la séquence d'ADN entière peut être reformée. Une séquence plus grande qui est assemblée à partir de séquences plus courtes qui se chevauchent est appelée contig. Par analogie, considérez que quelqu'un a quatre copies d'une photographie de paysage que vous n'avez jamais vue auparavant et ne sait rien sur la façon dont elle devrait apparaître. La personne déchire ensuite chaque photographie avec ses mains, de sorte que des morceaux de tailles différentes soient présents sur chaque copie. La personne mélange ensuite toutes les pièces et vous demande de reconstituer la photographie. Dans l'un des plus petits morceaux, vous voyez une montagne. Dans une pièce plus grande, vous voyez que la même montagne est derrière un lac. Un troisième fragment ne montre que le lac, mais il révèle qu'il y a une cabane sur la rive du lac. Par conséquent, en regardant les informations qui se chevauchent dans ces trois fragments, vous savez que l'image contient une montagne derrière un lac qui a une cabane sur sa rive. C'est le principe de la reconstruction de séquences d'ADN entières à l'aide du séquençage shotgun.

À l'origine, le séquençage au fusil de chasse n'analysait qu'une extrémité de chaque fragment pour les chevauchements. C'était suffisant pour le séquençage de petits génomes. Cependant, le désir de séquencer des génomes plus gros, comme celui d'un humain, a conduit au développement du séquençage à double canon, plus officiellement connu sous le nom de séquençage par paires. Dans le séquençage par paires, les deux extrémités de chaque fragment sont analysées pour le chevauchement. Le séquençage par paires est donc plus lourd que le séquençage shotgun, mais il est plus facile de reconstituer la séquence car il y a plus d'informations disponibles.

Séquençage de nouvelle génération

Depuis 2005, les techniques de séquençage automatisé utilisées par les laboratoires sont sous l'égide du séquençage de nouvelle génération, qui est un groupe de techniques automatisées utilisées pour le séquençage rapide de l'ADN. Ces séquenceurs automatisés à faible coût peuvent générer des séquences de centaines de milliers ou de millions de fragments courts (25 à 500 paires de bases) en l'espace d'une journée. Ces séquenceurs utilisent un logiciel sophistiqué pour passer à travers le processus fastidieux de mise en ordre de tous les fragments.

Connexion Evolution : comparaison de séquences

Un alignement de séquences est un arrangement de protéines, d'ADN ou d'ARN ; il est utilisé pour identifier les régions de similitude entre les types de cellules ou les espèces, ce qui peut indiquer la conservation de la fonction ou des structures. Les alignements de séquences peuvent être utilisés pour construire des arbres phylogénétiques. Le site Web suivant utilise un logiciel appelé BLAST (outil de recherche d'alignement local de base).

Sous "Explosion de base", cliquez sur "Explosion de nucléotide". Saisissez la séquence suivante dans la grande case « séquence de requête » : ATTGCTTCGATTGCA. Sous la case, localisez le champ "Espèce" et tapez "humain" ou "Homo sapiens". Cliquez ensuite sur « BLAST » pour comparer la séquence saisie aux séquences connues du génome humain. Le résultat est que cette séquence se produit dans plus d'une centaine d'endroits dans le génome humain. Faites défiler vers le bas sous le graphique avec les barres horizontales et vous verrez une courte description de chacun des résultats correspondants. Choisissez l'un des résultats en haut de la liste et cliquez sur "Graphiques". Cela vous amènera à une page qui montre où se trouve la séquence dans l'ensemble du génome humain. Vous pouvez déplacer le curseur qui ressemble à un drapeau vert d'avant en arrière pour afficher les séquences immédiatement autour du gène sélectionné. Vous pouvez ensuite revenir à votre séquence sélectionnée en cliquant sur le bouton "ATG".

Utilisation de séquences du génome entier d'organismes modèles

Le premier génome à être complètement séquencé était celui d'un virus bactérien, le bactériophage fx174 (5368 paires de bases) ; cela a été accompli par Fred Sanger en utilisant le séquençage du fusil de chasse. Plusieurs autres organites et génomes viraux ont ensuite été séquencés. Le premier organisme dont le génome a été séquencé était la bactérie Haemophilus influenzae; cela a été accompli par Craig Venter dans les années 1980. Environ 74 laboratoires différents ont collaboré au séquençage du génome de la levure Saccharomyces cerevisiae, qui a débuté en 1989 et s'est achevé en 1996, car il était 60 fois plus gros que tout autre génome séquencé. En 1997, les séquences du génome de deux organismes modèles importants étaient disponibles : la bactérie Escherichia coli K12 et la levure Saccharomyces cerevisiae. Génomes d'autres organismes modèles, comme la souris Mus musculus, la mouche des fruits Drosophila melanogaster, le nématode Caenorhabditis. elegans, et les humains Homo sapiens sont désormais connus. De nombreuses recherches fondamentales sont effectuées sur des organismes modèles, car les informations peuvent être appliquées à des organismes génétiquement similaires. Un organisme modèle est une espèce qui est étudiée en tant que modèle pour comprendre les processus biologiques chez d'autres espèces représentées par l'organisme modèle. Le séquençage de génomes entiers facilite les efforts de recherche dans ces organismes modèles. Le processus d'attachement d'informations biologiques aux séquences de gènes est appelé annotation du génome. L'annotation des séquences de gènes aide aux expériences de base en biologie moléculaire, telles que la conception d'amorces PCR et de cibles d'ARN.

Les puces à ADN sont des méthodes utilisées pour détecter l'expression génique en analysant une matrice de fragments d'ADN qui sont fixés sur une lame de verre ou une puce de silicium pour identifier les gènes actifs et identifier les séquences. Près d'un million d'anomalies génotypiques peuvent être découvertes à l'aide de puces à ADN, tandis que le séquençage du génome entier peut fournir des informations sur les six milliards de paires de bases du génome humain. Bien que l'étude des applications médicales du séquençage du génome soit intéressante, cette discipline a tendance à s'attarder sur la fonction anormale des gènes. La connaissance de l'ensemble du génome permettra de découvrir précocement les maladies à apparition future et d'autres troubles génétiques, ce qui permettra de prendre des décisions plus éclairées concernant le mode de vie, les médicaments et le fait d'avoir des enfants. La génomique en est encore à ses balbutiements, bien qu'un jour, il devienne une routine d'utiliser le séquençage du génome entier pour dépister chaque nouveau-né afin de détecter des anomalies génétiques.

En plus des maladies et des médicaments, la génomique peut contribuer au développement de nouvelles enzymes qui convertissent la biomasse en biocarburant, ce qui se traduit par une production agricole et de carburant plus élevée et un coût inférieur pour le consommateur. Cette connaissance devrait permettre de meilleures méthodes de contrôle des microbes qui sont utilisés dans la production de biocarburants. La génomique pourrait également améliorer les méthodes utilisées pour surveiller l'impact des polluants sur les écosystèmes et aider à nettoyer les contaminants environnementaux. La génomique a permis le développement de produits agrochimiques et pharmaceutiques qui pourraient profiter à la science médicale et à l'agriculture.

Cela semble formidable d'avoir toutes les connaissances que nous pouvons obtenir du séquençage du génome entier ; cependant, les humains ont la responsabilité d'utiliser ces connaissances à bon escient. Sinon, il pourrait être facile d'abuser du pouvoir de ces connaissances, entraînant une discrimination fondée sur la génétique d'une personne, le génie génétique humain et d'autres préoccupations éthiques. Ces informations pourraient également entraîner des problèmes juridiques concernant la santé et la confidentialité.

Sommaire

Le séquençage du génome entier est la dernière ressource disponible pour traiter les maladies génétiques. Certains médecins utilisent le séquençage du génome entier pour sauver des vies. La génomique a de nombreuses applications industrielles, notamment le développement de biocarburants, l'agriculture, les produits pharmaceutiques et le contrôle de la pollution. Le principe de base de toutes les stratégies de séquençage modernes implique la méthode de séquençage de terminaison de chaîne.

Bien que les séquences du génome humain fournissent des informations clés aux professionnels de la santé, les chercheurs utilisent des séquences du génome entier d'organismes modèles pour mieux comprendre le génome de l'espèce. L'automatisation et la diminution du coût du séquençage du génome entier pourraient conduire à une médecine personnalisée à l'avenir.

méthode de terminaison de chaîne
méthode de séquençage d'ADN utilisant des didésoxynucléotides marqués pour terminer la réplication d'ADN; on l'appelle aussi la méthode didésoxy ou la méthode de Sanger
contig
plus grande séquence d'ADN assemblée à partir de séquences plus courtes qui se chevauchent
désoxynucléotide
monomère individuel (unité unique) d'ADN
didésoxynucléotide
monomère individuel d'ADN auquel il manque un groupe hydroxyle (-OH)
Puce à ADN
méthode utilisée pour détecter l'expression génique en analysant un ensemble de fragments d'ADN qui sont fixés sur une lame de verre ou une puce de silicium pour identifier des gènes actifs et identifier des séquences
annotation du génome
processus d'attachement d'informations biologiques à des séquences de gènes
organisme modèle
espèce étudiée et utilisée comme modèle pour comprendre les processus biologiques chez d'autres espèces représentées par l'organisme modèle
séquençage de nouvelle génération
groupe de techniques automatisées utilisées pour le séquençage rapide de l'ADN
séquençage de fusil de chasse
méthode utilisée pour séquencer plusieurs fragments d'ADN afin de générer la séquence d'un gros morceau d'ADN
séquençage du génome entier
processus qui détermine la séquence d'ADN d'un génome entier

Le reséquençage du génome entier révèle une adaptation avant la divergence des sous-espèces de buffles

L'application de données de génotypage ou de séquençage à haut débit nous aide à comprendre la réponse génomique à la sélection naturelle et artificielle. Dans cette étude, nous avons scanné les génomes de cinq populations de buffles indigènes appartenant à trois races reconnues, adaptées à différentes zones géographiques et agro-écologiques en Iran, pour démêler l'étendue de la diversité génomique et localiser les régions génomiques et les gènes ayant subi une sélection passée. Au total, 46 génomes entiers de buffles de rivière, provenant des provinces de l'Azerbaïdjan occidental et oriental, de Gilan, de Mazandaran et du Khuzestan, ont été reséquencés. Nos données de séquençage ont atteint une couverture supérieure à 99% du génome de référence du buffle de rivière et une profondeur de lecture moyenne d'environ 9,2 × par échantillon. Nous avons identifié 20,55 millions de SNP, dont 63 097 faux-sens, 707 mutations stop-gain et 159 mutations stop-loss qui pourraient avoir des conséquences fonctionnelles. Les analyses de la diversité génomique ont montré une structuration modeste parmi les populations de buffles iraniennes à la suite de flux ou de mélanges fréquents de gènes dans un passé récent. Les preuves de sélection positive ont été étudiées en utilisant à la fois des mesures de différenciation (Fst) et de fixation (Pi). L'analyse de la fixation a révélé trois régions génomiques dans les trois races avec des contenus de polymorphisme aberrant sur BBU2, 20 et 21. Le signal de fixation sur BBU2 chevauchait les gènes OCA2-HERC2, suggérant une adaptation à l'exposition aux UV par le mécanisme de pigmentation. Une validation supplémentaire à l'aide des données de reséquençage de cinq autres espèces bovines ainsi que des données Axiom Buffalo Genotyping Array 90K de buffles de rivière et de marais ont indiqué que ces signaux de fixation persistaient à travers les buffles de rivière et de marais et s'étendaient aux bovins taurine, ce qui implique qu'un ancien événement évolutif s'est produit avant la spéciation des buffles et des taurines. Ces résultats ont contribué à notre compréhension des principaux changements génétiques qui ont eu lieu au cours de l'évolution des buffles modernes.

Mots clés: Signature de sélection de diversité nucléotidique de l'indice de différenciation des mélanges de buffles indigènes iraniens.

© The Author(s) 2020. Publié par Oxford University Press au nom de la Society for Molecular Biology and Evolution.


Premières stratégies : séquençage au fusil de chasse et séquençage final par paire

Dans la méthode de séquençage au fusil de chasse, plusieurs copies d'un fragment d'ADN sont découpées au hasard en de nombreux morceaux plus petits (un peu comme ce qui arrive à une cartouche à balle ronde lorsqu'elle est tirée d'un fusil de chasse). Tous les segments sont ensuite séquencés en utilisant la méthode de séquençage en chaîne. Ensuite, à l'aide d'un ordinateur, les fragments sont analysés pour voir où leurs séquences se chevauchent. En faisant correspondre les séquences qui se chevauchent à la fin de chaque fragment, la séquence d'ADN entière peut être reformée. Une séquence plus grande qui est assemblée à partir de séquences plus courtes qui se chevauchent est appelée contig. Par analogie, considérez que quelqu'un a quatre copies d'une photographie de paysage que vous n'avez jamais vue auparavant et ne sait rien sur la façon dont elle devrait apparaître. La personne déchire ensuite chaque photographie avec ses mains, de sorte que des morceaux de tailles différentes soient présents à partir de chaque copie. La personne mélange ensuite toutes les pièces et vous demande de reconstituer la photographie. Dans l'un des plus petits morceaux, vous voyez une montagne. Dans une pièce plus grande, vous voyez que la même montagne est derrière un lac. Un troisième fragment ne montre que le lac, mais il révèle qu'il y a une cabane sur la rive du lac. Par conséquent, en regardant les informations qui se chevauchent dans ces trois fragments, vous savez que l'image contient une montagne derrière un lac qui a une cabane sur sa rive. C'est le principe de la reconstruction de séquences d'ADN entières à l'aide du séquençage shotgun.

À l'origine, le séquençage au fusil de chasse n'analysait qu'une extrémité de chaque fragment pour les chevauchements. C'était suffisant pour le séquençage de petits génomes. Cependant, le désir de séquencer des génomes plus gros, comme celui d'un humain, a conduit au développement du séquençage à double canon, plus officiellement connu sous le nom de séquençage par paires. Dans le séquençage par paires, les deux extrémités de chaque fragment sont analysées pour le chevauchement. Le séquençage par paires est donc plus lourd que le séquençage shotgun, mais il est plus facile de reconstituer la séquence car il y a plus d'informations disponibles.


Approches de séquençage du génome entier pour la biologie de la conservation : avantages, limites et recommandations pratiques

Le reséquençage du génome entier (WGR) est une méthode puissante pour aborder les questions fondamentales de la biologie évolutive qui n'ont pas été entièrement résolues à l'aide des méthodes traditionnelles. Le WGR comprend quatre approches : le séquençage d'individus à une profondeur de couverture élevée avec des haplotypes non résolus ou résolus, le séquençage de génomes de population à une profondeur élevée en mélangeant des quantités équimolaires d'ADN individuel non marqué (Pool-seq) et le séquençage de plusieurs individus d'une population à faible profondeur (lcWGR). Ces techniques nécessitent la disponibilité d'un génome de référence. Ceci, ajouté au coût encore élevé du séquençage au fusil de chasse et à la forte demande de ressources informatiques et de stockage, a limité leur mise en œuvre chez les espèces non modèles aux ressources génomiques limitées et dans des domaines tels que la biologie de la conservation. Notre objectif ici est de décrire les différentes méthodes WGR, leurs avantages et inconvénients et leurs applications potentielles en biologie de la conservation. WGR offre une densité de marqueurs sans précédent et étudie une grande diversité de variations génétiques non limitées aux polymorphismes nucléotidiques uniques (par exemple, des variantes structurelles et des mutations dans les éléments régulateurs), augmentant leur puissance pour la détection de signatures de sélection et d'adaptation locale ainsi que pour la identification de la base génétique des caractères phénotypiques et des maladies. À l'heure actuelle, cependant, aucune approche WGR ne satisfait à toutes les exigences de la génétique de la conservation, et chaque méthode a ses propres limites et sources de biais potentiels. Nous discutons des moyens proposés pour minimiser ces biais. Nous envisageons un avenir pas lointain où l'analyse de génomes entiers deviendra une tâche de routine dans de nombreuses espèces et domaines non modèles, y compris la biologie de la conservation.

Mots clés: Pool-seq conservation biologie séquençage à faible couverture gestion génomique des populations séquençage du génome entier.


Utilisation de séquences du génome entier d'organismes modèles

Le biochimiste britannique et lauréat du prix Nobel Fred Sanger a utilisé un virus bactérien, le bactériophage fx174 (5368 paires de bases), pour séquencer complètement le premier génome. D'autres scientifiques ont ensuite séquencé plusieurs autres génomes organites et viraux. Le biotechnologue, biochimiste, généticien et homme d'affaires américain Craig Venter a séquencé la bactérie Haemophilus influenzae Dans les années 1980. Environ 74 laboratoires différents ont collaboré au séquençage du génome de la levure Saccharomyces cerevisiae, qui a commencé en 1989 et s'est achevé en 1996, car il était 60 fois plus gros que tout autre séquençage du génome. En 1997, les séquences du génome de deux organismes modèles importants étaient disponibles : la bactérie Escherichia coli K12 et la levure Saccharomyces cerevisiae. Nous connaissons maintenant les génomes d'autres organismes modèles, comme la souris Mus musculus, la mouche des fruits Drosophila melanogaster, le nématode Caenorhabditis. elegans, et les humains Homo sapiens. Les chercheurs effectuent des recherches fondamentales approfondies sur des organismes modèles, car ils peuvent appliquer les informations à des organismes génétiquement similaires. Un organisme modèle est une espèce que les chercheurs utilisent comme modèle pour comprendre les processus biologiques chez d'autres espèces que l'organisme modèle représente. Le séquençage de génomes entiers facilite les efforts de recherche dans ces organismes modèles. Le processus d'attachement de l'information biologique aux séquences génétiques est l'annotation du génome. L'annotation des séquences de gènes facilite les expériences de base en biologie moléculaire, telles que la conception d'amorces PCR et de cibles ARN.


Biologie 171

À la fin de cette section, vous serez en mesure d'effectuer les opérations suivantes :

Bien qu'il y ait eu des progrès significatifs dans les sciences médicales ces dernières années, les médecins sont toujours déconcertés par certaines maladies, et ils utilisent le séquençage du génome entier pour découvrir la racine du problème. Le séquençage du génome entier est un processus qui détermine la séquence d'ADN d'un génome entier. Le séquençage du génome entier est une approche par force brute pour résoudre des problèmes lorsqu'il existe une base génétique au cœur d'une maladie. Plusieurs laboratoires offrent maintenant des services pour séquencer, analyser et interpréter des génomes entiers.

Par exemple, le séquençage de l'exome entier est une alternative moins coûteuse au séquençage du génome entier. Dans le séquençage de l'exome, le médecin séquence uniquement les régions codantes et productrices d'exons de l'ADN. En 2010, les médecins ont utilisé le séquençage de l'exome entier pour sauver un jeune garçon dont les intestins présentaient de multiples abcès mystérieux. L'enfant a subi plusieurs opérations du côlon sans soulagement. Enfin, ils ont effectué un séquençage de l'ensemble de l'exome, qui a révélé un défaut dans une voie qui contrôle l'apoptose (mort cellulaire programmée). Les médecins ont utilisé une greffe de moelle osseuse pour surmonter cette maladie génétique, ce qui a permis de guérir le garçon. Il a été la première personne à recevoir un traitement réussi basé sur un diagnostic de séquençage de l'ensemble de l'exome. Aujourd'hui, le séquençage du génome humain est plus facilement disponible et les résultats sont disponibles dans les deux jours pour environ 1000 $.

Stratégies utilisées dans les projets de séquençage

La technique de séquençage de base utilisée dans tous les projets de séquençage modernes est la méthode de terminaison de chaîne (également connue sous le nom de méthode didésoxy), que Fred Sanger a développée dans les années 1970. La méthode de terminaison de chaîne implique la réplication d'ADN d'une matrice simple brin en utilisant une amorce et un désoxynucléotide régulier (dNTP), qui est un monomère, ou une seule unité d'ADN. L'amorce et le dNTP se mélangent avec une faible proportion de didésoxynucléotides marqués par fluorescence (ddNTP). Les ddNTP sont des monomères auxquels il manque un groupe hydroxyle (-OH) au niveau du site auquel un autre nucléotide se fixe généralement pour former une chaîne ((Figure)). Les scientifiques étiquettent chaque ddNTP avec une couleur différente de fluorophore. Chaque fois qu'un ddNTP s'incorpore dans le brin complémentaire en croissance, il met fin au processus de réplication de l'ADN, ce qui se traduit par de multiples brins courts d'ADN répliqué qui se terminent chacun à un point différent au cours de la réplication. Lorsque l'électrophorèse sur gel traite le mélange réactionnel après séparation en brins simples, les multiples brins d'ADN nouvellement répliqués forment une échelle en raison des tailles différentes. Parce que les ddNTP sont marqués par fluorescence, chaque bande sur le gel reflète la taille du brin d'ADN et le ddNTP qui a terminé la réaction. Les différentes couleurs des ddNTP marqués par un fluorophore aident à identifier le ddNTP incorporé à cette position. La lecture du gel sur la base de la couleur de chaque bande sur l'échelle produit la séquence du brin modèle ((Figure)).



Premières stratégies : séquençage au fusil de chasse et séquençage final par paire

Dans la méthode de séquençage du fusil de chasse, plusieurs copies de fragments d'ADN sont découpées au hasard en de nombreux morceaux plus petits (un peu comme ce qui arrive à une cartouche à balle ronde lorsqu'elle est tirée d'un fusil de chasse). Tous les segments séquencent en utilisant la méthode de séquençage en chaîne. Ensuite, avec l'aide d'un ordinateur de séquence, les scientifiques peuvent analyser les fragments pour voir où leurs séquences se chevauchent. En faisant correspondre des séquences qui se chevauchent à l'extrémité de chaque fragment, les scientifiques peuvent reformer l'intégralité de la séquence d'ADN. Une séquence plus grande qui est assemblée à partir de séquences plus courtes qui se chevauchent est appelée contig. Par analogie, considérez que quelqu'un a quatre copies d'une photographie de paysage que vous n'avez jamais vue auparavant et ne sait rien sur la façon dont elle devrait apparaître. La personne déchire ensuite chaque photographie avec ses mains, de sorte que des morceaux de tailles différentes soient présents à partir de chaque copie. La personne mélange ensuite toutes les pièces et vous demande de reconstituer la photographie. Dans l'un des plus petits morceaux, vous voyez une montagne. Dans une pièce plus grande, vous voyez que la même montagne est derrière un lac. Un troisième fragment ne montre que le lac, mais il révèle qu'il y a une cabane sur la rive du lac. Par conséquent, en regardant les informations qui se chevauchent dans ces trois fragments, vous savez que l'image contient une montagne derrière un lac qui a une cabane sur sa rive. C'est le principe de la reconstruction de séquences d'ADN entières à l'aide du séquençage shotgun.

À l'origine, le séquençage au fusil de chasse n'analysait qu'une extrémité de chaque fragment pour les chevauchements. C'était suffisant pour le séquençage de petits génomes. Cependant, le désir de séquencer des génomes plus gros, comme celui d'un humain, a conduit au développement du séquençage en fusil de chasse à double canon, ou séquençage par paires. Dans le séquençage par paires, les scientifiques analysent la fin de chaque fragment pour le chevauchement. Le séquençage par paires est donc plus lourd que le séquençage shotgun, mais il est plus facile de reconstituer la séquence car il y a plus d'informations disponibles.

Séquençage de nouvelle génération

Depuis 2005, les techniques de séquençage automatisé utilisées par les laboratoires sont sous l'égide du séquençage de nouvelle génération, qui est un groupe de techniques automatisées utilisées pour le séquençage rapide de l'ADN. Ces séquenceurs automatisés à faible coût peuvent générer des séquences de centaines de milliers ou de millions de fragments courts (25 à 500 paires de bases) en l'espace d'une journée. Ces séquenceurs utilisent un logiciel sophistiqué pour passer à travers le processus fastidieux de mise en ordre de tous les fragments.

Comparaison de séquences Un alignement de séquences est un arrangement de protéines, d'ADN ou d'ARN. Les scientifiques l'utilisent pour identifier des régions similaires entre des types de cellules ou des espèces, ce qui peut indiquer la conservation de la fonction ou de la structure. Nous pouvons utiliser des alignements de séquences pour construire des arbres phylogénétiques. Le site Web suivant utilise un logiciel appelé BLAST (outil de recherche d'alignement local de base).

Sous "Explosion de base", cliquez sur "Explosion de nucléotide". Saisissez la séquence suivante dans la grande zone “query sequence” : ATTGCTTCGATTGCA. Sous la case, localisez le champ “Espèces” et tapez “human” ou “Homo sapiens”. Cliquez ensuite sur « BLAST » pour
comparer la séquence saisie aux séquences connues du génome humain. Le résultat est que cette séquence se produit dans plus d'une centaine d'endroits dans le génome humain. Faites défiler vers le bas sous le graphique avec les barres horizontales et vous verrez une courte description de chacun des résultats correspondants. Choisissez l'un des résultats en haut de la liste et cliquez sur “Graphics”. Cela vous amènera à une page qui montre l'emplacement de la séquence dans l'ensemble du génome humain. Vous pouvez déplacer le curseur qui ressemble à un drapeau vert d'avant en arrière pour afficher les séquences immédiatement autour du gène sélectionné. Vous pouvez ensuite revenir à votre séquence sélectionnée en cliquant sur le bouton “ATG”.

Utilisation de séquences du génome entier d'organismes modèles

Le biochimiste britannique et lauréat du prix Nobel Fred Sanger a utilisé un virus bactérien, le bactériophage fx174 (5368 paires de bases), pour séquencer complètement le premier génome. D'autres scientifiques ont ensuite séquencé plusieurs autres génomes organites et viraux. Le biotechnologue, biochimiste, généticien et homme d'affaires américain Craig Venter a séquencé la bactérie Haemophilus influenzae Dans les années 1980. Environ 74 laboratoires différents ont collaboré au séquençage du génome de la levure Saccharomyces cerevisiae, qui a commencé en 1989 et s'est achevé en 1996, car il était 60 fois plus gros que tout autre séquençage du génome. En 1997, les séquences du génome de deux organismes modèles importants étaient disponibles : la bactérie Escherichia coli K12 et la levure Saccharomyces cerevisiae. Nous connaissons maintenant les génomes d'autres organismes modèles, comme la souris Mus musculus, la mouche des fruits Drosophila melanogaster, le nématode Caenorhabditis. elegans, et les humains Homo sapiens. Les chercheurs effectuent des recherches fondamentales approfondies sur des organismes modèles, car ils peuvent appliquer les informations à des organismes génétiquement similaires. Un organisme modèle est une espèce que les chercheurs utilisent comme modèle pour comprendre les processus biologiques chez d'autres espèces que l'organisme modèle représente. Le séquençage de génomes entiers facilite les efforts de recherche dans ces organismes modèles. Le processus d'attachement de l'information biologique aux séquences génétiques est l'annotation du génome. L'annotation des séquences de gènes facilite les expériences de base en biologie moléculaire, telles que la conception d'amorces PCR et de cibles ARN.

Parcourez chaque étape de la séquence du génome dans DNA Sequence Assembly (page Web, interactive).

Utilisations de la séquence du génome

Les puces à ADN sont des méthodes que les scientifiques utilisent pour détecter l'expression des gènes en analysant différents fragments d'ADN fixés sur une lame de verre ou une puce de silicium pour identifier les gènes et les séquences actifs. Nous pouvons découvrir près d'un million d'anomalies génotypiques à l'aide de puces à ADN alors que le séquençage du génome entier peut fournir des informations sur les six milliards de paires de bases du génome humain. Bien que l'étude des applications médicales du séquençage du génome soit intéressante, cette discipline s'attarde sur la fonction anormale des gènes. Connaître l'ensemble du génome permettra aux chercheurs de découvrir de manière précoce les maladies à apparition future et d'autres troubles génétiques. Cela permettra de prendre des décisions plus éclairées sur le mode de vie, les médicaments et le fait d'avoir des enfants. La génomique en est encore à ses balbutiements, bien qu'un jour, il devienne une routine d'utiliser le séquençage du génome entier pour dépister chaque nouveau-né afin de détecter des anomalies génétiques.

En plus des maladies et des médicaments, la génomique peut contribuer au développement de nouvelles enzymes qui convertissent la biomasse en biocarburant, ce qui se traduit par une production agricole et de carburant plus élevée et un coût inférieur pour le consommateur. Cette connaissance devrait permettre de meilleures méthodes de contrôle des microbes que l'industrie utilise pour produire des biocarburants. La génomique pourrait également améliorer les méthodes de surveillance qui mesurent l'impact des polluants sur les écosystèmes et aident à nettoyer les contaminants environnementaux. La génomique a aidé au développement de produits agrochimiques et pharmaceutiques qui pourraient profiter à la science médicale et à l'agriculture.

Cela semble formidable d'avoir toutes les connaissances que nous pouvons obtenir du séquençage du génome entier, mais les humains ont la responsabilité d'utiliser ces connaissances à bon escient. Sinon, il pourrait être facile d'abuser du pouvoir de ces connaissances, entraînant une discrimination fondée sur la génétique d'une personne, le génie génétique humain et d'autres préoccupations éthiques. Ces informations pourraient également entraîner des problèmes juridiques concernant la santé et la confidentialité.

Résumé de la section

Le séquençage du génome entier est la dernière ressource disponible pour traiter les maladies génétiques. Certains médecins utilisent le séquençage du génome entier pour sauver des vies. La génomique a de nombreuses applications industrielles, notamment le développement de biocarburants, l'agriculture, les produits pharmaceutiques et le contrôle de la pollution. Le principe de base de toutes les stratégies de séquençage modernes implique la méthode de séquençage de terminaison de chaîne.

Bien que les séquences du génome humain fournissent des informations clés aux professionnels de la santé, les chercheurs utilisent des séquences du génome entier d'organismes modèles pour mieux comprendre le génome de l'espèce. L'automatisation et la diminution du coût du séquençage du génome entier pourraient conduire à une médecine personnalisée à l'avenir.

Glossaire


Séquençage du génome entier

Par ⁠Dr. Brandon Colby MD, médecin-expert dans les domaines de la génomique et de la médecine préventive personnalisée.

Vous avez peut-être entendu des termes comme séquençage du génome entier et génomique et j'ai pensé qu'ils sonnaient comme s'ils sortaient tout droit du script d'un film futuriste. Mais en réalité, les technologies de séquençage sont facilement disponibles dans de nombreuses régions du monde et elles peuvent être très utiles pour mieux comprendre la génétique humaine et notre propre santé.

Le génome humain contient une mine d'informations sur chacun de nous, de nos ancêtres à notre risque de développer certaines maladies génétiques ou de les transmettre à nos enfants. As a result, it’s no wonder DNA sequencing is becoming a widely used tool in both research and healthcare.

What Is Whole Genome Sequencing?

Put simply, whole genome sequencing (WGS) is a genetic testing technology that allows us to determine how our DNA is confirmed. In order to understand this testing procedure better, let’s take a look at what DNA is, how it’s formed, and what it does.

Deoxyribonucleic acid, more commonly known as DNA, is the molecule that contains all living organisms’ genetic codes. All the living beings that have been identified and examined contain DNA, from complex mammals such as humans to simple organisms like bacteria.

DNA is made up of molecules called nucleotides. These nucleotides act as the basic building blocks of our DNA and are composed of three distinct parts:

The nitrogenous base portion of each nucleotide can be adenine (A), cytosine (C), guanine (G), and thymine (T). These bases are “strung together” during DNA replication. Practically all the cells that exist in our bodies contain DNA, with only a few known exceptions — such as mature hair cells.

The nitrogenous bases are replicated in a specific order, and they form base pairs by binding to a base from a parallel strand — A always binds to T, while C always binds to G —, forming the familiar double helix DNA image that we all know. One of the key features of DNA is that it can replicate itself constantly to create new cells that are identical to their parental cell.

Understanding the Science of DNA

While DNA is formed by two strands of nucleotides that are bound together, a simpler molecule called RNA is formed by a single strand. In humans, RNA molecules act as a messenger and transfer molecules that carry genetic information during the DNA transcription process.

Nitrogenous bases are the portion of our DNA that contains genetic information, and the “patterns” created by these bases in our DNA determine our genetic makeup - specific DNA sequences form genes. Each gene has coding regions that function almost like a blueprint for cells since they contain “instructions” that tell cells in our body how to synthesize amino acids to form different proteins.

There are only 20 amino acids, but they can be combined in different ways to create thousands of different proteins, each with its own structure and function. Proteins carry out a wide range of processes inside our bodies, depending on their type. If there are abnormal variations in our DNA sequence, these instructions could be faulty and lead to various health issues.

However, not all of our DNA is conformed by protein-coding genes — in fact, nearly 99 percent of all our DNA is made up of non-coding DNA, meaning that it doesn’t contain instructions for protein-coding. For a long time, scientists thought that non-coding DNA didn’t have a specific function however, we’re learning more about the purpose of non-coding DNA every day.

Some parts of our non-coding DNA act as regulatory agents that activate or repress DNA transcription, whereas others contain instructions for the synthesis of RNA, among other functions. Therefore, sequencing our non-coding DNA and RNA can also tell us a lot about human health, since it also plays an important role in genetics.

Chromosomes are long strands of DNA that contain our genes — humans normally have 23 pairs of chromosomes. We each receive two versions of the same gene — one from each of our biological parents. The different versions of a gene are called alleles, and they determine the biological traits that we will express, such as eye or hair color.

Some alleles are dominant (meaning that you only need one copy of the same allele to express its associated characteristic), whereas others are recessive (meaning that you need to inherit two copies of the same allele to express that characteristic). This explains why DNA testing results will be different for everyone, even for full siblings.

The human genome is the compilation of all the genetic information that each person contains, regardless of whether it’s coding or non-coding.

What Is a Whole Genome Sequencing DNA Test

A ⁠whole genome sequencing DNA test is a type of genetic test used to determine the order of the nucleotides that form our entire genome — both coding and non-coding —, allowing scientists and physicians to ascertain whether an individual’s DNA sequence contains any abnormalities.

Genetic testing offers a wide array of benefits for scientific research, genetic counseling, individualized medical care, and even public health initiatives.

The original technology used for whole genome sequencing was called Sanger sequencing or chain termination method, and it was invented in 1977. Although this method was revolutionary for its time, it was also very slow and expensive.

When DNA testing was first used, the data analysis required to sequence just one person’s DNA could take years to complete.

The Sanger method was later automated to make the process faster the automated version of this method was used to complete portions of the Human Sequencing Project, which was a wide-scale, international project that sequenced the base pairs that make up human DNA for the first time.

The Sanger method is still used today to sequence shorter DNA fragments, but newer sequencing methods have made the turnaround time of DNA tests faster while reducing sequencing costs.

These methods also called high-throughput or next-generation sequencing methods have made large-scale DNA testing accessible to a wider audience since they only require a few days to analyze a genome test while still producing high-quality results.

There are several types of DNA tests, and each process genetic information differently and for different purposes. Some types of DNA testing include:

  • Whole genome sequencing (WGS)
    • ​As stated above, WGS sequences the entirety of our genome data, including both coding and non-coding DNA. As its name suggests, this type of genetic testing can identify variations in any part of your genome.
    • Available from Sequencing.com, Illumina, and Oxford Nanopore.
    • Rather than sequencing an individual’s entire genome, this test only sequences the parts of their DNA and RNA that contain coding instructions, which are also known as exons. Many of the genetic mutations that lead to genetic disorders happen in the exome (which is the combination of all our exons), which is why this test can still be very useful despite the fact that it doesn’t analyze your entire genome.
    • Available from Illumina, GeneDx, and Ambry Genetics.
    • ​This method isolates specific regions of DNA to analyze them for mutations. This technique can identify variations in specific genes, which can be very useful if you only need to diagnose or rule out distinct variations — for example, when screening for a particular genetic disease.
    • Available from Illumina, GeneDx, and Ambry Genetics.
    • This test measures the variations of single nucleotide polymorphisms (SNPs) against reference genome fragments from members of the same species. SNPs are variations that occur in a single base pair of your DNA. SNPs are the most common type of genetic variation, and SNP genotyping can determine the set of variants that are present in a person’s DNA. Single SNP annotations can also be used in conjunction with WGS to assess the frequency of rare genetic variants and their consequences.
    • Available from Sequencing.com, 23andMe, Ancestry.com, MyHeritage, and FamilyTreeDNA.

    Whole genome sequencing and other sequencing methods shouldn’t be confused with DNA profiling, which is simply used to determine the likelihood of a DNA sample coming from a specific source. DNA profiling is widely used to help solve criminal investigations, but it doesn’t provide any further genomic data.

    Purpose of Whole Genome Sequencing

    For most of known history, human genetics and the role that genes play in our health were a mystery. In fact, DNA and genes are a relatively modern concept — the molecular structure of DNA was only identified in the 1950s. But thanks to the advent of DNA sequencing, scientists can now analyze raw DNA data to understand human health, how certain diseases work, and what we can do to prevent or treat illnesses more efficiently.

    The main objective behind DNA tests, in general, is to identify whether there are any mutations in your DNA that could cause health problems. These tests can also provide information about your genealogy, which can be fascinating on a personal level but also helpful when it comes to determining your risk for certain diseases.

    The information provided by genetic testing is also important for public health since it can be used to guide interventions and individualize them according to the genetic characteristics of different population groups.

    Genome Sequencing and Personalized Medicine

    Whole genome sequencing will play a very big role in the future of personalized medicine. For example, whole genome sequencing provides enough data to personalize therapeutic approaches and treatments to diseases so you’re most likely to receive a treatment that will provide the most benefit with the least risk of side effects.

    Instead of using the same treatment on all patients who suffer from the same condition, physicians could use sequencing data to individualize each patient’s management.

    These advancements wouldn’t just potentially improve patients’ outcomes — they could also help create a more comfortable patient experience since patients won’t have to test different treatments in order to find the right fit for them. Additionally, it could help lower healthcare costs and improve the workflow at medical facilities by providing a straightforward way to decide between different treatment options.

    DNA testing is also used in prenatal genetic counseling, especially for future parents who have a family history of genetic diseases or pregnancy loss. In some cases, genetic testing may be necessary to understand the cause of a patient’s fertility issues. WGS could also be used to detect illnesses and genetic abnormalities in unborn fetuses.

    Whole genome sequencing hasn’t been exclusively applied to humans. Sequencing the DNA of bacterial organisms and other pathogens can help scientists understand the disease better, determine the origin of new mutations, synthesize new medications and vaccines, combat drug-resistant pathogens, and even contain outbreaks of contagious diseases around the world.

    What Can Whole Genome Sequencing Reveal?

    One of the main reasons why whole genome sequencing tests have become so popular is because they help ascertain your predisposition to certain diseases. Specific variations in your DNA sequence can cause genetic disorders some of these mutations are inherited from one or both parents, whereas other variations occur de novo — meaning that this is the first time that this variation is present in a member of a family.

    But DNA sequencing can also tell us a lot about non-genetic disorders. When we think of genetic testing, our mind immediately goes to inherited rare diseases, but DNA testing can tell you whether you’re at risk of developing more common health conditions, such as high blood pressure or diabetes.

    This information can also inform other family members of possible health risks, even if they’re not the ones who took the DNA test.

    Some patients may be advised by their physician to take a DNA sequencing test to provide an accurate diagnosis for their symptoms after failing to discover their cause through other methods — WGS has been successfully used to diagnose genetic disorders in gravely-ill children and to modify the therapeutic management they received.

    Others may simply choose to take a DNA test to learn more about their ancestry. Since WGS analyzes your entire genome, it may reveal unexpected variations that aren’t currently related to any physical symptoms. These variations are often called “secondary findings”.

    Keep in mind that not all genetic variations will automatically generate a disease. Certain genetic changes increase a person’s risk of developing a health condition, such as breast cancer. Depending on the disease, this predisposition can be mitigated through medical treatment or lifestyle changes.

    Other genetic variants are benign and don’t affect our health at all. And in other cases, the exact implications of a genetic variant are still unknown — these variants are also known as “variants of uncertain significance”. It’s always important to discuss the results of your sequencing test with a specialist, such as a geneticist.

    WGS can also reveal your ancestry with a significant degree of accuracy. To do so, a sequencing service will compare the SNPs in your DNA against reference sequences from specific ethnic populations.

    SNPs have been found to be inherited through generations, which is why they’re reliable indicators that can be used to compare your DNA against different populations around the world, thus determining your most likely DNA ancestry. For this reason, SNP sequencing is also valuable in the field of evolutionary biology.

    How Is Whole Genome Sequencing Done

    In the past, genotyping human DNA was a long and expensive process — in fact, the Human Genome Project lasted 13 years —, but now, you can use a DNA kit from the comfort of your own home and get results in a few weeks.

    There are several modern DNA sequencing methods, including:

    • Illumina dye sequencing
    • Pyrosequencing
    • Single-molecule real-time (SMRT) sequencing
    • Nanopore sequencing

    In most cases, once you purchase a commercial direct-to-consumer sequencing test, you’ll receive a collection kit that you’ll be able to use at home. You’ll be instructed to swab the inside of your cheek and place the swab inside a labeled container before shipping it back to the provider.

    Collecting samples using these DNA testing kits is safe, quick, and painless. In other cases, the sample may be collected at a doctor’s office or lab.

    Since the human genome contains so much information, DNA tests can’t analyze it all at once. Instead, these methods use different techniques to break DNA into smaller pieces, and a sequencer is used to determine the order of the nucleotides in each of these DNA fragments. Then, bioinformatic technology is used to put all the pieces back together correctly so that they can be analyzed.

    Whole Genome Sequencing Results

    Depending on the type of DNA test that you’ve purchased, you’ll receive your results in a few days or weeks. Whole genome sequencing provides the most comprehensive type of genomic characterization that is currently available. Each whole genome sequencing test generates a colossal amount of data — after all, the human genome contains approximately 3 billion base pairs.

    But you won’t be receiving the sequencing results of 3 billion base pairs after mailing your DNA test kit back to the provider, of course. This amount of information would be practically impossible to process, even for a healthcare provider or scientist.

    Instead, your results will detail pertinent information regarding your health and genetic makeup. WGS can identify many types of variations in your DNA, such as single nucleotide variants, insertion/deletion (indel) polymorphisms in a specific nucleotide sequence, structural variants, copy number variants, among others.

    The results of a DNA testing kit can provide a wide range of information, including:

    • Single-gene or Mendelian disorders: as their name suggests, these disorders affect a single gene.
      • Your WGS will determine whether you suffer from one of these disorders or are at risk of developing one later on or passing one down to your children.
      • Single-gene disorders include sickle cell anemia, Huntington’s disease, cystic fibrosis, or muscular dystrophy.
      • As we mentioned earlier, this also means that your risk of developing these diseases can often be mitigated through medical intervention or a healthier lifestyle.
      • Some of these conditions include obesity, hypertension, and diabetes.
      • This data can be used to provide individualized medical care, decrease drug toxicity, and adjust medication dosages.

      Additionally, whole genome sequencing can also provide information regarding your ethnicity, ancestry, overall health and wellbeing, nutrition and fitness insights, and much more.

      Whole Genome Sequencing Cost

      Once upon a time — or really, just a few short decades ago — it would have been practically impossible for a private individual to cover the costs of having their DNA sequenced.

      But newer high-throughput sequencing methods can handle whole genomes quickly. In fact, certain modern sequencer machines (also called sequencing “platforms”) can even provide same-day results for small DNA fragments.

      As the processes involved in DNA sequencing have become faster and easier to access, the costs associated with testing have also gone down.

      As recently as 2009, genomic testing could cost approximately $50,000 per individual genome. Now, several companies offer whole genome sequencing for anywhere between $400 to $600, although some companies do charge higher prices.

      Whole Genome Sequencing Service

      In recent years, more and more biotechnology companies have started to offer genetic tests. Illumina is one of the biggest stakeholders in the field of genomics, having patented several different sequencer machines and DNA tests. They offer various sequencing platforms to fit different needs, from traditional whole-genome sequencing platforms used in clinics and research labs, to sequencers that can identify specific diseases.

      Other major genomics companies include Thermo Fisher Scientific and Oxford Nanopore Technologies — the latter of which created an innovative USB sequencer that can be attached to a desktop computer, opening the possibility of portable and convenient DNA sequencing tests.

      Pacific Biosciences is another important biotechnology company. They have introduced a type of real-time sequencing technology that is able to provide the longest DNA reads to date — 10,000 base pairs at once, compared to approximately 150 base pairs at once through other sequencing platforms. If perfected, this new approach could make DNA testing even faster and more accessible than ever before.

      Other companies that provide DNA sequencing include Knome, Sequenom, 454 Life Sciences, Life Sciences, BGI, Helicos Biosciences, Veritas Genetics, Complete Genomics, Affymetrix, and IBM, among others. Not surprisingly, the advent of new whole genomic sequencing technologies has generated public discussion surrounding their ethical implications, and the need to ensure the privacy of individuals who choose to take one of these DNA tests.

      We can’t stress how important it is to research your chosen provider before taking a genome test in order to understand their privacy and data protection policies.

      If you want to learn more about whole genome sequencing, head over to our education center to discover more in-depth articles on this innovative technique.

      1. Rui Yin, Chee Keong Kwoh, Jie Zheng. ⁠Whole Genome Sequencing Analysis. Encyclopedia of Bioinformatics and Computational Biology, Academic Press, 2019, Pages 176-183. ISBN 9780128114322.
      2. University of Leicester. ⁠Gene Expression and Regulation. Retrieved 2021 March 9.
      3. ⁠What are whole exome sequencing and whole genome sequencing? Medline Plus. Retrieved 2021 March 9.
      4. Razvan Cojocaru, Peter J Unrau. ⁠Origin of life: Transitioning to DNA genomes in an RNA world. Simon Fraser University, Canada. Nov 1, 2017. eLife 20176:e32330 DOI: 10.7554/eLife.32330.
      5. Center for Genomics and Global Health. ⁠Why genomics? Retrieved 2021 March 9.
      6. Steinberg, K. M., Okou, D. T., & Zwick, M. E. (2008). ⁠Applying rapid genome sequencing technologies to characterize pathogen genomes. Analytical Chemistry, 80(3), 520–528.
      7. Lewis, T. (2013, April 14). ⁠Human genome project marks 10th anniversary. In LiveScience. Retrieved 2021 March 9.
      8. National Human Genome Research Institute. (2016, January 15). ⁠DNA sequencing costs. In Large-scale genome sequencing and analysis centers (LSAC). Retrieved 2021 March 9.
      9. Fermín J. González-Melado, Chapter 12 - ⁠Whole-Genome Sequencing as a Method of Prenatal Genetic Diagnosis. Clinical Ethics At the Crossroads of Genetic and Reproductive Technologies, Academic Press, 2018, Pages 263-291, ISBN 9780128137642.
      10. Thermo Fisher Scientific. (2016). ⁠Sanger sequencing method. In Sanger Sequencing. Retrieved 2021 March 9.
      11. Thomas PE, Klinger R, Furlong LI, Hofmann-Apitius M, Friedrich CM (2011). ⁠Challenges in the association of human single nucleotide polymorphism mentions with unique database identifiers. BMC Bioinformatique. 12 Suppl 4: S4. DOI:10.1186/1471-2105-12-S4-S4.
      12. Mizzi C, Peters B, Mitropoulou C, Mitropoulos K, Katsila T, Agarwal MR, van Schaik RH, Drmanac R, Borg J, Patrinos GP. ⁠Personalized pharmacogenomics profiling using whole-genome sequencing. Pharmacogenomics. 2014 Jun15(9):1223-34.

      ⁠Dr. Brandon Colby MD is a US physician specializing in the personalized prevention of disease through the use of genomic technologies. He’s an expert in genetic testing, genetic analysis, and precision medicine. Dr. Colby is also the Founder of Sequencing.com and the author of ⁠Outsmart Your Genes.

      Dr. Colby holds an MD from the Mount Sinai School of Medicine, an MBA from Stanford University’s Graduate School of Business, and a degree in Genetics with Honors from the University of Michigan. He is an Affiliate Specialist of the American College of Medical Genetics and Genomics (⁠ACMG), an Associate of the American College of Preventive Medicine (⁠ACPM), and a member of the National Society of Genetic Counselors (⁠NSGC)


      Sequencing breakthroughs for genomic ecology and evolutionary biology

      Techniques involving whole-genome sequencing and whole-population sequencing (metagenomics) are beginning to revolutionize the study of ecology and evolution. This revolution is furthest advanced in the Bacteria and Archaea, and more sequence data are required for genomic ecology to be fully applied to the majority of eukaryotes. Recently developed next-generation sequencing technologies provide practical, massively parallel sequencing at lower cost and without the requirement for large, automated facilities, making genome and transcriptome sequencing and resequencing possible for more projects and more species. These sequencing methods include the 454 implementation of pyrosequencing, Solexa/Illumina reversible terminator technologies, polony sequencing and AB SOLiD. All of these methods use nanotechnology to generate hundreds of thousands of small sequence reads at one time. These technologies have the potential to bring the genomics revolution to whole populations, and to organisms such as endangered species or species of ecological and evolutionary interest. A future is now foreseeable where ecologists may resequence entire genomes from wild populations and perform population genetic studies at a genome, rather than gene, level. The new technologies for high throughput sequencing, their limitations and their applicability to evolutionary and environmental studies, are discussed in this review.


      Informations sur l'auteur

      These authors contributed equally: Wenyan Nong, Zhe Qu, Yiqian Li, Tom Barton-Owen, Annette Y. P. Wong.

      Affiliations

      School of Life Sciences, Simon F.S. Li Marine Science Laboratory, State Key Laboratory of Agrobiotechnology, The Chinese University of Hong Kong, Hong Kong, China

      Wenyan Nong, Zhe Qu, Yiqian Li, Tom Barton-Owen, Annette Y. P. Wong, Ho Yin Yip, Hoi Ting Lee, Satya Narayana, Jianquan Cao & Jerome H. L. Hui

      Centre for Ecology and Conservation, University of Exeter, Penryn, UK

      Tobias Baril & Alexander Hayward

      Dovetail Genomics, Scotts Valley, CA, USA

      State Key Laboratory of Agrobiotechnology, School of Life Sciences, The Chinese University of Hong Kong, Hong Kong, China

      Ting Fung Chan & Sai Ming Ngai

      School of Life Sciences, The Chinese University of Hong Kong, Hong Kong, China

      School of Biological Sciences, The University of Hong Kong, Hong Kong, China

      Leibniz Institute of Natural Product Research and Infection Biology – Hans Knöll Institute, Jena, Germany

      Department of Ocean Science and Hong Kong Branch of Southern Marine Science and Engineering Guangdong Laboratory (Guangzhou), Hong Kong University of Science and Technology, Hong Kong, China

      Department of Biology, Hong Kong Baptist University, Hong Kong, China

      Department of Computer Science and Engineering, The Chinese University of Hong Kong, Hong Kong, China

      Institute of Marine Biotechnology, Universiti Malaysia Terengganu, Terengganu, Malaysia

      Department of Bioscience and Biotechnology, Fakir Mohan University, Balasore, India

      Institute of Tropical Biodiversity and Sustainable Development, University Malaysia Terengganu, 20130, Kuala Nerus, Terengganu, Malaysia

      Research Division, Association for Biodiversity Conservation and Research (ABC), Odisha, 756003, India

      Institute of Oceanography and Maritime Studies (INOCEM), Kulliyyah of Science, International Islamic University, Kuantan, Malaysia

      Department of Cell and Systems Biology, University of Toronto, Toronto, Canada

      Department of Biology, Queen’s University, Toronto, Canada

      Department of Chemistry, City University of Hong Kong, Hong Kong, China

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

      Contributions

      J.H.L.H. conceived and supervised the study. W.N. carried out the genome assemblies and analyses, gene model predictions, microRNA mapping, and synteny analyses. Z.Q. carried out the microRNA annotation, final checking microRNA copies and arm switching analyses. Y.L. carried out the homeobox gene analyses, synteny analyses, and the SNP analyses in populations. T.B.O. carried out the homeobox gene identifications and tree construction. A.Y.P.W. carried out the gene and microRNA copies analyses and arm switching analyses. H.Y.Y. provided animal husbandry and logistics. H.T.L. carried out novel microRNA analyses. S.N. carried out the population structure analyses. T.B. and A.H. performed the T.E. analyses. T.S. involved in the final version of genome assembly, and J.C. involved in earlier version of genome assembly. T.F.C., H.S.K., S.M.N., G.P., P.Y.Q., J.W.Q., K.Y.Y., S.S.T., W.G.B., S.G.C., J.H.L.H. applied and obtained the funding. N.I., S.P., A.J., S.G.C. collected and provided samples in field. S.S.T., W.G.C., S.G.C., A.H., J.H.L.H. drafted the first version of the manuscript. All authors provided comments and approved the manuscript.

      Auteur correspondant


      Voir la vidéo: Comment séquencer le génome humain - Mark J. Kiel (Janvier 2022).