7- Le code génétique

L'ADN est avant tout une information. L'ADN contient, inscrit dans sa structure même, toutes les informations nécessaires à la cellule pour synthétiser les milliers de protéines différentes qui sont nécessaire à sa survie. C'est, en quelque sorte, l'équivalent du disque dur de votre ordinateur. Un disque dur sur lequel on retrouverait des recettes de protéines.

Mais comment une molécule peut-elle constituer une information? Comment cette molécule peut-elle indiquer à la cellule comment synthétiser du lysozyme ou de l'hémoglobine?

Prenons, comme exemple, l'information nécessaire pour synthétiser du lysozyme. On pourrait écrire cette information en représentant chacun des 130 acides aminés de la chaîne par trois lettres de l'alphabet latin. On obtiendrait ceci:

Le lysozyme
LYS VAL PHE GLU ARG CYS GLU LEU ALA ARG THR LEU LYS ARG LEU GLY MET ASP GLY TYR ARG GLY ILE SER LEU ALA ASN TRP MET CYS LEU ALA LYS TRP GLU SER GLY TYR ASN THR ARG ALA THR ASN TYR ASN ALA GLY ASP ARG SER THR ASP TYR GLY ILE PHE GLN ILE ASN SER ARG TYR TRP CYS ASN ASP GLY LYS THR PRO GLY ALA VAL ASN ALA CYS HIS LEU SER CYS SER ALA LEU LEU GLN ASP ASN ILE ALA ASP ALA VAL ALA CYS ALA LYS ARG VAL VAL ARG ASP PRO GLN GLY ILE ARG ALA TRP VAL ALA TRP ARG ASN ARG CYS GLN ASN ARG ASP VAL ARG GLN TYR VAL GLN GLY CYS GLY VAL

Les trois caractères LYS, par exemple, codent pour l'acide aminé lysine; les caractères VAL codent pour la valine, etc.

Cependant, ce code serait inutilisable pour la cellule. On voit difficilement comment on pourrait entrer cette recette faite d'un alphabet latin dans la cellule et comment on pourrait lui apprendre à l'utiliser (à décoder la recette) pour fabriquer du lysozyme.

Pourtant cette recette du lysozyme est bien présente dans chacune de vos cellules. Comme nous le verrons, elle n'est pas écrite avec des lettres de l'alphabet, mais avec des molécules, plus précisément des nucléotides. Les nucléotides forment un code que la cellule peut lire et reproduire.

Les protéines
Sur la piste de l'ADN
Les nucléotides
La double hélice
L'ADN dans la cellule

La réplication

Le code génétique

 

 

 

 


Pour comprendre ce code, utilisons une analogie.

Supposons que vous voulez écrire un message secret en utilisant des billes de couleur que vous enfilez sur un fil. Vous devez donc faire correspondre des billes à des lettres de l'alphabet. Supposons aussi que vous disposez de seulement quatre couleurs de billes: rouge, jaune, vert et bleu.

On pourrait, par exemple, former un code où chaque bille correspondrait à une lettre de l'alphabet. La jaune, par exemple, pourrait correspondre à la lettre A, la verte à la lettre B, la bleue à la lettre C et la rouge à la lettre D. Vous voyez immédiatement le problème. Notre code ne permettrait que de désigner 4 lettres sur les 26 de l'alphabet. On pourrait écrire BABA (vert-jaune-vert-jaune) ou BAC (vert-jaune-bleu), mais pas BIOLOGIE.

Regroupons les billes deux par deux. Par exemple: bleu-rouge correspondrait à "A", jaune-vert à "B", bleu-bleu à "C" et ainsi de suite.
"BABA" s’écrirait alors:

C'est déjà mieux, on a maintenant 16 combinaisons possibles ( 4). Malheureusement, ce n'est pas assez puisque l'alphabet comporte 26 lettres.

Regroupons alors les billes par trois. Par exemple, décidons que les trois billes jaune-bleu-rouge représentent la lettre A, bleu-jaune-vert la lettre B, jaune-rouge-rouge la lettre C et ainsi de suite jusqu'à Z. Avec des combinaisons de trois billes, on peut former 64 combinaisons différentes ( 43 ), c’est plus que ce qui est nécessaire pour coder 26 lettres. On pourrait ainsi rédiger un message en enfilant des billes de couleur sur un fil.

« BABA » s’écrirait en enfilant dans l’ordre, les billes:

 

 

 

 

 

 

Quiconque connaît le code utilisé pourrait lire le message en regardant la succession des billes de couleur formant le chapelet. La séquence des billes constitue un message codé. Sauriez-vous, avec ce code, écrire « BAC »?

Plutôt qu’utiliser des billes, utilisons quelque chose de beaucoup, beaucoup plus petit, des nucléotides. Il y a quatre sortes de nucléotides, A, T, C et G. Lions ces nucléotides les uns aux autres comme les billes de couleur de l'exemple précédent. On pourrait imaginer un code où chaque groupe de trois nucléotides correspondrait non pas à une lettre de l’alphabet (la cellule n’a que faire de l’alphabet romain) mais à un des 20 acides aminés formant les protéines. On pourrait ainsi former des messages correspondant à la recette d’une protéine.

Convenons, par exemple, que les trois nucléotides A-A-A représentent l’acide aminé phénylalanine, G-A-C représentent la leucine, T-C-T l’arginine et ainsi de suite.
A-A-A = PHE
G-A-C = LEU
T-C-T = ARG


La protéine formée des cinq acides aminés Phé-Arg-Leu-Phé-Leu pourrait être représentée (codée) par la chaîne formée des nucléotides:

On aurait ainsi une molécule (un polymère de nucléotides) qui représenterait, sous forme codée, la recette d’une protéine. On pourrait aussi mettre « bout à bout », des milliers de recettes différentes. Eh bien, l'ADN d'un chromosome, c’est exactement ça!

Imaginez chaque chromosome comme une longue, une très longue succession de nucléotides, un chapelet pouvant avoir une centaine de millions de perles. Chaque groupe successif de trois nucléotides désigne un acide aminé selon un code préétabli connu par les cellules et chaque recette de protéine constitue un gène.

C'est au début des années 60 qu'on a réussi à trouver le code (nous verrons plus loin comment) :

Le code génétique

Dans l'exemple des billes, c'est moi qui ai arbitrairement décidé du code. J'ai fait correspondre, par exemple, les billes jaune-bleu-rouge à la lettre A. J'aurais pu utiliser une autre combinaison.

Mais dans le cas du code génétique, "qui" ou "quoi" a décidé du code ? Pourquoi est-ce AAA qui code pour la phénylalanine et non une autre combinaison de nucléotides? Actuellement on ne le sait pas. On imagine que le code s’est formé au tout début de l’histoire de la vie, il y a plus de trois milliards d’années. Mais on ne peut absolument pas expliquer pourquoi c’est ce code (celui que vous pouvez voir en cliquant sur le lien à gauche) qui a été retenu par la nature.

Peut-être que plusieurs codes différents se sont même formés au tout début de la vie. Mais même si ça a été le cas, il n'en reste plus qu'un aujourd'hui, celui que vous pouvez observer en cliquant sur le lien à gauche. Ce code est dit universel, il est le même pour tous les êtres vivants.

Si la vie existe ailleurs dans l’univers, on ne sait pas si elle est basée, comme la nôtre, sur une information génétique faite d’ADN et, si c’est le cas, si le code est le même que le nôtre.

 

Voyez, par exemple, la séquence de nucléotides codant pour les acides aminés de la calmoduline, une enzyme intervenant dans la régulation de l'activité de plusieurs enzymes.

Bien sûr, l'ADN est constitué de deux chaînes complémentaires. L'information n'est portée que par une des deux chaînes, parfois l'une, parfois l'autre. La chaîne complémentaire au message est là pour stabiliser la molécule et lui permettre de se reproduire (réplication).

Le segment d'ADN correspondant à la recette d'une protéine est appelé gène. Le segment d'ADN ci-dessous correspond donc au gène de la protéine PHE-ARG-LEU-PHE-LEU

Gène de la protéine PHE-ARG-LEU-PHE-LEU. L'information est portée par le brin du bas (et elle se lit dans la direction 3' - 5' ). Le brin du haut sert à stabiliser la molécule et lui permet de se reproduire.

L'ADN constitue donc une information miniaturisée (le minuscule noyau d'une cellule peut contenir des dizaines de milliers de gènes différents). Et le plus beau de l'histoire, c'est que cette information peut en plus se reproduire !

 


Attention, le segment d'ADN codant pour la cystéine (CYS), ce n'est pas de la cystéine, pas plus que le mot "pomme" n'est une pomme.

Le triplet de nucléotide ACG désigne la cystéine, ce n'en est pas!

Voir : La structure de l'ADN et le code génétique (cliquez sur "Codon", le dernier bouton à droite).

 

Et si on mettait tout ça en musique?
Transcriptions The Music of Protein Sequences

Des biologistes à l'esprit musical ont eu l'idée de mettre les protéines en musique. Ils ont assigné une note de musique à chacun des vingt acides aminés de sorte que la séquence de la protéine devienne la partition de la pièce musicale. La durée de la note est déterminée par le nombre de triplets d'ADN codant pour l'acide aminé correspondant. Par moment, une harpe accompagne la note en jouant des notes correspondant aux nucléotides codant pour l'acide aminé. Les structures secondaires de la protéine (hélices alpha ou feuillets bêta) correspondent à des notes jouées par des instruments d'accompagnement. Les régions hydrophobes ou hydrophiles peuvent aussi intervenir. Enfin, consultez cette page du site pour plus de détails sur les règles musicales appliquées et pour écouter quelques exemples. Le résultat est assez étonnant!

Plusieurs autres protéines musicales sur cette page.

Évitez une erreur fréquente, souvent vue dans les journaux : ne confondez pas code génétique et information génétique. Le code génétique, c'est la correspondance entre un triplet de nucléotides et un acide aminé. Ce code est le même pour tous les êtres vivants. L'information génétique, c'est la séquence des nucléotides, les recettes de protéines. L'information génétique n'est pas la même d'un être vivant à l'autre (sauf les clônes comme les jumeaux identiques).

Un gène = l'information complète, sous forme d'ADN, nécessaire pour synthétiser une protéine.

Ex. gène du lysozyme, gène du collagène, gène de l'insuline, etc.

Cette définition n'est pas tout à fait exacte comme nous le verrons plus loin.

On ignore le nombre total de gènes contenus dans le génome humain. Les dernières estimations avancent un chiffre variant entre 30 000 et 40 000. Certains auteurs croient qu'il y en aurait plus. Ces gènes ne représentent qu'environ 1% du total de l'ADN du génome. 3% correspondrait à des séquences qui contrôlent l'expression des gènes. Le 96% restant n'a pas de rôle dans la synthèse des protéines. Une partie joue un rôle dans le repliement et la séparation des chromosomes au cours de la division cellulaire et ce qui reste ne semble pas avoir de fonction (nous y reviendrons).

À lire et à visionner:
Le génome au propre

Un document tiré de l'émission Découverte de Radio-Canada. Visionnez le reportage vidéo (cliquez sur l'icône au bas de la page)

 

 

Combien de nucléotides contiendrait un gène codant pour une protéine de 100 acides aminés?

© Gilles Bourbonnais / Cégep de Sainte Foy