Génome humain : 30.000 ou 120.000 gènes ?

La détermination du nombre de gènes composant le génome humain reste une entreprise délicate. Plusieurs équipes s'affrontent, certains scientifiques avancent le nombre de 120.000 gènes alors que d'autres auteurs les estiment beaucoup moins nombreux. Deux articles parus dans le numéro de juin de Nature Genetics semblent confirmer cette tendance à la baisse, ce nombre avoisinerait les 30.000 selon ces estimations.

Connaître le nombre de gènes chez l'homme présente deux enjeux selon les "applications" qui en découleront. Sur le plan des maladies génétiques, il est évident qu'un nombre restreint de gènes facilitera l'étude et la mise au point éventuelle de traitements. Parallèlement à cette approche appliquée, la connaissance du nombre de gènes amènera une question (ou réponse) essentielle : est-ce que la complexité biologique est liée au nombre de gènes ?

Brent Ewing et Phil Green (Université du Washington, Seattle) ont réalisé une estimation en se servant des données du séquençage du chromosome 22. Il existerait selon eux environ 35.000 gènes.

Ce résultat est en accord avec les travaux menés par l'équipe de Jean Weissenbach (Genoscope et CNRS FRE2231). Ces derniers ont effectué une étude comparative des séquences génomiques d'un poisson (le tetradon ou Tetraodon nigroviridis) et des séquences disponibles du génome humain. Leur méthodologie conduit à une estimation de 28.000 à 34.000 gènes chez l'homme.

Le séquençage récent de deux chromosomes a permis d'évaluer de façon pertinente et sensible le nombre de gènes présents sur les chromosomes 21 et 22. Ce nombre est plus faible que celui attendu. Si l'on extrapole ce nombre à la longueur totale du génome (qui elle ne laisse aucune ambiguïté), on approche les 40.000 gènes.

Contrairement aux deux travaux précédents, le Dr J. Quackenbush (Institute for Genomic Research, Rockville, USA) et ses collaborateurs estiment que ce nombre est beaucoup plus élevé : environ 120.000 gènes constitueraient le génome humain. Leur étude, publiée dans le même numéro de Nature Genetics que celles de J. Weissenbach et Brent Ewing, a fait appel à une approche différente. Ils ont utilisé des séquences EST (Expressed Sequence Tags) qui sont des ADN complémentaires issus de la transcription inverse des ARNm.

Cependant, comme le souligne l'éditorial de Nature Genetics, cette technique comprend plusieurs limitations et notamment le fait que des collections d'EST ne peuvent représenter de façon pertinente un génome. En effet, un gène peut générer des ARNm différents (phénomène de splicing), ce qui accroît considérablement les risques de redondances (plusieurs EST différentes correspondraient à un même gène). L'estimation dépend donc de la validité des précautions prises pour l'analyse des banques de données.

Le problème du nombre de gènes ne semble donc pas encore réglé mais le séquençage complet du génome humain (dans l'année à venir selon les dernières estimations) devrait permettre de trancher.

Un nombre modéré de gènes chez l'homme renforcerait l'idée actuelle selon laquelle la complexité biologique est orchestrée au niveau de la protéine, par des régulations de l'expression ou des profils de splicing par exemple. Ces recherches suggèrent également que l'objectif principal du séquençage, qui reste la compréhension de la fonction et de l'interaction des gènes sera une entreprise délicate.

Source : Nature Genetics 2000;25:127-128, 129-130, 232-234, 235-238, 239-240

Descripteur MESH : Gènes , Génome , Génome humain , Chromosomes , ADN , Collections , Compréhension , Connaissance , Éditorial , Étude comparative , Nature , Transcription inverse , Washington

Recherche scientifique: Les +