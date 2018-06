Im Frühjahr 2000 stieg unter Genetikern das Wettfieber an, die Sequenzierung des Humangenoms im Projekt „HUGO“ stand vor dem Abschluss, aber keiner wusste, wie viele Gene herauskommen würden. Deshalb ersann Ewan Birney (Hinxton) bei einer Tagung den „GeneSweep contest“, in dem die Zahl abgeschätzt werden konnte, er nahm am Abend in einer Bar die ersten Wetten an, spätere kamen via E-Mail, über tausend Forscher boten mit: Die Schätzungen reichten von 27.462 bis 312.000.

Dann kam der große Tag: Am 26. Juni versammelte US-Präsident Bill Clinton die Spitzen der Genetik um sich, kein Wort war ihm zu groß: „Heute lernen wir die Sprache, in der Gott das Leben erschaffen hat. Dieses tief greifende Wissen wird der Menschheit ungeheure neue Heilkräfte bescheren und Diagnose und Therapie der meisten, wenn nicht aller Krankheiten revolutionieren.“

Über die Jahre wurden es weniger

Die Hoffnung trog, auch deshalb, weil man gar so viel von der Sprache des Lebens noch nicht gelernt hatte: Zum einen macht das, was wir Gene nennen, kaum mehr als ein Prozent des gesamten Genoms aus, und zum anderen war die offizielle Zahl der Gene reichlich vage: zwischen 20.000 und 30.000. Über die Jahre wurden es immer weniger, der letzte Stand – 18.894 – stammt vom März, er bezieht sich auf Gene, die Proteine „kodieren“, d. h. die Blaupause ihrer Information in RNA umschreiben (Transkription) und dann in die anderen Bausteine des Lebens umsetzen lassen (Translation), das ist die engste Definition. Lockerer kann man zu „Genen“ auch noch rechnen, was in RNA umgeschrieben, aber dann nicht übersetzt wird, das gibt es häufig, viele Gene regulieren so andere Gene, manche haben ihre Aktivität eingestellt, sind Pseudogene geworden.

Beide Gruppen hat nun Steven Salzberg (Johns Hopkins, Baltimore) gezählt, in höchst aufwendigen Analyseverfahren, gestützt auf Daten aus über dreißig Geweben von Hunderten Toten, die im Rahmen des Genotype-Tissue Expression (GTEx) project erhoben wurden: „Die neue Human-Gen-Datenbank umfasst 43.162 Gene, davon 21.306 kodierende und 21.856 nichtkodierende“ (BioRxiv 10.1101/332825).

Endgültig sind diese Zahlen nicht, Widerspruch kam rasch, etwa von Adam Frankish (Hinxton), er hat hundert der neuen kodierenden Gene durchgemustert (Nature, 556, S. 354): Nur eines kodierte wirklich.

