Nel genoma umano è possibile crittografare il 20% di informazioni in meno rispetto a quanto si pensava in precedenza. In un nuovo studio, un team internazionale di scienziati ha dimostrato che solo l'80% dei geni nel DNA umano codifica effettivamente per qualsiasi proteina, mentre il resto ha perso questa capacità. I risultati della ricerca sono pubblicati sulla rivista Nucleic Acids Research.
Ci sono 23 coppie di cromosomi nel genoma umano. Contengono circa 28.000 geni, ma non tutti portano le informazioni ereditarie necessarie per la sintesi proteica. Alcuni svolgono una sorta di funzione ausiliaria, mentre altri non fanno nulla, avendo perso la capacità di codificare le proteine nel processo di evoluzione e numerose mutazioni. Tali aree sono chiamate pseudogeni. Un team di scienziati provenienti da Spagna, Regno Unito e Stati Uniti ha scoperto che un quinto del genoma umano è costituito da pseudogeni non funzionali.
Gli autori hanno confrontato i database di tre diversi progetti di ricerca sul genoma: GENCODE / Ensembl, RefSeq e UniProtKB. In totale, gli scienziati hanno trovato 22.210 geni che trasportano informazioni su qualsiasi proteina. Solo 19.446 di loro sono finiti in tutti e tre i database. Quindi i ricercatori hanno iniziato ad analizzare i restanti 2.764 geni e hanno scoperto che quasi tutti sono in realtà pseudogeni, cioè non codificano alcuna proteina. Inoltre, a questo numero sono stati aggiunti altri 1.470 geni, indicati in tutti e tre i database.
In totale, come risultato dello studio, gli scienziati hanno trovato 4234 pseudogeni. Queste informazioni sono già state aggiunte al database del progetto internazionale GENCODE. Ora gli scienziati devono controllare questi dati studiando in dettaglio ciascuno degli pseudogeni scoperti. Dopo la verifica, 300 di loro hanno già ricevuto lo status di "pseudogene".