Una scoperta del CEND, Centro delle malattie neurovegetative di Milano, pubblicata da T.U. Marron et al. sul Journal of Neurochemistry, Volume 92, dell’8.11.2004 dà una spiegazione del fatto che i maschi adulti siano affetti con una frequenza doppia della norma da una forma sporadica di ALS (Sclerosi laterale amiotrofica), malattia progressiva dei motoneuroni che paralizza progressivamente i muscoli e può portare anche ad una forma di demenza fronto-temporale con cambiamento di personalità. Gli ormoni maschili Testosterone od il suo derivato 5-Diidrotestosterone (DHT), agiscono nei motoneuroni su di una proteina detta AR, cioè Recettore degli androgeni, legandosi ad essa. Gli androgeni possono sia attivare che reprimere diversi geni. Uno di questi geni che è stato identificato di recente è quello che produce nel topo la proteina Neuritina, responsabile dell’allungamento delle neuriti. Se l’AR funziona normalmente si ha produzione regolare del gene NRN1 (Cromosoma 6, Map locus 6p25.1) la cui proteina Neuritina fuori della cellula modula la crescita neuritica, potendo favorire la crescita degli assoni che partono dai motoneuroni e che permettono il normale funzionamento di cervello e dei muscoli. Se però l’AR non funziona normalmente gli ormoni si accumulano e producono effetti tossici per i motoneuroni, cosa visibile soprattutto su certi motoneuroni della colonna vertebrale per i quali si verificano i livelli massimi di espressione del recettore androgeno AR. Lo studio ha permesso di vedere direttamente su un modello di cellule di motoneuroni immortalizzate di topo esprimenti AR il fenomeno dell’aumento della neuritina e della ricrescita di assoni lesionati una volta che è stato messo in moto il meccanismo dei recettori AR – vedere www.pnas.org/cgi/content/full/94/6/2648 e http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=pubmed&dopt=Abstract&list_uids=15606892 Androgen-induced neurite outgrowth is mediated by neuritin in motor neurones.htm Impariamo a conoscere più da vicino la Neuritina. Apriamo il programma della NCBI (National Center for Biotechnology Information) http://www.ncbi.nlm.nih.gov con “Gene for…. Neuritin”, per cui abbiamo http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene&cmd=Retrieve&dopt=Graphics&list_uids=51299 Gene – neuritina.htm. Possiamo aprire anche http://www.ncbi.nlm.nih.gov/sutils/evv.cgi?contig=NT_034880.3&gene=NRN1&lid=51299 Evidence Viewer – neuritina.htm (“Evidence Viewer Homo sapiens NRN1″).
La figura allegata, non completa, ricavata da Gene – neuritina.htm, è utile per illustrare questo gene contrassegnato dalla sigla NT_034880 e la sua proteina derivata “precursor” siglata NP_05762.
Può servire d’aiuto anche Evidence Viewer, che mostra di questo gene vari modelli RefSeq e GenBank, ivi compresi l’mRNA (la molecola che serve come stampo, in inglese “template”, per la sintesi delle proteine o per la sintesi di cDNA), il cDNA (DNA complementare contenente solo sequenze espresse) e le EST (piccoli segmenti di cDNA usati per costruire le sequenze). In Gene – neuritina.htm [si veda sotto Transcripts and products] la continuità delle basi del gene entro il cromosoma è fornita dalla linea che va da 5943234 a 5952632 bp (coppie di basi o base pairs), con 4 esoni. Come è noto, un esone è un segmento sequenziale che codifica una porzione di mRNA (“RNA messaggero”) giuntato (“spliced”) e che può contenere anche una porzione di mRNA 5′ UTR o 3′ UTR (dove UTR = Untranslated region). Se si desiderano le schermate di tutto il gene bisogna andare su Map Viewer – neuritina gene.htm e poi cliccare “sv” (“Sequence viewer”), ad es. una di queste schermate si ha con l’indirizzo http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=37551285. Tutte le altre schermate delle “sequenze contigue” si hanno utilizzando le grosse frecce in avanti ed all’indietro indicate sulla pagina.
Se si continua ad esaminare Gene – neuritina.htm si trova un sommario della funzionalità del gene che dice presso a poco: Il gene in oggetto viene espresso sia durante lo sviluppo embrionale del sistema nervoso durante la post-mitosi (fase successiva alla divisione del nucleo) sia nella formazione delle strutture associate con la plasticità (cioè le proprietà di modellabilità del cervello) nell’adulto. L’espressione di questo gene può essere indotta dalla attività neuronale e dalle neurotrofine. La proteina codificata contiene un peptide che funziona da segnale di scissione ed è caratteristico delle proteine ancorate tramite il GPI (“Glicosilfosfatidilinositolo”). Le prove in vitro hanno dimostrato che questa proteina promuove la neuritogenesi, cioè la crescita e la ramificazione delle neuriti. Noi possiamo aggiungere che la plasticità, attraverso l’estensione o la retrazione delle connessioni sinaptiche con gli assoni in crescita e con le dendriti, è importante, perché è un componente della memoria dell’adulto.
Circa la voce Markers (“Sequence Tagged Sites/STS”) RH1540 (e-PCR) osserviamo quanto segue: “Marker”, sequenza caratteristica di DNA identificabile su di un cromosoma, in Italiano si potrebbe tradurre con “Sito marcatore”, “Locus marcatore”, “Marcatore genetico”; ma si preferisce usare la parola inglese. In generale i Marker hanno un significato piuttosto ampio e sono da considerarsi come pietre miliari sulla mappa genetica, indicando per lo più segmenti di DNA che danno spiegazioni dei caratteri ereditari, ad es. del colore degli occhi che il figlio eredita dal genitore, oppure che sono caratteristici di una malattia.
La sigla STS (Sequence Tagged Site) è semplicemente definita come una breve sequenza di DNA avente una esatta collocazione ed un ordine delle basi che la compongono e che si è dimostrata essere unica nel cromosoma in studio. Determinate con la PCR (“Polymerase chain reaction”), le STS sono utili per fare confronti con i risultati riportati da diversi laboratori in relazione a localizzazione e dati di sequenze.
Gli EST (“Expressed sequence tag”) non sono altro che STS derivate dai cDNA.
Si presenta una buona occasione per conoscere uno di questi Marker/STS riprendendo Gene – neuritina.htm e cliccando sulla pagina la sigla RH1540 sotto Markers. Si ottiene il file http://www.ncbi.nlm.nih.gov/genome/sts/sts.cgi?uid=20441 UniSTS – neuritina.htm, un’integrazione di Marker e mappe, che dà per Homo sapiens una sequenza di 132 bp risultante dallo e-PCR (“Electronic PCR”). Questo e-PCR è un algoritmo usato dal computer “per stabilire se una certa STS trovasi entro una data sequenza genomica, basandosi sulle corrispondenze tra le sequenze dei primer e la sequenza in oggetto e sulle appropriate orientazione e spaziatura dei due primer all’interno della sequenza” – http://genome.chop.edu/access/pages/def/epcr.html Definitions STS.htm – e-PCR Electronic PCR (ePCR).htm (fare prima www.changbioscience.com/primo/pcr/eElectronicsPCRssePCR.htm e poi chiedere l’informazione desiderata). In altre parole l’e-PCR, facendo simulazioni al computer tramite un database di sequenze, predice la struttura dei prodotti PCR e posiziona con complete sequenze segmenti di DNA entro i cromosomi. Informazioni più avanzate sulla e-PCR si possono avere con www.ncbi.nlm.nih.gov/genome/sts/epcr.cgi Electronic PCR – NCBI.htm.
Nel nostro caso per l’operazione PCR si sono impiegati il “Forward primer” attaacatttaacatccccccc ed il “Reverse primer” ctgttgttgatgcatccgtc – (sulla tecnica PCR si raccomandano gli articoli www.contexo.info/DNA_Basics/dna_sequencing.htm DNA Sequencing.htm e What are Primers.htm). Cliccando il link UniGene Hs.103291 sotto Cross References di UniSTS – neuritina.htm (quello corrispondente alla Neuritina 1) si passa ad una pagina che dà un confronto di sequenze depositate in UniGene con proteine di cui si conosce il genoma completo, ad es. si confronta NP_057672.1 Neuritina dell’Homo sapiens colla Neuritina del “Rattus norvegicus” NP_445798 (somiglianza 98.59 %). Gli allineamenti possono suggerire la funzione di un gene e varie altre informazioni, come le sequenze mRNA ed EST. Nel nostro caso troviamo elencate 15 sequenze mRNA e 10 sequenze EST – http://www.ncbi.nlm.nih.gov/UniGene/clust.cgi?ORG=Hs&CID=103291 UniGene – neuritina .htm.
Per vedere da vicino uno di questi EST possiamo fare così: Apriamo UniGene – neuritina.htm e clicchiamo sulla sigla BF967272.1 che è la prima sotto “EST Sequences” ricavando il file http://www.ncbi.nlm.nih.gov/UniGene/seq.cgi?ORG=Hs&SID=3085226 UniGene – neuritina EST I.htm. Troviamo, tra le varie informazioni, che l’EST BF967272.1 di GenBank ottenuto dall’ipotalamo dell’Homo sapiens ha una sequenza di 1029 basi e lo si può trovare nella Library: NIH_MGC_96 – dbEST 8570 (db vuol dire database).
Delle sigle indicate sotto la voce “NCBI Reference Sequences” (“RefSeq”) (presente più in basso su Gene – neuritina.htm, ma non visibile nella figura allegata) interessante è NM_016588 che dà il completo mRNA della Neuritina 1 (NRN1) dello “Homo sapiens” (questo “RNA messaggero” è anche indicato sull’estremità sinistra del diagramma – vedere figura). Altrettanto interessante è la proteina “Np_057672 precursor” di 142 amminoacidi codificata dal gene (che è anche indicata sull’estremità destra del diagramma – vedere figura), la cui sequenza di amminoacidi è:
1 mglklngryi slilavqiay lvqavraagk cdavfkgfsd cllklgdsma nypqglddkt
61 niktvctywe dfhsctvtal tdcqegakdm wdklrkeskn lniqgslfel cgsgngaags
121 llpafpvllv slsaalatwl sf
con gli amminoacidi aventi il simbolo ad una sola lettera. Rammento la tabella:
ammino acido – simbolo a tre lettere – simbolo ad una lettera:
- alanina ala a – arginina arg r – asparagina asn n – acido aspartico asp d – cisteina cys c – glutammina gln q – acido glutammico glu e – glicina gly g – istidina his h – isoleucina ile i – leucina leu l – lisina lys k – metionina met m – fenilalanina phe f – prolina pro p – serina ser s – treonina thr t – triptofano trp w – tirosina tyr y – valina val v
Da AF114833 posto sotto la voce “Related Sequences – Nucleotides Protein” si può avere il completo CDS (“Coding sequence”) dello mRNA. Tenere presente che i numeri di accesso delle sequenze dello mRNA di RefSeq cominciano sempre con NM_, quelle delle proteine di RefSeq cominciano sempre con NP_, mentre il corrispondente numero di accesso di GenBank è una combinazione di lettere e numeri senza la lineetta sottoscritta. Basta passare il mouse sulle barre di “Evidence Viewer” per metterne in evidenza il significato. Per ulteriori approfondimenti è possibile vedere anche altre “Related Sequences”, in particolare i cloni cDNA siglati “BC002683 CDS” e “BC042019 CDS”. Ricordiamo che cDNA è il DNA sintetizzato in laboratorio usando lo mRNA come stampo (“template”).
Per quanto riguarda l’indicazione Consensus CDS (CCDS) CCDS4495.1″ (presente ancora più in basso su Gene – neuritina.htm) c’è da dire quanto segue: I CD (“Domini conservati”) sono unità ricorrenti del gene che si sono mantenute costanti nella evoluzione molecolare. Una sequenza “consensus” viene calcolata dagli allineamenti forniti alla NCBI. Da questi allineamenti si ricavano colonne che devono essere rappresentate almeno per il 50% di tutte le sequenze (media ponderata) onde determinare l’estensione del consensus. In pratica nel CCDS sono riportati i residui che si sono incontrati più frequentemente in ciascuna colonna – vedere a questo proposito NCBI CDD Help.htm. C’è uno sforzo collaborativo tra vari gruppi di studio per realizzare un progetto “CCDS” allo scopo di stabilire “un nucleo centrale di regioni codificanti proteine umane coerentemente annotate e di alta qualità” – http://www.ncbi.nlm.nih.gov/CCDS/index.html CCDS Consensus CDS Project.htm.
Fatte queste premesse, proviamo a fare il seguente percorso: Sul solito Gene – neuritina.htm clicchiamo “Consensus CDS (CCDS) CCDS4495.1″ ricavando così il file http://www.ncbi.nlm.nih.gov/CCDS/CcdsBrowse.cgi?REQUEST=GENEID&TEST=&DATA=51299 CCDS Report for Consensus CDS – gene neuritina.htm. Se clicchiamo su quest’ultima pagina in successione i tre N blu (Nucleotid report) posti sulla verticale ricaviamo tre sequenze “Consensus CDS” (“CCDS”) in successione e possiamo verificare che esse sono tutte e tre contenute in NM_016588, che, come già indicato sopra, dà il completo mNRA della Neuritina 1 (NRN1) dello “Homo sapiens”. Se poi clicchiamo i tre N viola sulla verticale abbiamo graficamente gli intervalli delle tre sequenze, ad es. 5,944,208 – 5,944,436 per il primo intervallo.