biostatistica forense

Cos’è la biostatistica forense

Per chi ne ha avuto a che fare o chi ne vorrà richiedere uno, il risultato dei test del DNA di paternità viene sempre accompagnato da due valori, LR (rapporto di verosimiglianza) e P (Probabilità di paternità), ma sono in pochi a capirne il significato.

Tali valori sono il frutto di complessi calcoli statistici applicati alla biologia, da qui “biostatistica”, che servono per dare valore al risultato del DNA.

I test del DNA di paternità si basano sul concetto che individui imparentati condividono alleli in una maggiore proporzione rispetto ad individui presi a caso nella popolazione.

Il valore LR o indice di paternità combinato da cui poi scaturisce il risultato del valore percentuale P è un valore statistico che si basa sulla probabilità che il presunto padre sia il padre effettivo del soggetto figlio comparandolo con un soggetto preso a caso dalla popolazione mondiale.

Per farla brevemente LR è una frazione dove al numeratore sono presenti le percentuali di probabilità espresse in forma decimale degli alleli che il padre ha passato al figlio tutte moltiplicate tra loro e al denominatore sono presenti tutte le frequenze nella popolazione dei marcatori analizzati. Se il valore LR è maggiore di 10.000 viene universalmente riconosciuto come attribuzione di paternità dalle linee guida SIGU del 2013.

Da qui in poi useremo un linguaggio più specifico e approfondiremo meglio i concetti introdotti in questo paragrafo per i “temerari” che hanno voglia di capire meglio la biostatistica

Cosa succede nel Test di Paternità?

Le analisi di paternità vanno ad analizzare il genoma del presunto padre mettendolo a confronto con quello del figlio. Le sequenze di DNA che vengono analizzate sono chiamate marcatori STR (Short-Tandem-Repeat).

Gli STR sono delle regioni di DNA ad alto tasso di variabilità nella popolazione umana e, prendendo come riferimento molte di queste regioni (almeno 19) possiamo discriminare con assoluta certezza un essere umano dal resto della popolazione mondiale e scoprire se un “presunto padre” è il vero padre biologico di una persona.

Gli unici due risultati del test del DNA sono “attribuzione di paternità” in caso di esito positivo e “non compatibilità di paternità” in caso di esito negativo.

Test di paternità negativo

Vuol dire che non vi è compatibilità tra i marcatori del figlio e del presunto padre e per questo il test può ritenersi concluso. Sul referto verranno riportati valori di LR e P uguali a zero in quanto non è presente alcuna corrispondenza da poter quantificare. Il test può considerarsi così concluso.

Test di paternità positivo

In caso di esito positivo e quindi compatibilità genetica è necessario quantificare il “peso” dell’osservazione. A questo punto occorre affidarsi alla probabilità per dare valore al nostro test. Uno dei concetti alla base di un calcolo probabilistico è che per valutare l’incertezza di una data ipotesi è necessario considerare almeno una ipotesi alternativa

Nel caso di un test di paternità è possibile formulare due ipotesi alternative:

H1= PP (presunto padre) è il padre biologico di F (figlio);
H2= Un uomo preso a caso nella popolazione è il padre di F.

Il rapporto di verosimiglianza (LR) misura la forza dell’evidenza in relazione a un’ipotesi ed è il valore che ci serve per dare peso al risultato dei marcatori STR. Nel nostro caso al numeratore di questo rapporto abbiamo l’evidenza (H1) e al denominatore l’ipotesi (H2).

LR= (H1/H2)

Ma come si calcolano questi LR, H1 ed H2? Attraverso l’indice di paternità P.I. e l’indice di paternità combinato (C.P.I).

LR = (H1/H2) = P.I.

Esempio:

Madre AB, Figlio AC, Padre AC (*A/B/C rappresentano gli alleli di un marcatore STR)

L’allele paterno obbligato è l’allele C (in quanto la madre passa al figlio l’allele A non avendo il C).

Prendendo la formula precedente del calcolo dell’LR o P.I. che dir si voglia:

  • Numeratore: Probabilità che il padre trasmetta l’allele obbligato = ½ (0,5) (per la legge di segregazione di Mendel);
  • Denominatore: Probabilità che un individuo a caso della popolazione trasmetta l’allele obbligato è uguale alla frequenza dell’allele nella popolazione (per il principio di Hardy-Weinberg) = 0,1 (valore indicativo trovato dopo aver confrontato l’allele con una banca dati di frequenze alleliche)

Il risultato del rapporto P.I è quindi: P.I. = 0,5/0,1 = 5

Il valore P.I. considera un singolo locus genico, ma dato che la nostra analisi genetica ha considerato almeno 19 marcatori STR (e quindi 19 loci genetici) per ottenere il calcolo statistico complessivo entra in gioco il C.P.I. ovvero il risultato della moltiplicazione di tutti i valori P.I. ottenuti nei singoli loci.

Un valore di C.P.I. > 10.000 viene considerato sufficientemente alto da far ritenere il Presunto Padre il vero padre biologico del Figlio.

C.P.I. > 10.000 significa: “E’ 10.000 volte più probabile ottenere i risultati osservati (i profili genetici del padre e figlio analizzati) se il presunto padre (piuttosto che un uomo preso a caso dalla popolazione) è il vero padre biologico.

CPI è una misura della forza dell’evidenza genetica di paternità.

Perché il risultato del test non può essere 100%?

Per esprimere la significatività del test in un valore comprensibile anche ai meno esperti si tende ad utilizzare la Probabilità di paternità (P).

Il valore di P si calcola grazie alla formula di “Essen-Möller” espressa come:

P=CPI/CPI+0.5

Come potete vedere questo valore, non può mai essere uguale al 100%, per soli motivi matematici.

Un valore del 99,73% o superiore è sufficiente per considerare una paternità come praticamente provata.

 

N.B.Il contenuto di questo articolo è stato semplificato per la lettura da parte di utenti non esperti del settore per poter rendere il più possibile comprensibili termini, tecniche e concetti alla base di una materia complessa come la biostatistica forense, la cui piena comprensione è possibile solamente dopo anni di studio accurato di fondamenti di biologia, algebra, probabilità, statistica. Per tali motivi sono state volutamente omesse parti prolisse, superflue o che avrebbero potuto distrarre l’attenzione dell’utente.