La statistica negli studi clinici: concetti chiave

Introduzione

I metodi statistici forniscono un resoconto formale delle cause della variabilità nelle risposte dei pazienti al trattamento. L’uso della statistica consente al ricercatore clinico di sviluppare deduzioni ragionevoli e accurate a partire dalle informazioni ottenute e di assumere decisioni affidabili in presenza d’incertezza. Nella ricerca medica, i dati statistici sono fondamentali per impedire errori e distorsioni. Il presente articolo si occupa di alcuni dei concetti statistici chiave e della loro applicazione negli studi clinici.

Test d’ipotesi

Un’ipotesi è una supposizione o insieme di supposizioni che a) afferma qualcosa su base provvisoria allo scopo di condurre una sperimentazione specifica oppure b) conferma qualcosa come molto probabile alla luce di fatti dimostrati.

Per i nostri obiettivi, siamo interessati all’ipotesi che afferma qualcosa, ad esempio che un nuovo trattamento per una malattia è migliore del trattamento standard esistente. Se il nuovo trattamento si chiama “B” e il trattamento standard si chiama “A”, l’ipotesi quindi afferma che “B” è migliore di “A”.

Si potrebbe supporre che gli scienziati inizino col provare questa ipotesi, ma non è così. Invece, tale obiettivo viene raggiunto in modo indiretto. Anziché tentare di dimostrare l’ipotesi B, il metodo scientifico suppone che A sia in effetti vera, cioè che non vi siano differenze tra lo standard terapeutico e il nuovo trattamento. Tale supposizione è nota come ipotesi “nulla”. Gli scienziati provano quindi a smentire A: questa procedura è anche nota come dimostrazione della falsità dell’ipotesi nulla. Se accade che si riesca a provare l’ipotesi A falsa e che il trattamento standard non sia migliore di quello nuovo, ne consegue che B sia vera e il nuovo trattamento migliore di quello standard.

Perché si fa in questo modo?

Non esiste una risposta semplice, questo è il metodo generalmente accettato, sviluppato nell’ambito della scienza moderna, ma utilizzare un’analogia nel campo legale può aiutarci. L’ipotesi nulla si riferisce alla nostra situazione o conoscenza attuale (in analogia con l’ambiente di un tribunale, che “l’accusato è innocente”), di cui dobbiamo fidarci a meno di non avere sufficienti prove contrarie. Ma se tentassimo di provare l'”ipotesi alternativa” (come noto, quella contraria all'”ipotesi nulla”), allora in effetti “l’accusato è colpevole”.

Un altro modo, forse più semplice, per arrivare a questo concetto è citare Albert Einstein:

“Nessuna quantità di sperimentazioni potrà mai dimostrare che ho ragione; un unico esperimento può provare che ho torto”.

Ciò sembra suggerire che cercare di dimostrare l’ipotesi nulla vera o falsa è un obiettivo più rigoroso e raggiungibile rispetto a tentare di provare la correttezza dell’ipotesi alternativa. Si noti che questo non spiega in modo appropriato il motivo per cui la scienza adotti tale approccio, ma forse può aiutare a farci comprendere e accettare più facilmente un concetto difficile.

Errori di tipo I e II

Osservando la tabella sotto, è possibile vedere la differenza tra errori di tipo I (falsi positivi) ed errori di tipo II (falsi negativi).


	Ipotesi nulla vera	Ipotesi nulla falsa
Rifiuto dell’ipotesi nulla	Errore di tipo I “falso positivo”	Risultato corretto “vero positivo”
Rifiuto dell’ipotesi nulla non riuscito	Risultato corretto “vero negativo”	Errore di tipo II “falso negativo”

Si tratta di un concetto che crea comunque molta confusione, quindi al fine di formularlo in termini più semplici, ecco qui un esempio molto estremo:

Gli errori di tipo I potrebbero uccidere un paziente: immaginate uno studio che abbia appena scoperto, in modo errato, che lo standard di cura non è migliore del nuovo trattamento e che di conseguenza ai pazienti sia stata somministrata la nuova terapia, con risultati catastrofici. Commettendo errori di tipo I, si rileverà in modo errato un effetto che non è presente.
Fare errori di tipo II significa che una ricerca potenzialmente preziosa sarà sprecata. Forse tale ricerca sarebbe potuta essere veramente utile, ma poiché non si tengono ulteriori studi, non viene fatto alcun danno ai pazienti. Commettendo errori di tipo II, non si riesce a rilevare un effetto che è presente.

È chiaro, quindi, che gli errori di tipo I sono più gravi degli errori di tipo II dal punto di vista dei pazienti.

Livello di significatività

Il livello di significatività è la probabilità di commettere un errore di tipo I. Questa misura è influenzata dalla dimensione del campione e dalla “potenza statistica” del test.

Potenza statistica

La “potenza” di un test statistico è la probabilità che questo porti in modo corretto al rifiuto dell’ipotesi nulla o, in altre parole, la capacità del test di individuare un effetto, se quell’effetto realmente esiste. Un’altra definizione di “potenza” di un test è la probabilità di NON commettere un errore di tipo II.

Valori p

I valori p o valori della “probabilità” misurano la forza dell’evidenza su una scala da 0 a 1. Un valore p piccolo (di solito inferiore allo 0,05 o al 5%) indica che vi è una forte evidenza contro l’ipotesi nulla, il che potrebbe portare a rifiutarla, mentre un valore p grande (superiore a 0,05) indica il contrario.

Correlazione contro causazione

Analizzando i risultati provenienti da uno studio clinico, è importante ricordare che una correlazione non è una causazione. Una correlazione si verifica quando due variabili sono in qualche modo legate; tuttavia, ciò non significa che una sarà la causa dell’altra (vi è un’associazione tra le due variabili). Un esempio a proposito riguarda la terapia ormonale sostitutiva (TOS) e la cardiopatia coronarica (CHD, coronary heart disease), in cui le donne che assumevano la TOS erano a minor rischio di CHD. Ciò, tuttavia, non era dovuto all’effettiva procedura di TOS, ma piuttosto al fatto che il gruppo d’individui che la ricevevano tendevano ad appartenere a un gruppo socio-economico più elevato, con una dieta e regimi di attività fisica migliori della media.

La causazione può essere osservata quando un fattore causa un risultato. Un fattore causale spesso è una causa parziale di un risultato. Al fine di differenziare tra correlazione e causazione, è importante registrare più informazioni possibili riguardo ai partecipanti agli studi clinici. Inoltre, è indispensabile nel loro disegno applicare la metodologia scientifica in modo preciso e valutare le possibili distorsioni durante la sperimentazione.

Manipolazione dei dati

La manipolazione di dati è la pratica di registrare non correttamente i dati in modo selettivo o di generare risultati ingannevoli. Un caso del genere potrebbe presentarsi quando sono intenzionalmente scartati dati che discordano dai risultati previsti, al fine di aumentare la quantità di risultati che confermerebbero le ipotesi dichiarate. Quando un ricercatore elimina degli outlier (risultati molto superiori o inferiori a quello più prossimo) dai risultati, è importante verificare che questi siano veramente degli outlier e non solamente esiti che differiscono da quelli attesi o desiderati. Un altro esempio di manipolazione di dati si verifica quando l’addetto alla loro raccolta genera in modo causale un intero set di dati a partire da una misurazione raccolta riguardante un solo paziente.

Trasformazione dei dati

La trasformazione dei dati è l’applicazione di una formula matematica ad alcuni dati acquisiti tramite uno studio clinico. Viene spesso utilizzata per rendere la presentazione delle informazioni più chiara o semplice da comprendere. Ad esempio, al fine di misurare l’efficienza del carburante per auto, è naturale utilizzare la forma “chilometri per litro”. Tuttavia, se si valutasse la quantità di carburante in più necessaria per aumentare la distanza percorsa, questa sarebbe espressa in “litri per chilometro”. In tale caso, l’applicazione di una formula non corretta allo scopo di ottenere una nuova presentazione di questi dati inciderebbe sui risultati generali dello studio clinico.

Unione dei dati

L’unione dei dati è la combinazione di dati provenienti da diversi studi al fine di ottenere una migliore comprensione di una situazione. Una delle sue forme più comuni è la metanalisi, in cui i risultati di molti studi clinici pubblicati sono raccolti insieme per essere aggregati e confrontati. Mentre si esegue una metanalisi, è importante controllare accuratamente che le metodologie degli studi clinici siano identiche o comparabili. Deve essere presa in considerazione qualsiasi differenza riguardante il disegno, in modo che non vi siano diverse variabili sottostanti (variabili confondenti). Un esempio di unione errata di dati potrebbe essere l’aggregazione di dati da vari studi clinici con differenti specie di topi come animali da test.

A2-4.33.3-V1.1