Statistica și studiile clinice: Noțiuni de bază

Introducere

Metodele statistice asigură integrarea formală a surselor de variabilitate care apar în cadrul reacțiilor pacienților la tratament. Utilizarea statisticii permite unui cercetător clinic să efectueze deducții rezonabile și exacte pe baza informațiilor colectate și să ia decizii întemeiate atunci când există incertitudini. Statistica este esențială pentru prevenirea greșelilor și erorilor sistematice în cercetarea medicală. Acest articol discută câteva noțiuni de bază de statistică și aplicațiile acestora în cazul studiilor clinice.

Testarea ipotezei

O ipoteză este o presupunere sau un set de presupuneri care a) face o afirmație cu titlu provizoriu, în vederea direcționării investigației științifice, sau b) confirmă o afirmație ca având un nivel înalt de probabilitate, în lumina informațiilor deja cunoscute.

Pentru scopurile acestei discuții, suntem interesați de ipotezele care fac o afirmație – de exemplu afirmația că un nou tratament pentru o boală este superior tratamentului standard existent. Dacă noul tratament are numele „B”, iar tratamentul standard existent are numele „A”, ipoteza afirmă că „B” este mai bun decât „A”.

Ați putea presupune că un om de știință ar încerca să demonstreze această ipoteză, însă lucrurile nu stau așa. Acest obiectiv este abordat în mod indirect. Mai degrabă decât să încerce să demonstreze ipoteza B, metoda științifică presupune că, de fapt, ipoteza A este cea adevărată – în acest caz, că nu există nicio diferență între tratamentul standard și noul tratament. Acest tip de ipoteză este cunoscut sub numele de „ipoteză nulă”. Oamenii de știință încearcă apoi să demonstreze că ipoteza A este falsă. Acest procedeu este cunoscut ca respingere a ipotezei nule ca falsă. Dacă se poate demonstra că ipoteza A este falsă și că tratamentul standard existent nu este superior noului tratament, se poate trage concluzia că ipoteza B este cea adevărată și că noul tratament este superior celui standard.

Care este scopul acestui proces?

Nu există un răspuns simplu la această întrebare; aceasta este metoda larg acceptată care a evoluat în cadrul științei moderne; o analogie juridică poate fi, însă, utilă. Ipoteza nulă corespunde situației curente sau informației de care dispunem în prezent (într-un tribunal, aceasta ar fi „acuzatul este nevinovat”), pe care trebuie să o considerăm adevărată cât timp nu avem dovezi suficiente în sprijinul afirmației contrare. Dacă, însă, am încerca să demonstrăm „ipoteza alternativă” (așa cum este aceasta cunoscută, reprezentând opusul „ipotezei nule”), atunci, practic, „acuzatul este vinovat”.

Un alt mod, poate mai ușor, de a înțelege acest lucru este de a îl cita pe Albert Einstein:

„Oricâte experimente aș face, nu pot dovedi că am dreptate, însă un singur experiment poate dovedi că greșesc.”

Acest lucru sugerează că încercarea de a dovedi că ipoteza nulă este falsă sau greșită reprezintă un obiectiv mai riguros și mai ușor de atins decât încercarea de a dovedi că ipoteza alternativă este corectă. Rețineți că acest lucru NU explică în mod clar de ce știința adoptă această abordare, însă ne poate ajuta să înțelegem și să acceptăm mai ușor un concept destul de dificil.

Erorile de Tipul I și Tipul II

Dacă observați tabelul de mai jos, veți vedea care este diferența între erorile de Tipul I (false pozitive) și erorile de tipul II (false negative).

 
Ipoteza nulă este adevărată Ipoteza nulă este falsă
Respingem ipoteza nulă Eroare de Tipul I

„Fals pozitiv”

Rezultatul corect

„Real pozitiv”

Nu putem respinge ipoteza nulă Rezultatul corect

„Real negativ”

Eroare de Tipul II

„Fals negativ”

Toate acestea sunt încă destul de neclare; pentru a exprima aceste concepte în termeni mai simpli, vom utiliza un exemplu mai clar:

  • Erorile de Tipul I pot ucide un pacient: imaginați-vă un studiu care determină, în mod greșit, că tratamentul standard existent nu este superior noului tratament, ducând, astfel, la utilizarea noului tratament asupra pacienților, cu rezultate catastrofice. Erorile de Tipul I cauzează detectarea incorectă a unui efect care nu există în realitate.
  • Erorile de Tipul II prezintă riscul de irosire a unor cercetări potențial valoroase. Poate că cercetările respective ar fi fost foarte utile, însă, dat fiind că niciun studiu nu mai are loc, pacienții nu au de suferit. Erorile de Tipul II cauzează ignorarea unui efect existent.

Este clar, prin urmare, că erorile de Tipul I sunt mai grave decât erorile de Tipul II atunci când vorbim despre pacienți.

Nivelul de importanță

Nivelul de importanță reprezintă probabilitatea comiterii unei erori de Tipul I. Aceasta este afectată de dimensiunea eșantionului și de „puterea statistică”.

Puterea statistică

„Puterea” unui test statistic constă în probabilitatea acestuia de a conduce în mod corect la respingerea unei ipoteze nule – cu alte cuvinte, capacitatea testului de a detecta un efect dacă acesta există cu adevărat. Un alt mod de a descrie acest lucru este de a spune că „puterea” unui test constă în probabilitatea de a NU face o eroare de tipul II.

Valorile P

Valorile P, sau valorile de probabilitate, evaluează importanța dovezilor pe o scară de la 0 la 1. O valoare P mică (în mod normal, mai mică de 0,05 sau 5%) indică existența unor dovezi solide împotriva ipotezei nule, ceea ce poate duce la respingerea ipotezei nule, în timp ce o valoare P mare (mai mare de 0,05) indică opusul.

Diferența între corelație și cauzalitate

Atunci când analizăm rezultatele unui studiu, este important să reținem că există o diferență între corelație și cauzalitate. Corelația implică o legătură de un tip sau altul între două variabile; acest lucru nu înseamnă neapărat că una o cauzează pe cealaltă (există o asociere între cele două variabile). Un exemplu în acest sens implică terapia de substituție hormonală (TSH) și cardiopatia ischemică (CI); mai exact, femeile care beneficiază de TSH sunt expuse unui risc mai scăzut de CI. Acest lucru nu este cauzat, însă, de procesul în sine al TSH, ci de faptul că persoanele care beneficiază de TSH tind să aparțină unui grup cu statut socioeconomic mai bun, având diete și regimuri de exercițiu fizic superioare celor medii.

Cauzalitatea poate fi observată atunci când un factor cauzează un rezultat. Un factor cauzal reprezintă deseori doar o parte din cauza unui rezultat. Pentru a face diferența între corelație și cauzalitate, este important să colectăm cât mai multe informații cu putință despre participanții la studii. Este, de asemenea, necesar să aplicăm cu grijă metodologia științifică în timpul conceperii studiilor clinice și să evaluăm eventualele erori sistematice din cadrul acestora.

Manipularea datelor

Manipularea datelor este practica de a raporta datele în mod selectiv sau incorect sau de a crea rezultate false. Un exemplu în acest sens ar fi eliminarea intenționată a datelor care nu corespund rezultatului așteptat cu scopul de a mări ponderea rezultatelor care confirmă ipoteza inițială. Atunci când un cercetător elimină deviațiile extreme (rezultatele mult mai mari sau mult mai mici decât cel mai apropiat rezultat față de acestea) din cadrul rezultatelor, este important să se determine dacă acelea sunt într-adevăr deviații extreme sau doar rezultate care diferă de rezultatele așteptate sau dorite. Un alt exemplu de manipulare a datelor poate fi generarea aleatorie de către persoana care colectează datele a unui întreg set de date pe baza unei singure măsurători efectuate asupra unui pacient.

Transformarea datelor

Transformarea datelor constă în aplicarea unei formule matematice asupra unor date obținute prin intermediul unui studiu. Acest procedeu este deseori utilizat pentru a permite o prezentare mai clară a datelor sau a facilita înțelegerea acestora. De exemplu, în cazul consumului de carburant al autovehiculelor, este firesc ca acesta să fie măsurat în „kilometri pe litru”. Dacă, însă, evaluați cantitatea de carburant suplimentară necesară pentru mărirea distanței parcurse, consumul va fi exprimat în „litri pe kilometru”. În acest caz, aplicarea unei formule incorecte pentru a obține o prezentare diferită a datelor ar afecta rezultatele generale ale studiului.

Fuziunea datelor

Fuziunea datelor este acțiunea de combinare a datelor din mai multe studii pentru a obține o înțelegere mai bună a situației. Una dintre cele mai întâlnite forme ale acestui procedeu constă în meta-analiză, în care rezultatele mai multor studii publicate sunt aduse laolaltă pentru a fi agregate și comparate. Pentru meta-analiză, este important să ne asigurăm că metodologiile studiilor sunt identice sau similare. Orice diferențe de design între studii trebuie luate în considerare pentru a se elimina variabilele subiacente ascunse (variabilele de confuzie). Un exemplu de fuziune incorectă a datelor poate consta în agregarea datelor din mai multe studii care utilizează specii diferite de șoareci pentru testele pe animale.

A2-4.33.3-V1.1