Introduktion til Medicinsk statistik

I medicin er det vigtigt at kende noget til statistik, da man med statistik kan vurdere evidensen af nye medicinske forskningsresultater. I denne artikel defineres nogle af de vigtigste statistiske begreber og værktøjer der er relevante i medicinsk statistik.

Middelværdien

Der findes flere slags gennemsnit af et datasæt, hvoraf det mest almindelige er middelværdien.

Den generelle gennemsnitslige værdi i et datasæt kaldes for middelværdien og kan bl.a. symboliseres ved at sætte en streg over symbolet for hver enkelt værdi.

 overline{x} = frac{sum{x}}{n}

Hvor overline{x} er middelværdien x er den enkelte obervation i datasættet og  n er antallet af observationer.

Medianen

Medianen er den værdi der deler et datasæt i to halvdele. Hvis man sorterer datasættet efter stigende værdier, er medianen den værdi der er i midten, dvs. værdi nummer:

Median = frac{n+1}{2}

Hvor n er antallet af observationer.

Mode

Mode er den værdi der forekommer mest ofte i et datasæt.

Relative risk (RR)

Den relative risiko er risikoen i en casegruppe divideret med risikoen i en kontrolgruppe.

Odds ratio (OR)

Odds ratio er forholdet mellem odds i en casegruppe og odds i en kontrolgruppe.

t-test

En t-test sammenligner to populationer og man undersøger om man kan antage at middelværdierne i de to populationer er identiske.

Nulhypotesen

Nulhypotsen er en hypotese man stiller for at bevise at noget er sandt, som f.eks. at et lægemiddel virker. I stedet laver man så en hypotese for det modsatte, dvs. at lægemidlet ikke virker og så forsøger man at afvise hypotesen.

Den modsatte hypotese, for at lægemidlet virker, kalder man den alternative hypotese.

Formålet er at det er nemmere at bevise at en hypotese er falsk, end at bevise at den er sand.

p-værdier

En p-værdi er et tal man udregner for at vurdere om et forsøg der viser der er en forskel mellem to værdier er ren tilfældighed, eller om der faktisk er en forskel (under antagelse af at forsøget er ordentligt designet). Man siger at en p-værdi under 0,05 betyder at resultatet er statistisk signifikant.

p-værdien er en sandsynlighed for at vi ville observere vores værdier, selvom observationen var falsk. Dvs. det er sandsynligheden for at nulhypotesen er sand. Derfor skal p-værdien helst være så lav som muligt.

Det er en konvention at en p-værdi under 0,05 er statistisk signifikant, ligesom det er en konvention at værdier i et 95% konfidensinterval er statistisk signifikant. En p-værdi under 0,01 kalder man meget statistisk signifikant.

Konfidensinterval

Et 95% konfidensinterval er et interval omkring middelværdien, hvor det er 95% sandsynlighed for at den sande værdi ligger i. Det anvendes ofte til at vurdere om et resultat er statistisk signifikant.

 �big[�bar X - 1.96 frac{sigma}{sqrt{n}} ; bar X +�1.96 frac{sigma}{sqrt{n}}��big] �

Hvor bar X er middelværdien, sigma er standardafvigelsen og n er antallet af observationer.

Hvis intervallet der beregnes befinder sig omkring værdien der viser at der ikke er nogle forskelle mellem observationer (nulhypotesens værdi), betyder dette at resultatet ikke er statistisk signifikant. Vær dog opmærksom på at selvom et konfidensinterval viser at et resultat er statistisk signifikant, vil resultatet stadig kunnne være påvirket af bias.

Vær også opmærksom på at selvom resultatet ikke er statistisk signifikant, betyder dette ikke at resultatet er falsk. Et større forsøg kunne have vist statistisk signifikans.

Bemærk at man også kan udlede p-værdien udfra et konfidensinterval. Hvis nulhypotesens værdi er indeholdt i konfidensintervallet er p>0,05, mens hvis intervallet ikke indeholder nulhypotesens værdi er p<0,05.

Bias

Bias er et begreb der dækker alle mulige systematiske fejl i forbindelse med et forsøg, pga. den måde forsøget blev designet, udført eller udledning af resultater.


Sidst opdateret 30. maj 2023

Start a Conversation

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *