14: Hvordan justere for pasienters risikoprofil i analyser?
Michael 2017; 14: Supplement 19, 177–87.
Denne artikkelen gir en kort innføring i begrepet risikojustering av ulike utfall – Hva er det, hvilke metoder har man, hva bør man tenke på hvis man ønsker å sammenligne utfall for pasienter mellom flere land istedenfor kun nasjonalt? Som et eksempel på risikojustering brukes data for hjerteinfarktpasienter i Norge i 2009, og sammenligner ett-års dødelighet mellom de regionale helseforetakene. Data er hentet fra Norsk Pasientregister, Reseptregisteret og Statistisk Sentralbyrå, og koblet på individnivå. Eksemplet brukes til å diskutere mekanismene i risikojustering, og inkluderer 10 518 pasienter. Den ujusterte variasjonen i dødelighet mellom de regionale helseforetakene var liten (fra 16,8 % for Helse Vest og Helse Nord til 17,2 % for Helse Sør-Øst). Etter å ha justert for alder, kjønn, type infarkt, 15 komorbiditeter, inntekt, formue og utdanning var variasjonen nesten uendret (fra 16,1 % for Helse Midt-Norge til 17,5 % for Helse Nord). Ingen av helseforetakene var signifikant forskjellige fra landsgjennomsnittet på 17,0 %. Dette indikerer at infarktpasienter ved et regionalt helseforetak kan være trygge på at de ikke ville fått et bedre utfall ved et annet helseforetak.
Hva er risikojustering?
Ofte ønsker man å sammenligne utfall som insidens, dødelighet, reinnleggelser og kostnader for pasienter med en spesifikk sykdom mellom flere enheter (sykehus, regioner eller land). Dette kan gi enkel informasjon om hvor stor variasjonen i utfallet er over enhetene, og hvor hver enkelt enhet ligger i forhold til de andre. Eksempler på publikasjoner som rapporterer dette for dødelighet og reinnleggelser er notater fra Kunnskapssenteret (1) og «Health at a glance»-serien fra OECD (2). I figurer som sammenligner insidens av sykdom, dødelighet o.l. mellom flere enheter, har man kanskje lagt merke til at det ofte er en fotnote som sier at utfallene er alders- og kjønnsjusterte. Grunnen til dette er at man ikke ønsker å sammenligne epler og pærer – Hvis man for en bestemt sykdom finner at pasienter ved et sykehus har høyere dødelighet enn pasienter ved et annet, ønsker man ikke at dette skal skyldes at pasientene ved det første sykehuset er eldre enn pasientene ved det andre sykehuset. Tenker man bevisst eller ubevisst at observerte forskjeller sier noe om kvalitet på behandlingen ved ulike enheter, kan det gi et galt bilde av virkeligheten kun å oppgi ujustert dødelighet: Eldre pasienter har generelt høyere dødelighet enn yngre pasienter, og sykehusene kan jo ikke bestemme alderssammensetningen til sine pasienter. Alders- og kjønnsjusterte utfall representerer det enkleste eksemplet på risikojustering.
I mange land har det etter hvert blitt etablert flere nasjonale helseregistre som kan kobles sammen på individnivå. EuroHOPE (3) er et eksempel på et prosjekt der man ønsker å sammenligne insidens, dødelighet, liggetid og kostnader for ulike pasientgrupper på tvers av land. I EuroHOPE deltok Norge, Sverige, Finland, Nederland, Skottland, Ungarn og deler av Italia. Prosjektet ble koordinert fra det finske folkehelseinstituttet (THL) i Helsinki. Kobling av sykdomsregistre, pasientregistre, dødsårsaksregistre og registre i de nasjonale statistiske sentralbyråene gjør det mulig å lage mange variabler som man kan justere for ut over alder og kjønn. Både innad i land og mellom land vil sannsynligvis pasientenes komorbiditeter, antall tidligere sykehusinnleggelser, inntekt og utdanning også variere, faktorer som gjerne har sammenheng med utfallene nevnt tidligere. Da kan man estimere hva utfallet hadde vært hvis fordelingen av disse var lik over alle enheter. Imidlertid er det også noen spesielle utfordringer i gjennomføringen av multinasjonale analyser, noe jeg kommer tilbake til nedenfor.
Metoder for risikojustering
Hvis man kun har mulighet til å justere for alder og kjønn, bruker man ofte såkalt direkte eller indirekte standardisering. Man deler da alder og kjønn inn i grupper. Resultatet blir i begge tilfeller et alders- og kjønnsjustert utfallsmål (eks. rate, andel, gjennomsnitt) for hver enhet (eks. sykehus, region, land), det vil si et hypotetisk utfall hvis alders- og kjønnsfordelingen var lik i alle enheter. Dette oppnås ved å benytte en felles referansepopulasjon i standardiseringen. Referansepopulasjonen kan for eksempel være hele datasettet, dvs. data fra alle enheter, eller det kan være en ekstern referansepopulasjon som bestemmer en felles alders- og kjønnsfordeling. se f.eks. National Cancer Institute i USA for ulike alternativer (4).
Direkte standardisering er kort illustrert i øverst tabell 1, i et eksempel der man bare justerer for alder. For begge land i eksemplet har man tilgang til dødsrater per 1,000 pasienter innen hver aldersgruppe og totalt (kalt ujustert dødsrate i Tabell 1). I tillegg oppgis antallet pasienter i hvert land i tabellen, og antallet i referansepopulasjonen er summen av populasjonene i hvert land. Vi ser at pasientene i Land A ser ut til å være yngre enn pasientene i Land B. Det kan derfor være interessant å estimere aldersjusterte dødsrater. Ved å multiplisere antallet i referansepopulasjonen med observert dødsrate for hvert land, finner man forventet antall døde i hver aldersgruppe hvis landene hadde aldersfordelingen til referansepopulasjonen. Ved å summere forventet antall døde i hvert land over alle aldersgrupper og dele på totalt antall pasienter i referansepopulasjonen, finner man aldersjustert dødsrate per 1 000 (hhv. 1563,75/76 000 • 1 000=20,58 og 1585,82/76 000 • 1 000=20,87). Vi ser at det som tilsynelatende så ut som en lavere dødsrate i Land A (17,44 vs. 24,57 per 1 000), hovedsakelig skyldes at pasientene var yngre. De aldersjusterte dødsratene er faktisk ganske like (20,58 vs. 20,87).
Indirekte standardisering er kort illustrert nederst i Tabell 1, basert på de samme tallene som for direkte standardisering. Denne delen av tabellen er likevel litt annerledes, siden man i indirekte standardisering tar utgangspunkt i den observerte dødsraten per aldersgruppe fra referansepopulasjonen, ikke antallet. Den eneste informasjonen som trengs fra hver enhet, er antallet pasienter i hver aldersgruppe, og totalt antall døde. Denne informasjonen kan noen ganger være lettere tilgjengelig enn aldersspesifikke dødsrater i hver enhet, og utgjør en hovedforskjell mellom metodene. For å estimere aldersjusterte dødsrater, starter man med å multiplisere dødsratene fra referansepopulasjonen med antallet pasienter i Land A og Land B for hver aldersgruppe. Dette gir forventet antall døde i hver aldersgruppe, som i foregående eksempel. Videre summerer man forventet antall døde over aldersgruppene. For å finne aldersjustert dødsrate for hvert land, tar man ratioen av totalt observert antall døde over total forventet antall døde og multipliserer denne med total dødsrate i referansepopulasjonen. Det blir for Land A 715/721,51 • 20,72=20,53, og for Land B 860/853,57 • 20,72= 20,88. Dette er omtrent samme tall som fra direkte standardisering ovenfor, som er naturlig da det er de samme dataene som brukes i begge eksemplene. I praksis kan valg av metode være bestemt av hvilke data som er tilgjengelig fra hver enhet. Begge metodene fungerer tilsvarende hvis også kjønn inkluderes, men man får flere grupper i tabellen.
Metodene over er imidlertid ikke så godt egnet når man vil justere for mange variabler, da de er basert på å dele dataene inn i grupper. Hvis man har mange variabler, blir det raskt mange grupper, og noen variabler ønsker man kanskje også å beholde som kontinuerlige i analysen. En annen mulighet for risikojustering er å ta utgangspunkt i regresjonsmodeller. Man kan da enkelt inkludere mange variabler, gitt at datasettet er stort nok. En vanlig metode (5) er å tilpasse en modell, for eksempel en logistisk regresjonsmodell for ett-års dødelighet. Utfallet er da binært (død/ikke død), og utfallsmålet kan være andel døde. Alle variabler man ønsker å justere for, legges inn som uavhengige variabler i modellen. Modellen estimeres ved å bruke hele data- settet. Fra den tilpassede modellen kan man beregne forventet antall døde i hver enhet, uansett om enhetene er sykehus, regioner eller land. Man vet selvsagt også hvor mange som faktisk har dødd innen ett år i hver enhet. Ved å ta ratioen mellom det observerte og det forventede antall døde i hver enhet og multiplisere disse med andelen døde innen ett år i hele datasettet, finner man hva andel døde hadde vært i hver enhet hvis fordelingen av alle variabler man har justert for var den samme i alle enheter. Fremgangsmåten kan brukes for andre typer utfall og utfallsmål ved å endre valg av regresjonsmetode. For eksempel for utfall som er sjeldne, men kan inntreffe flere ganger per pasient (eks. reinnleggelser) kan en Poisson-modell brukes, eller for kontinuerlige utfall som er skjevfordelt (eks. kostnader) kan en gammamodell brukes.
Direkte standardisering | |||||||
---|---|---|---|---|---|---|---|
Referansepopulasjon |
Land A |
Land B |
|||||
Aldersgruppe |
Antall |
Antall |
Observert dødsrate per 1 000 |
Forventet antall døde |
Antall |
Observert dødsrate per 1 000 |
Forventet antall døde |
0–24 |
31000 |
18000 |
1,94 |
60,14 |
13000 |
2,31 |
65,10 |
25–49 |
18000 |
11000 |
5,45 |
98,10 |
7000 |
7,14 |
128,52 |
50–74 |
20000 |
9000 |
41,11 |
822,20 |
11000 |
36,36 |
727,20 |
>75 |
7000 |
3000 |
83,33 |
583,31 |
4000 |
95,00 |
665,00 |
Total |
76000 |
41000 |
1563,75 |
35000 |
1585,82 |
||
Ujustert dødelighet |
17,44 |
24,57 |
|||||
Justert dødelighet |
20,58 |
20,87 |
Indirekte standardisering | |||||||
---|---|---|---|---|---|---|---|
Referansepopulasjon |
Land A |
Land B |
|||||
Aldersgruppe |
Observert dødsrate per 1 000 |
Antall |
Observert antall døde |
Forventet antall døde |
Antall |
Observert antall døde |
Forventet antall døde |
0–24 |
2,10 |
18000 |
37,80 |
13000 |
27,30 |
||
25–49 |
6,11 |
11000 |
67,21 |
7000 |
42,77 |
||
50–74 |
38,50 |
9000 |
346,50 |
11000 |
423,50 |
||
>75 |
90,00 |
3000 |
270,00 |
4000 |
360,00 |
||
Total |
20,72 |
41000 |
715 |
721,51 |
35000 |
860 |
853,57 |
Ujustert dødelighet |
17,44 |
24,57 |
|||||
Justert dødelighet |
20,53 |
20,88 |
Det finnes flere alternativer og utvidelser av regresjonsmetoden som bare nevnes kort her. I metoden over antar man at alle pasienter er uavhengige av hverandre med hensyn på utfallet. Selv om man justerer for mange variabler i modellen, trenger ikke denne antagelsen å være riktig: Man kan tenke seg at pasienter innen samme sykehus fortsatt har likere verdier av utfallet enn pasienter fra forskjellige sykehus, altså at de er avhengige. Man kan da utvide metoden ved å bruke regresjonsmodeller med flere nivåer der man tar hensyn til avhengigheten innen sykehus (6,7). Alternativt kan man matche pasienter fra hver enhet som har mest mulig like verdier av variablene man ønsker å justere for med hverandre: Man bruker da variablene i en regresjonsmodell for å beregne en indeks for hver pasient, og matcher hver pasient i en enhet med de pasientene i andre enheter som har omtrent samme verdi av indeksen (8). Indeksen kalles en propensity score, og metoden kalles propensity score matching. Man estimerer justerte utfallsmål for hver enhet fra det matchede datasettet, hvor effekten av at variablene har ulik fordeling over enhetene bør være mindre enn i det originale datasettet. Propensity score matching kan også kombineres med flernivå-modeller (9).
Utfordringer ved risikojustering i multinasjonale studier
Som nevnt i innledningen har man nå mulighet til å koble helseinformasjon fra populasjonsregistre i en rekke land. Imidlertid vil sammenligning av utfall mellom land medføre ytterligere utfordringer i risikojusteringen ut over valg av metode. Den mest opplagte utfordringen er å sikre at variablene man justerer for er definert likt i alle land. Dette er ikke noe problem for alder og kjønn, men det er vanskelig å vite sikkert om diagnoser for komorbiditeter defineres og registreres likt i de ulike landene. I tillegg må sykdommen men ønsker å studere være likt definert i landene: Skal man sammenligne ett-års dødelighet for pasienter med hjerteinfarkt må diagnoserutinene være mest mulig sammenfallende. Dette kan også endre seg over tid. Man kan ende opp med å bruke grove kategoriseringer av variablene for å sikre at de blir sammenlignbare, noe som medfører tap av informasjon. Resultatet kan være at pasientgruppene ikke er særlig sammenlignbare likevel, selv etter risikojustering.
En annen utfordring er at data kanskje bare kan deles mellom noen land i studien, ikke alle (10). Man vil gjerne estimere modellen for risikojustering fra hele datasettet, og ikke bare en del av det. Hvis ikke alle data kan samles i en felles database, setter det begrensninger for hvor avanserte metoder for risikojustering man kan benytte: Det blir vanskelig å estimere flernivå-modellene eller bruke propensity score-metodene i forrige avsnitt. En mulighet er å estimere regresjonsmodellen på den delen av dataene som kan samles i en database, bruke denne modellen for å beregne forventet utfall i alle land (dvs. også for de landene som ikke kan dele data), og videre beregne risikojustert verdi av utfallet som beskrevet ovenfor. Dette tilsvarer å bruke deler av datasettet som referansepopulasjon istedenfor hele datasettet. Man antar da at effekten av variablene man justerer for er den samme også i de landene som ikke var med i estimeringen av modellen. Dette kan være problematisk, selv om det ikke alltid trenger å ha så stor betydning i praksis (11). Poenget er uansett at modellsjekking blir vanskelig når ikke alle dataene kan samles i én database.
Eksempel på risikojustering
Som en illustrasjon av risikojustering brukes data for ett-års dødelighet etter hjerteinfarkt for pasienter i de regionale helseforetakene i Norge i 2009. Dataene ble koblet som en del av EuroHOPE (3), finansiert av EU. I tillegg til hjerteinfarkt inkluderte EuroHOPE også hjerneslag, hoftebrudd, brystkreft og barn med lav fødselsvekt. Flere artikler har blitt publisert i prosjektet (12,13). I dette eksemplet brukes data fra Norsk Pasientregister, Reseptregisteret og Statistisk Sentralbyrå. Dataene er koblet på individnivå fra fødselsnummeret. Infarktpasienter ble identifisert fra innleggelser med ICD-10 kode I21 og I22 som hoveddiagnose ved utskrivelse i Norsk Pasientregister. Pasienter som hadde disse kodene i 2008 ble ekskludert for å unngå gjentatte tilfeller som lå nært i tid. Dataene inkluderer pasienter eldre enn 40 år.
Utfallsmålet er andel døde etter ett år, og jeg ønsker å sammenligne dette mellom de regionale helseforetakene i Norge. Eksemplet viser både ujusterte og risikojusterte dødelighetsandeler. I tillegg til alder og kjønn, hentes komorbiditeter i året før indeksinnleggelsen fra hoved- og bidiagnosene registrert i Norsk Pasientregister. En liste på 15 komorbiditeter som var antatt å være relevante for infarktpasienter ble utviklet i EuroHOPE. Da noen komorbiditeter ikke fanges tilstrekkelig godt opp fra sykehusinnleggelser, ble de også identifisert fra medikamentbruk i året før indeksinnleggelsen i Reseptregisteret. En tabell som viser hvilke ICD-10 koder for innleggelser og ATC-koder for legemidler som ble brukt for å identifisere komorbiditetene finnes her (14). Til slutt ble pasientenes inntekt, formue og utdanning hentet fra Statistisk Sentralbyrå. Samtlige variabler er oppgitt i tabell 2.
Variabel: |
Helse Sør-Øst (n=5663) |
Helse Vest (n=2106) |
Helse Midt-Norge (n=1561) |
Helse Nord (n=1188) |
---|---|---|---|---|
Ett-års dødelighet (%) |
17,2 |
16,8 |
17,0 |
16,8 |
Alder (gj.snitt) |
71,7 |
71,7 |
72,6 |
71,6 |
Menn (%) |
61,2 |
63,8 |
61,2 |
63,5 |
Type infarkt: STEMI (%) |
47,6 |
53,9 |
51,9 |
48,1 |
Non-STEMI (%) |
25,6 |
31,1 |
29,7 |
29,9 |
Udefinert (%) |
26,8 |
14,9 |
18,4 |
22,0 |
Hypertensjon (%) |
64,0 |
61,4 |
60,9 |
63,4 |
Koronar arteriesykdom (%) |
14,2 |
13,0 |
13,6 |
14,4 |
Atrieflimmer (%) |
6,8 |
5,9 |
6,5 |
6,1 |
Hjertesvikt (%) |
6,3 |
6,0 |
5,6 |
4,7 |
Diabetes (%) |
16,9 |
14,0 |
14,4 |
13,1 |
Aterosklerose (%) |
2,1 |
1,1 |
1,7 |
2,5 |
Kreft (%) |
2,4 |
1,7 |
2,2 |
1,9 |
KOLS og astma (%) |
17,6 |
14,7 |
14,9 |
17,7 |
Demens (%) |
3,7 |
3,8 |
4,5 |
4,0 |
Depresjon (%) |
12,5 |
13,6 |
13,3 |
9,9 |
Parkinsons sykdom (%) |
1,2 |
1,0 |
1,2 |
1,2 |
Psykiske lidelser (%) |
3,5 |
3,8 |
2,2 |
2,4 |
Nyresvikt (%) |
3,3 |
2,9 |
2,7 |
2,8 |
Alkoholisme (%) |
0,8 |
0,9 |
0,6 |
0,4 |
Hjerneslag (%) |
3,5 |
2,9 |
4,4 |
3,2 |
Netto inntekt 2000 – 08 (gj.snitt) |
268000 |
270000 |
243000 |
237000 |
Brutto formue 2000 – 08 (gj.snitt) |
570000 |
570000 |
515000 |
409000 |
Grunnskole (%) |
41,3 |
40,9 |
45,2 |
50,7 |
Videregående (%) |
45,1 |
47,3 |
44,8 |
40,0 |
Univ./Høyskole (%) |
13,6 |
11,8 |
10,0 |
9,3 |
STEMI = hjerteinfarkt med ST-segment elevasjon
Non-STEMI = hjerteinfarkt uten ST-segment elevasjon
KOLS = Kronisk obstruktiv lungesykdom
I analysen oppgis andel døde fra fire ulike modeller: 1) ujustert 2) justert for alder og kjønn 3) justert for alder, kjønn, type infarkt (STEMI, non- STEMI, udefinert infarkt) og komorbiditeter 4) justert for alder, kjønn, type infarkt (STEMI, non-STEMI, udefinert infarkt), komorbiditeter, inntekt, formue og utdanning (sosioøkonomiske variabler). Metoden som er beskrevet i metode-avsnittet ovenfor (5) er benyttet for risikojusteringen, hvor forventede antall døde per regionalt helseforetak er estimert fra en logistisk regresjonsmodell med en dødsindikator som utfall. I modellen ble alder kategorisert i 10-års grupper, og inntekt og formue ble kategorisert etter kvartiler.
Totalt inngår 10 518 pasienter i dataene, og for landet som helhet var 17,0 % av pasientene døde etter ett år. Som de ujusterte estimatene for ett-års dødelighet øverst i Tabell 2 viser, er det svært liten variasjon mellom de regionale helseforetakene. Dødeligheten varierer kun fra 16,8 % til 17,2 %. Ser man på pasientkarakteristika før innleggelse i tabell 2, er det likevel klart at det er variasjon i forekomsten av komorbiditeter, samt i inntekt, formue og utdanning hos pasientene ved de ulike foretakene. Mange av disse slår ut som sterkt signifikante i den logistiske regresjonsmodellen (ikke vist), da datasettet er forholdsvis stort. Det vil si at dødeligheten øker ved forekomst av flere enkelt-komorbiditeter, og reduseres med høyere inntekt, utdanning og formue hos pasientene. Det er derfor interessant å se om dødelighetsforskjellene er like små hvis fordelingen av disse faktorene hadde vært lik hos pasientene i alle fire helseforetak. Tabell 3 viser hvordan risikojustert dødelighet endrer seg ettersom man utvider regresjonsmodellen med flere variabler. Som vist blir ikke dødelighetsestimatene særlig påvirket av risikojusteringen i dette eksemplet, til tross for at de fleste faktorene det justeres for har en signifikant sammenheng med dødelighet, og er noe ulikt fordelt hos pasientene i helseforetakene (tabell 2). I den største modellen hvor det er justert for alder, kjønn, type infarkt, de 15 komorbiditetene i tabell 2 samt inntekt, formue og utdanning, varierer estimatene bare fra 16,1 % til 17,5 %. Fra konfidensintervallene ser vi at de alltid inneholder landsestimatet på 17,0 %, så ingen av helseforetakene er signifikant forskjellige fra landsgjennomsnittet heller. Dette er for så vidt et positivt resultat, da det indikerer at infarktpasienter ved et regionalt helseforetak kan være trygge på at de ikke ville fått et bedre utfall ved et annet helseforetak.
Modell: |
Helse Sør-Øst (n=5663) |
Helse Vest (n=2106) |
Helse Midt-Norge (n=1561) |
Helse Nord (n=1188) |
---|---|---|---|---|
Ujustert |
17,2 (16,2, 18,1) |
16,8 (15,2, 18,4) |
17,0 (15,2, 18,9) |
16,8 (14,7, 19,0) |
Alder og kjønn |
17,2 (16,3, 18,1) |
16,7 (15,2, 18,2) |
16,4 (14,7, 18,0) |
17,5 (15,5, 19,5) |
Alder, kjønn, type infarkt og komorbiditeter |
17,0 (16,2, 17,9) |
17,0 (15,5, 18,4) |
16,6 (15,0, 18,2) |
17,9 (15,9, 19,9) |
Alder, kjønn, type infarkt komorbiditeter og sosioøkonomiske variabler |
17,2 (16,4, 18,1) |
17,0 (15,5, 18,4) |
16,1 (14,5, 17,6) |
17,5 (15,6, 19,4) |
Selv om det ikke er noen signifikante forskjeller mellom helseforetakene, kan likevel resultatene brukes til å beskrive mekanismene i risikojusteringen. For eksempel gjør justering for alder og kjønn at risikojustert dødelighet i Helse Nord øker noe sammenlignet med det ujusterte estimatet (fra 16,8 % til 17,5 % i tabell 3), da pasientene der er marginalt yngre enn pasientene ellers i landet (Se tabell 2). Yngre pasienter har generelt lavere dødelighet enn eldre, og når man estimerer hva dødeligheten hadde vært hvis kjønnsog aldersfordelingen var lik i alle helseforetak (altså justert for alder og kjønn), er det da naturlig at estimatet for Helse Nord øker litt. Vi ser også fra tabell 3 at kjønns- og aldersjustering har motsatt effekt for Helse Midt- Norge (ned fra 17,0 % til 16,4 %), da pasientene der er noe eldre enn ellers i landet. Når man videre justerer for komorbiditeter og type infarkt i tillegg til alder og kjønn, øker estimatet for Helse Nord enda en anelse (fra 17,5 % til 17,9 % i tabell 3). Dette skyldes at Helse Nord har noe lavere forekomst av komorbiditetene som signifikant øker risikoen for død i modellen, eksempelvis hjertesvikt, diabetes og psykiske lidelser. Når vi også justerer for sosioøkonomiske faktorer, går risikojustert dødelighet i Helse Nord litt ned igjen (fra 17,9 % til 17,5 % i tabell 3), siden innbyggerne der har noe lavere utdanning, inntekt og formue enn resten av landet, faktorer som øker dødeligheten i modellen.
Oppsummering
Denne artikkelen har gitt en kort innføring i risikojustering. Det finnes mange ulike metoder og det er også mange utfordringer, særlig i multinasjonale studier. Likevel er motivasjonen bak justeringen forholdsvis lett å forstå, og flere av metodene baseres på regresjonsanalyser, et verktøy som brukes av mange. Eksemplet viste også at risikojustering i praksis ikke alltid trenger å ha så stor effekt, selv om man justerer for en lang rekke variabler. Eksemplet sammenlignet dødelighet mellom regionale helseforetak, og variasjonen i variablene som brukes i risikojusteringen vil øke noe hvis man går ned på sykehusnivå. Man kunne tenke at risikojusteringen hadde større konsekvenser da. Dette er gjort tidligere (15), men selv der var forskjellene mellom de fleste sykehusene relativt små både før og etter justeringen. Går man ned på sykehusnivå, har man imidlertid også utfordringen at forskjellene skal være ganske store før de lar seg påvise statistisk om man kun bruker data fra ett år. Noen sykehus har relativt få pasienter.
I tilfeller der det faktisk er forskjeller mellom enhetene etter å ha risikojustert for pasientkarakteristika ved innleggelse, er det et interessant spørsmål om forskjellene skyldes omfang og kvalitet av behandlingen. Hvis man har variabler som beskriver behandling etter innleggelse tilgjengelig, kan man utvide modellen ved å legge inn disse også på samme måte som i eksemplet. Slike variabler kan konstrueres fra prosedyrekoder i Norsk Pasientregister og fra medikamenter som brukes i behandlingen fra Reseptregisteret. Man kan da se om forskjellene i dødelighet mellom enhetene reduseres etter å ha justert for behandling. Dette vil indikere om forskjeller i behandlingen forklarer noe av dødelighetsforskjellen mellom enhetene, men det er en annen historie.
Litteratur
Lindman AS, Hassani S, Kristoffersen DT, Tomic O, Dimoski T, Helgeland J. 30-dagers overlevelse og reinnleggelse ved norske sykehus for 2013. Oslo: Nasjonalt kunnskapssenter for helsetjenesten, 2014.
Organisation for Economic Co-operation and Development. Health at a Glance 2015: OECD Indicators. Paris: OECD Publishing, 2015.
Hakkinen U, Iversen T, Peltola M et al. Health care performance comparison using a disease-based approach: the EuroHOPE project. Health Policy. 2013;112:100–9.
National Cancer Institute i USA for ulike alternativer: http://seer.cancer.gov/stdpopulations.
Ash AS, Schwartz M, Peköz EA. Comparing outcomes across providers. I: Iezzoni LI. (red.) Risk adjustment for measuring health care outcomes. Chicago, Ill.: Health Administration Press, 2003, s. 297–333.
Rabe-Hesketh S, Skrondal A. Multilevel and Longitudinal Modeling using Stata, 2. utg. College Station, TX: Stata Press, 2008: s. 701 – 733.
de Leeuw J, Meijer E. (red.) Handbook of multilevel analysis. Springer, New York, 2008, pp. 141 – 175.
Austin PC. An introduction to propensity score methods for reducing the effects of confounding in observational studies. Multivariate Behav Res. 2011;46:399–424.
Schreyogg J, Stargardt T, Tiermann O. Costs and quality of hospitals in different health care systems; a multi-level approach with propensity score matching. Health Econ. 2011;20:85–100.
Oderkirk J, Ronchi E and Klazinga N. International comparisons of health system performance among OECD countries: opportunities and data privacy protection challenges. Health Policy. 2013;112:9–18.
Moger TA, Peltola M. Risk adjustment of health-care performance measures in a multinational register-based study: A pragmatic approach to a complicated topic. SAGE Open Med. 2014; 2: 2050312114526589.
Hagen TP, Häkkinen U, Belicza É, et al. Acute myocardial infarction, use of percutaneous coronary intervention, and mortality: a comparative effectiveness analysis covering seven European countries. Health Econ. 2015;24(Suppl. 2):88–101.
Häkkinen U, Rosenqvist G, Iversen T et al. Outcome, use of resources and their relationship in the treatment of AMI, stroke and hip fracture at European hospitals. Health Econ. 2015;24(Suppl. 2):116–39.
EuroHOPE study group. AMI: Material, Methods and Indicators. EuroHOPE Discussion Papers no. 5, EuroHOPE, 2012. Nettsted: http://www.eurohope.info/index.html
Hagen TP, Iversen T, Moger TA. Risikojustering ved måling av predikert dødelighet etter hjerteinfarkt. Tidsskr Nor Legeforen 2016;136:423 – 7.
Førsteamanuensuis
Avdeling for helseledelse og helseøkonomi
Institutt for helse og samfunn
Universitetet i Oslo
t.a.moger@medisin.uio.no