Dataanalyse i Excel

Her kan du læse om, hvordan du laver et dataudtræk til Excel, opretter tabel samt filtrerer og sorterer i data.

Dataudtræk fra DPSD til Excel

Det er muligt at lave en rapport i Dansk Patientsikkerhedsdatabase (DPSD), hvor data bliver overført til en Excel-fil (dataudtræk). Det er en fordel at arbejde med data fra DPSD i Excel, hvis man:

  • er interesseret i både at lave dataopgørelser på antallet af utilsigtede hændelser og læse indholdet i hændelserne
  • vil arbejde med mange variabler (have meget information om hændelserne)
  • laver store dataudtræk med mange hændelser, fx på regionalt/kommunalt niveau, eller årsopgørelser
  • vil se på mønstre og tendenser og arbejde sig frem til, hvilke områder der kunne være relevante at sætte fokus på.

Det er ofte ikke en fordel at arbejde med data fra DPSD i Excel, hvis man:

  • vil have et hurtigt overblik over antal eller indhold
  • vil arbejde med få variabler
  • arbejder med få utilsigtede hændelser, fx på afdelingsniveau.

Denne vejledning gennemgår, hvordan man opretter et dataudtræk fra DPSD til Excel.

For at oprette en ny rapport, hvor data bliver trukket ud til Excel, skal du gøre følgende:

  1. Gå til Rapportcenteret
  2. Klik på Rapporteditor

Du bliver nu ført over i Rapporteditoren, hvor du specificerer indholdet i rapporten. 

3. Vælg Kun Data (CSV file) som Rapporttype.

Det er ikke nødvendigt at angive titler til dataudtrækket, da de vil blive slettet i Excel.

4. Under Listerapport detaljer angiver du de relevante variabler, du ønsker. Typiske variabler, man anvender i dataudtræk, er:

  • Sagsnummer
  • Opret dato
  • Hændelsessted
  • Hospital/Afdeling/Enhed
  • Sagstype (sundhedsfaglig rapportering eller patient/pårørende rapportering)
  • Sagsstaus
  • Alvorlighed
  • Hændelsesbeskrivelse
  • Forslag til forebyggelse
  • Hvordan kunne det ske?
  • Læring og tiltag
  • DPSD Hovedgruppe
  • DPSD Proces
  • DPSD Problem
  • Emneord
  • Fokusområder
  • Indholdsstof
  • Handelsnavn

    Man kan evt. gøre brug af rapporten Grundtræk over utilsigtede hændelser fra sidste måned (CSV fil), som er tilgængelig under Administrators forslag. Dataudtrækket indeholder en række variabler, som kan give inspiration til, hvad der kunne være relevant at lave et dataudtræk over.

 

Under Datointerval skal du præcisere, hvilken tidsperiode du ønsker at se antallet af utilsigtede hændelser for.

5. I feltet For skal du vælge, hvilken datovariabel du vil basere din tidsperiode på. Her vil man typisk vælge en af nedenstående variabler:

  • *Opret dato: Datoen for, hvornår hændelsen er rapporteret.
  • *Sagsafslutning dato: Datoen for, hvornår hændelsen senest er afsluttet og indsendt til STPS.
  • Første afslutningsdato: Datoen for, hvornår hændelsen første gang er afsluttet.
  • *Hændelsesdato: Datoen for, hvornår rapportøren har angivet, at hændelsen er sket. OBS: Datoen kan være fejlagtigt angivet af rapportøren, fx med en ikke-valid dato eller med et forkert årstal. Rapportøren kan rapportere hændelser bagud. Det betyder, at hvis man laver to ens dataudtræk, er det ikke sikkert, at man får samme resultat begge gange, da rapportøren kan have rapporteret en hændelse og dermed ændret antallet i den periode, man laver dataudtrækket på.

 Herefter skal det vælges, hvilken tidsperiode man ønsker, at rapporten skal være afgrænset til. Man kan vælge tidsperioden via de prædefinerede tidsintervaller eller angive en specifik "fra/til"-dato.

Vær opmærksom på, når du anvender *Sagsafslutning dato og Første sagsafslutningsdato vil "til"-datoen ikke være inkluderet i dataudtrækket, som den er med variablerne *Opret dato og *Hændelsesdato. Dette gælder både, når man anvender de prædefinerede intervaller, og når man selv angiver en fra/til-dato. Det betyder, hvis du fx er interesseret i at få et dataudtræk for januar måned, skal du angive datoerne:

Fra: 01-01-2019 og Til: 01-02-2019. 

Hvis dit dataudtræk derimod er baseret på *Opret dato eller *Hændelsesdato skal du angive datoerne:

Fra: 01-01-2019 og Til: 31-01-2019. 

7. Under Betingelser kan du afgrænse dit dataudtræk til kun at omhandle specifikke områder eller kategorier. Det kan fx være, at du er interesseret i at afgrænse dit dataudtræk i forhold til hændelser:

  • der kun vedrører et specifikt plejehjem (hændelsessted)
  • der har alvorlighedsgraden Alvorlig og Dødelig
  • der er sagsafsluttet (Lukket)
  • der er kategoriseret inden for et eller flere bestemte områder i DPSD-klassifikationen, fx medicin, infektion, osv. (DPSD Hovedgruppe, DPSD Proces, DPSD Problem)
  • hvor hændelsesbeskrivelsen indeholder bestemte ord
  • hvor der er angivet bestemte fokusområder eller emneord
  • som er sket i en patientovergang (*Rolle i hændelsen).

Der er udarbejdet en separat vejledning (Afgræns rapport via betingelser) om, hvordan man tilføjer betingelser i ens rapport.

8.Udfør rapport ved at klikke på Udfør rapport nederst til højre

 9. Der bliver nu genereret en Excel-fil med det data, du har specificeret. Når filen er færdig vil din browser give dig besked om, at du kan åbne den.

 10. Du bør nu se dataudtrækket i Excel ligesom nedenstående eksempel.

Som udgangspunkt vil der være to tomme rækker øverst efterfulgt af en række med søgekriterierne fra DPSD.

For at kunne arbejde med dataudtrækket i Excel skal de tre rækker fjernes. Man kan evt. kopiere rækken med søgekriterier til et andet ark, så man på et senere tidspunkt kan huske eller genskabe søgekriterierne for dataudtrækket.

11. Fjern de første tre rækker (to tomme og en med søgekriterierne) ved at:

a. klikke på 1-tallet yderst til venstre 

b. hold musen nede på 1-tallet og før musen ned til 3-tallet, så alle tre rækker nu er markeret 

c. højreklikke med musen på det markerede område.
d. klikke på Slet. 

For at gemme dataudtrækket skal du gøre følgende:

  1. klikke på Filer i menulinjen øverst til venstre
  2. klikke på Gem som
  3. klikke på Gennemse
  4. finde en passende placering til dataudtrækket og give dataudtrækket et sigende navn
    Vær opmærksom på, at da filen kan indeholde personfølsomme data, bør denne gemmes et sikkert sted.
  5. klikke på feltet ud fra Filtype, så der dukker en rulleliste frem.

  6. vælge filtypen Excel-projektmappe, som fremgår øverst i listen
  7. klikke på Gem.

Filtre i dataudtræk

Det kan være nyttigt at tilføje Filtre til sit dataudtræk for at lave en hurtig sortering, så man kan skabe et overblik over sine data.

Tilføj Filtre ved at klikke et tilfældigt sted i dataudtrækket. Du skal klikke et sted, hvor der er data, og som ikke er tomt.

  1. Klik på Sortér og filtrer i menulinjen øverst til højre.
  2. Klik på Filtrer.

Der vises nu en pil ved hvert variabelnavn. Klik på pilen ud fra den variabel, du ønsker at sortere eller filtrere dataudtrækket på. Hvis du fx kun vil læse de alvorlige og dødelige hændelser, klikker du på pilen ud fra Alvorlighed. Et vindue vises, hvor du kan klikke de værdier fra, som du ikke vil have vist i dataudtrækket. Der bliver kun vist de værdier, som dataudtrækket indeholder. Fx er alvorlighedsgraden Dødelig ikke vist i listen over værdier i nedenstående eksempel. Dvs., at der ikke er nogen hændelser i dataudtrækket, som har alvorlighedsgraden Dødelig.

Dubletter

Der kan forekomme dubletter i dataudtrækket fra Dansk Patientsikkerhedsdatabase (DPSD). Dvs. at der er flere rækker med samme sagsnummer. Dubletter forekommer som udgangspunkt i dataudtrækket, når der er tilføjet nedenstående oplysninger til hændelserne:

  • Lægemidler
  • Medicinsk udstyr
  • Involverede lokationer
  • Sagsopfølgninger
  • Sagen er slettet/afvist 

Hvis man er interesseret i at læse indholdet af hændelserne i Excel, anbefales det ikke at fjerne dubletterne, da de kan indeholde værdifuld information om hændelsen.

Hvis man er interesseret i både at læse indholdet og arbejde med antallet, kan man lave en kopi af det originale dataudtræk og fjerne dubletterne i kopien. På den måde har man to ark, hvor det ene indeholder dubletterne og al information, og det andet kan anvendes til at lave opgørelser med.

Hvis man er interesseret i at arbejde med antallet af hændelser i Excel, anbefales det at fjerne dubletterne, så man får det reelle antal, dataudtrækket indeholder.

For at lave en kopi af det originale dataudtræk og derefter fjerne dubletterne, skal du gøre følgende:

a. højreklik på arket med det originale dataudtræk nederst til venstre. Typisk vil det hedde Report

b. vælge Flyt eller kopier

csætte flueben i Opret en kopi

d. klikke OK.

Der dukker nu en nyt ark op, som typisk vil blive kaldt Report (2).

Navnene kan afvige i forhold til, hvilken version af Excel man arbejder i. Du kan altid gå tilbage til det originale dataudtræk ved at klikke på Report. Du kan også omdøbe arkene, så du kan huske, hvad de forskellige ark indeholder. Du omdøber et ark ved at højre-klikke på arket og vælge Omdøb.

 

Du fjerner dubletter i dataudtrækket ved at:

a. klikke et vilkårligt sted i dataudtrækket. Du skal klikke et sted, der er data, og som ikke er tomt

b. klikke på Data i menulinjen øverst

c. klikke på Fjern dubletter

d. klikke på Fjern markering af alle

e. sætte flueben i variablen *Sagsnummer

f. klikke OK.

Du får nu besked om, at der er fjernet X antal dubletter i dit dataudtræk, og hvor mange entydige værdier der er tilbage. Du er nu klar til at lave opgørelser over det reelle antal hændelser, der er i dataudtrækket. Dette vil blive beskrevet i vejledningen Dataanalyse i Excel.

Hvis du vil beholde dine dubletter, men gerne vil gøre det tydeligere i dataudtrækket, hvor der er dubletter, kan det være nyttigt at lave en såkaldt Betinget formatering. Funktionen farvelægger alle dubletterne, så de er nemmere at få øje på.

Lav Betinget formatering ved at:

a. klikke på A, så kolonnen med sagsnumre bliver markeret

b. klikke på Betinget formatering i menulinjen øverst

c. klikke på Fremhæv Celleregler

d. vælge Dubletværdier

e. vælge hvilken farve, dubletterne skal markeres med

f. klikke OK.

Dubletterne er nu markeret med en farve i kolonnen med sagsnumre.

Dataanalyse i Excel

Hvis man vil lave opgørelser over antallet af hændelser i dataudtrækket, er det nyttigt at anvende en Pivottabel. Man kan også anvende pivottabeller til at arbejde sig frem til, hvilke hændelser der kunne være relevante at læse noget mere om.

Før du forsøger at oprette en pivottabel, skal du kontrollére, at øverste række i dit datasæt er navne på variablerne/felterne.

Opret en Pivottabel ved at:

klikke et vilkårligt sted i dataudtrækket. Du skal klikke et sted, der er data, og som ikke er tomt. Overvej, om det skal være et dataudtræk med eller uden dubletter.

Hvis du er interesseret i at arbejde ned i dataudtrækket og til sidst læse indholdet i de relevante hændelser, er det en fordel at lave pivottabellen med dubletter. Vær dog opmærksom på, at antallet, du finder frem til, ikke er det reelle tal over, hvor mange unikke utilsigtede hændelser der er i dataudtrækket.

Hvis du kun er interesseret i antallet af hændelser og ikke skal læse hændelserne til sidst, er det en fordel at lave pivottabellen uden dubletter.

b. klikke på Indsæt øverst i menulinjen

c. klikke på Pivottabel.

En stiplet linje afgrænser nu dit dataudtræk, og en dialogboks vises. Den stiplede linje skal afgrænse hele dataudtrækket, ellers bliver pivottabellen ikke oprettet korrekt. Når du har sikret dig, at den stiplede linje afgrænser hele dit dataudtræk, klikker du på OK i boksen eller [ENTER].

Du må ikke klikke andre steder i dit dataudtræk, mens boksen er fremme. Det vil ændre markeringen og din pivottabel vil ikke blive oprettet korrekt.

Din pivottabel er nu oprettet, og du vil blive ført hen til et andet ark i Excel-projektmappen. Dette ser du nederst i skærmen, hvor der nu vil fremgå et ekstra ark, der som regel bliver kaldt Ark2. Du kan altid gå tilbage til det originale dataudtræk ved at klikke på Report.

I det nye ark (Ark2) klikker du på boksen med navn Pivottabel1. Du vil nu se en værktøjsboks til højre i skærmen:

  • Øverste boks indeholder alle variabler, som er med i dit dataudtræk.
  • I boksen Værdier angiver man, hvilken variabel man vil tælle antallet af hændelser på. Dette vil som udgangspunkt være Sagsnummer.
  • I boksen Filtre kan man vælge, om der er specifikke værdier fra variabler, som ikke skal inkluderes i pivottabellen.
  • I boksen Kolonner angiver man, hvilke variabler man vil fordele sine data efter på kolonneniveau.
  • I boksen Rækker angiver man, hvilke variabler man vil fordele sine data efter på rækkeniveau.

Hvis værktøjsboksen forsvinder, skal du klikke på boksen med navn Pivottabel1 igen.

d. Træk variablen *Sagsnummer ned i boksen Værdier.

e. Du vil se, at der står Sum af *Sagsnummer. Dette skal ændres til, at pivottabellen tæller på Antal af *Sagsnummer. Klik på overskriften Sum af *Sagsnummer.

f. Klik på Værdifeltindstillinger.

g. Vælg Antal.
h. Klik OK.

Du vil nu kunne se, hvor mange sagsnumre der er i alt i dataudtrækket.

Du kan trække de variabler, du ønsker at kigge nærmere på, ned i de øvrige bokse. Hvis du fx vil se hændelserne fordelt på alvorlighed og Indholdsstof, kan du trække de to variabler ned i boksene for hhv. Kolonner og Rækker.

Hvis du vil filtrere i dataudtrækket, kan du trække en variabel ned i boksen Filtre. Hvis du fx kun vil se hændelser, der er kategoriseret med hovedgruppen Medicinering herunder væsker, trækker du variablen DPSD Hovedgruppe ned i boksen Filtre.

Klik på pilen ud fra overskriften DPSD Hovedgruppe i den øverste boks.

Vælg den værdi, du gerne vil filtrere på. Hvis du fx kun vil se hændelser med hovedgruppen Medicinering herunder væsker, vælger du den og klikker OK.

 

Hvis du vil inkludere flere værdier eller fjerne nogle værdier, klikker du på Vælg flere elementer og fjerner/tilføjer derefter flueben ved de værdier, du ikke vil/vil have med. Klik herefter OK.

Filtrering i pivottabellen svarer til at lave betingelser inde i DPSD. Du kan filtrere dine data på alle kategoriske variabler, fx hvor alvorlighedsgraden er alvorlig og dødelig, eller hvor sagstypen er lig med patient/pårørende.

Det kan være nyttigt at sortere hændelserne, så de vises med største eller mindste antal først, hvis du fx vil se, hvilke indholdsstoffer der hyppigst er involveret i hændelser kategoriseret som Alvorlig.

Sorter antallet af hændelser med største først ved at:

  1. højreklikke på feltet lige under overskriften Alvorlig i pivottabellen
  2. klikke på Sortér
  3. vælge Sortér med største først.

Pivottabellen vil nu sortere de alvorlige hændelser i rækkefølge med det største antal først.

Hvis du via dit arbejde med pivottabellen er kommet frem til, at du gerne vil læse mere om de alvorlige hændelser, hvor et specifik indholdsstof er involveret, kan man via pivottabellen på en nem måde komme til det.

Læs relevante hændelser fra pivottabellen ved at:

  1. dobbeltklikke på tallet for de hændelser, du gerne vil læse. I nedenstående eksempel kunne det fx være interessant at læse de tre alvorlige hændelser, hvor indholdsstoffet paracetamol har været involveret.

Du bliver nu ført over i et nyt ark, hvor de tre hændelser er vist med de variabler, som er tilgængelige i dit dataudtræk. På den måde kan du hurtigt læse indholdet af hændelserne og se, om der er mønstre og tendenser, du bør holde øje med for lige præcis dette indholdsstof.