Lärandemål
Efter avslutad kurs ska studenten kunna
- visa förståelse för visual literacy, bestämma de grafiska elementen som används för att skapa datavisualiseringar och basera valet av figurer utifrån tillgängliga data och publiken som den är avsedd för utifrån en förståelse om perception och kognition,
- utforska en- och flervariabla data som består av kategoriska och kvantitativa variabler med hjälp av numeriska sammanfattningsmått,
- redogöra för vilka sammanfattningsmått som har goda statistiska egenskaper,
- tillämpa metoder för att visualisera olika datatyper: tidseriedata, kategoriska data och textdata,
- kommunicera relevanta datamönster med hjälp av lämpliga figurer.
Innehåll
Dataanalys och visualisering är ett snabbt växande område som behandlar analys, modellering och visualisering av högdimensionella data.
Kursen introducerar studenten till området genom att behandla moderna metoder för modellering, analys och visualiseringstekniker. Fokus kommer till stor del att ligga på utmaningar med verkliga data och tillämpade övningar i ett högnivåspråk såsom Python eller R för att kommunicera relevanta datamönster i figurform.
Kursen behandlar klassiska begrepp inom deskriptiv statistik och datavisualisering. Inom klassisk deskriptiv statistik behandlas hur slutsatser kan dras utifrån data mha figurer, hur data kan sammanfattas med centralmått, spridningsmått och associationsmått, samt hur normalfördelningen kan användas vid dataanalys.
Kursen behandlar i sin helhet grunderna för datadriven visualisering av information. Kursen introducerar hur grafiska beståndsdelar och färgteori, design, och perception påverkar vår uppfattning av bilder. Begreppet visual literacy introduceras tillsammans med Tuftes principer för vetenskapliga figurer. Visualisering av olika typer av data behandlas, inklusive kategoriska data och text data.
Examinationsformer
För att bli godkänd på kursen ska studenten har deltagit aktivt på minst två tredjedelar av kursens schemalagda seminarier och datorövningar.
Arbetsformer
Betyg
Som betygsskala används U–VG.
Slutbetyget på kursen baseras på en helhetsbedömning av examinatorn.
Förkunskapskrav
- Kandidatexamen 180 hp i ämnet statistik, nationalekonomi, företagsekonomi, datavetenskap, informationssystem eller informationshantering samt Engelska 6