top of page
Abstrakt linjär bakgrund

Ordlista för dig som letar efter ord

och betydelser inom datavärldens gränser.

Böcker om dataanalys staplade på varandra.

Ordlista

Terminologin inom dataanalys

Här finner du ord och betydelser inom datavärldens gränser.

A-Z

Changelog

 

En ändringslogg är en lista som dokumenterar alla steg du tog när du arbetade med dina data. Detta kan vara användbart om du behöver återgå till dina ursprungliga data eller komma ihåg hur du förberedde dina data för analys.

 

Clean data

 

Rena data är data som är korrekta, kompletta och redo för analys. Datarengöring, ett viktigt steg i dataanalysprocessen, innebär att kontrollera dina data för felaktigheter, inkonsekvenser, oregelbundenheter och fördomar.

 

CSV (comma-separated values) file

 

En CSV-fil är en textfil som separerar datastycken med kommatecken. Detta är en vanlig filtyp vid nedladdning av datafiler för analys, eftersom den ofta är kompatibel med vanliga kalkylblad och databasprogram.

 

Dashboard

 

 En instrumentpanel är ett verktyg som används för att övervaka och visa live-data. Instrumentpaneler är vanligtvis anslutna till databaser och har visualiseringar som automatiskt uppdateras för att återspegla de mest aktuella datan i databasen.

 

Data analytics 

 

Dataanalys är insamling, omvandling och organisering av data för att dra slutsatser, göra förutsägelser och driva informerat beslutsfattande. Dataanalys omfattar dataanalys (processen att härleda information från data), datavetenskap (användning av data för att teoretisera och förutspå) och dataingenjörskonst (bygga datasystem). Dataanalytiker, datavetare och dataingenjörer är alla yrkesverksamma inom dataanalys.

 

Data architecture

 

Dataarkitektur, även kallad datadesign, är planen för en organisations datasystem. Detta kan inkludera alla beröringspunkter i datacykeln, inklusive hur data samlas in, organiseras, används och kasseras. Dataarkitekter utformar ritningarna som organisationer använder för sina datasystem.

 

Data cleaning

 

Datarengöring, rengöring eller skrubbning är processen att förbereda rådata för analys. När du rengör dina data verifierar du att dina data är korrekta, kompletta, konsekventa och opartiska. Det är viktigt att se till att du har rena data innan analysen eftersom orena eller smutsiga data kan leda till felaktiga slutsatser och vilseledande affärsbeslut.

 

Data engineering

 

Dataingenjörskonst är processen att göra data tillgängliga för analys. Dataingenjörer bygger system som samlar in, hanterar och omvandlar rådata till användbar information. Några vanliga uppgifter inkluderar att utveckla algoritmer för att omvandla data till en mer användbar form, bygga databasrörsarkitekturer och skapa nya dataanalysverktyg.

Data enrichment

 

Dataanrikning är processen att lägga till data i ditt befintliga dataset. Du skulle vanligtvis berika dina data under datatransformationsprocessen när du förbereder dig för att börja din analys om du inser att du behöver ytterligare data för att besvara din affärsfråga.

 

Data governance

 

Data governance är den formella planen för hur en organisation hanterar företagsdata. Datagovernance omfattar regler för hur data får åtkomst och används och kan inkludera ansvar och efterlevnadsregler.

 

Data integrity

 

Dataintegritet omfattar noggrannheten, tillförlitligheten och konsekvensen av data över tid. Det innebär att upprätthålla kvaliteten och tillförlitligheten hos data genom att implementera skydd mot obehöriga ändringar, fel eller dataförlust.

 

Data mining

 

Data mining är att noggrant undersöka data för att identifiera mönster och få insikter. Datamining är en central aspekt av dataanalys; de insikter du hittar under gruvprocessen kommer att informera dina affärsrekommendationer.

 

Data science

 

Datavetenskap är den vetenskapliga studien av data. Datavetare ställer frågor och hittar sätt att besvara dessa frågor med data. De kan arbeta med att fånga data, omvandla rådata till en användbar form, analysera data och skapa prediktiva modeller.

 

Data source: En datakälla hänvisar till ursprunget för en specifik uppsättning information. Eftersom företag i allt högre grad genererar data år efter år, förlitar sig dataanalytiker på olika datakällor för att mäta affärsframgång och erbjuda strategiska rekommendationer.

 

Data visualization: Datavisualisering är representationen av information och data med hjälp av diagram, grafer, kartor och andra visuella verktyg. Med starka datavisualiseringar kan du främja berättande, göra dina data tillgängliga för en bredare publik, identifiera mönster och relationer och utforska dina data ytterligare.

 

Data wrangling: Datawrangling, även kallad datamunging eller dataremediering, är processen att omvandla rådata till en användbar form. Det finns fyra steg i mungingsprocessen: upptäckt, datatransformation, datavalidering och publicering. Datatransformationssteget kan delas upp ytterligare i uppgifter som datastrukturering, datanormalisering eller denormalisering, datarengöring och dataanrikning.

 

Database

 

En databas är en organiserad samling information som kan sökas, sorteras och uppdateras. Denna data lagras ofta elektroniskt i ett datorsystem som kallas databashanteringssystem (DBMS). Ofta måste du använda ett programmeringsspråk, såsom strukturerat frågespråk (SQL), för att interagera med din databas.

 

Metadata

 

Metadata är data om data. Det beskriver olika egenskaper hos dina data, såsom hur det samlades in, var det lagras, dess filtyp eller skapelsedatum. Metadata kan vara särskilt användbart för verifierings- och spårningsändamål.

 

Open data

 

Öppna data, även kallade offentliga data, är data som är tillgängliga för alla att använda. Att utforska och analysera öppna dataset är ett sätt att öva dataanalysfärdigheter.

 

Qualitative data

 

Kvalitativa data är data som beskriver kvaliteter eller egenskaper. Det är generellt icke-numeriska data och kan vara subjektiva, till exempel ögonfärg eller känslor.

 

Quantitative data

 

Kvantitativa data är objektiva data med ett specifikt numeriskt värde. Det är generellt något du kan räkna eller mäta, såsom höjd eller hastighet.

 

Query

 

En fråga är en begäran om information. Det är i huvudsak den fråga du ställer till en databas för att returnera de data du vill hämta. Inom dataanalys formulerar du dina databasfrågor med hjälp av ett frågespråk, såsom Structured Query Language (SQL).

 

Relational database

 

En relationsdatabas är en databas som innehåller flera tabeller med relaterad information. Även om data lagras i separata tabeller, kan du komma åt relaterad data över flera tabeller med en enda fråga. Till exempel kan en relationsdatabas ha en tabell för lager och en annan tabell för kundorder. När du letar upp en specifik produkt i din relationsdatabas kan du hämta både lager- och kundorderinformation samtidigt.

 

Structured Data

 

Strukturerade data är formaterade data, till exempel data som är organiserade i rader och kolumner. Strukturerade data är mer lättanalyserade än ostrukturerade data på grund av dess snygga formatering.

 

Structured Query Language (SQL)

 

Structured Query Language, eller SQL (uttalas "sequel"), är ett datorprogrammeringsspråk som används för att hantera relationsdatabaser. Det är bland de vanligaste språken för databashantering.

Unstructured data: Ostrukturerade data är data som inte är organiserade på något uppenbart sätt. För att analysera ostrukturerade data måste du vanligtvis implementera någon form av organisation.

 

Contributions

 

Används i PCA för att visa skillnaden mellan en specifik datapunkt och en referenspunkt.

 

Dataanalys

Processen att undersöka, rengöra, transformera och modellera data för att upptäcka användbar information och stödja beslutsfattande.

 

Drift i Data

 

Förändringar eller avvikelser i data över tid.

 

Loadings

 

I PCA, visar hur mycket varje variabel bidrar till huvudkomponenterna.

 

Modellbyggande

 

Processen att skapa en matematisk representation av en uppsättning data.

 

Multivariat Dataanalys

 

Analysmetod där flera variabler analyseras samtidigt för att förstå samband och korrelationer.

 

PCA (Principal Component Analysis)

 

En teknik inom statistiken för att förenkla datamängder.

 

Processdata

 

Data som samlas in från en specifik process, ofta i realtid eller över tid.

 

Missing data

Dataelement som saknas i en datamängd.

 

Scores

 

I PCA, en representation av datapunkter i ett reducerat dimensionellt utrymme.

 

Univariat Dataanalys

 

Analys av data där endast en variabel beaktas åt gången.

 

Zimka

 

Ett verktyg för multivariat dataanalys.

blå bakgrund

Har du några frågor eller funderingar

gällande dataanalys så är du välkommen 

att kontakta oss på knappen nedan.

bottom of page