Ordlista för dig som letar efter ord
och betydelser inom datavärldens gränser.
Ordlista
Terminologin inom dataanalys
Här finner du ord och betydelser inom datavärldens gränser.
A-Z
Changelog
En ändringslogg är en lista som dokumenterar alla steg du tog när du arbetade med dina data. Detta kan vara användbart om du behöver återgå till dina ursprungliga data eller komma ihåg hur du förberedde dina data för analys.
Clean data
Rena data är data som är korrekta, kompletta och redo för analys. Datarengöring, ett viktigt steg i dataanalysprocessen, innebär att kontrollera dina data för felaktigheter, inkonsekvenser, oregelbundenheter och fördomar.
CSV (comma-separated values) file
En CSV-fil är en textfil som separerar datastycken med kommatecken. Detta är en vanlig filtyp vid nedladdning av datafiler för analys, eftersom den ofta är kompatibel med vanliga kalkylblad och databasprogram.
Dashboard
En instrumentpanel är ett verktyg som används för att övervaka och visa live-data. Instrumentpaneler är vanligtvis anslutna till databaser och har visualiseringar som automatiskt uppdateras för att återspegla de mest aktuella datan i databasen.
Data analytics
Dataanalys är insamling, omvandling och organisering av data för att dra slutsatser, göra förutsägelser och driva informerat beslutsfattande. Dataanalys omfattar dataanalys (processen att härleda information från data), datavetenskap (användning av data för att teoretisera och förutspå) och dataingenjörskonst (bygga datasystem). Dataanalytiker, datavetare och dataingenjörer är alla yrkesverksamma inom dataanalys.
Data architecture
Dataarkitektur, även kallad datadesign, är planen för en organisations datasystem. Detta kan inkludera alla beröringspunkter i datacykeln, inklusive hur data samlas in, organiseras, används och kasseras. Dataarkitekter utformar ritningarna som organisationer använder för sina datasystem.
Data cleaning
Datarengöring, rengöring eller skrubbning är processen att förbereda rådata för analys. När du rengör dina data verifierar du att dina data är korrekta, kompletta, konsekventa och opartiska. Det är viktigt att se till att du har rena data innan analysen eftersom orena eller smutsiga data kan leda till felaktiga slutsatser och vilseledande affärsbeslut.
Data engineering
Dataingenjörskonst är processen att göra data tillgängliga för analys. Dataingenjörer bygger system som samlar in, hanterar och omvandlar rådata till användbar information. Några vanliga uppgifter inkluderar att utveckla algoritmer för att omvandla data till en mer användbar form, bygga databasrörsarkitekturer och skapa nya dataanalysverktyg.
Data enrichment
Dataanrikning är processen att lägga till data i ditt befintliga dataset. Du skulle vanligtvis berika dina data under datatransformationsprocessen när du förbereder dig för att börja din analys om du inser att du behöver ytterligare data för att besvara din affärsfråga.
Data governance
Data governance är den formella planen för hur en organisation hanterar företagsdata. Datagovernance omfattar regler för hur data får åtkomst och används och kan inkludera ansvar och efterlevnadsregler.
Data integrity
Dataintegritet omfattar noggrannheten, tillförlitligheten och konsekvensen av data över tid. Det innebär att upprätthålla kvaliteten och tillförlitligheten hos data genom att implementera skydd mot obehöriga ändringar, fel eller dataförlust.
Data mining
Data mining är att noggrant undersöka data för att identifiera mönster och få insikter. Datamining är en central aspekt av dataanalys; de insikter du hittar under gruvprocessen kommer att informera dina affärsrekommendationer.
Data science
Datavetenskap är den vetenskapliga studien av data. Datavetare ställer frågor och hittar sätt att besvara dessa frågor med data. De kan arbeta med att fånga data, omvandla rådata till en användbar form, analysera data och skapa prediktiva modeller.
Data source: En datakälla hänvisar till ursprunget för en specifik uppsättning information. Eftersom företag i allt högre grad genererar data år efter år, förlitar sig dataanalytiker på olika datakällor för att mäta affärsframgång och erbjuda strategiska rekommendationer.
Data visualization: Datavisualisering är representationen av information och data med hjälp av diagram, grafer, kartor och andra visuella verktyg. Med starka datavisualiseringar kan du främja berättande, göra dina data tillgängliga för en bredare publik, identifiera mönster och relationer och utforska dina data ytterligare.
Data wrangling: Datawrangling, även kallad datamunging eller dataremediering, är processen att omvandla rådata till en användbar form. Det finns fyra steg i mungingsprocessen: upptäckt, datatransformation, datavalidering och publicering. Datatransformationssteget kan delas upp ytterligare i uppgifter som datastrukturering, datanormalisering eller denormalisering, datarengöring och dataanrikning.
Database
En databas är en organiserad samling information som kan sökas, sorteras och uppdateras. Denna data lagras ofta elektroniskt i ett datorsystem som kallas databashanteringssystem (DBMS). Ofta måste du använda ett programmeringsspråk, såsom strukturerat frågespråk (SQL), för att interagera med din databas.
Metadata
Metadata är data om data. Det beskriver olika egenskaper hos dina data, såsom hur det samlades in, var det lagras, dess filtyp eller skapelsedatum. Metadata kan vara särskilt användbart för verifierings- och spårningsändamål.
Open data
Öppna data, även kallade offentliga data, är data som är tillgängliga för alla att använda. Att utforska och analysera öppna dataset är ett sätt att öva dataanalysfärdigheter.
Qualitative data
Kvalitativa data är data som beskriver kvaliteter eller egenskaper. Det är generellt icke-numeriska data och kan vara subjektiva, till exempel ögonfärg eller känslor.
Quantitative data
Kvantitativa data är objektiva data med ett specifikt numeriskt värde. Det är generellt något du kan räkna eller mäta, såsom höjd eller hastighet.
Query
En fråga är en begäran om information. Det är i huvudsak den fråga du ställer till en databas för att returnera de data du vill hämta. Inom dataanalys formulerar du dina databasfrågor med hjälp av ett frågespråk, såsom Structured Query Language (SQL).
Relational database
En relationsdatabas är en databas som innehåller flera tabeller med relaterad information. Även om data lagras i separata tabeller, kan du komma åt relaterad data över flera tabeller med en enda fråga. Till exempel kan en relationsdatabas ha en tabell för lager och en annan tabell för kundorder. När du letar upp en specifik produkt i din relationsdatabas kan du hämta både lager- och kundorderinformation samtidigt.
Structured Data
Strukturerade data är formaterade data, till exempel data som är organiserade i rader och kolumner. Strukturerade data är mer lättanalyserade än ostrukturerade data på grund av dess snygga formatering.
Structured Query Language (SQL)
Structured Query Language, eller SQL (uttalas "sequel"), är ett datorprogrammeringsspråk som används för att hantera relationsdatabaser. Det är bland de vanligaste språken för databashantering.
Unstructured data: Ostrukturerade data är data som inte är organiserade på något uppenbart sätt. För att analysera ostrukturerade data måste du vanligtvis implementera någon form av organisation.
Contributions
Används i PCA för att visa skillnaden mellan en specifik datapunkt och en referenspunkt.
Dataanalys
Processen att undersöka, rengöra, transformera och modellera data för att upptäcka användbar information och stödja beslutsfattande.
Drift i Data
Förändringar eller avvikelser i data över tid.
Loadings
I PCA, visar hur mycket varje variabel bidrar till huvudkomponenterna.
Modellbyggande
Processen att skapa en matematisk representation av en uppsättning data.
Multivariat Dataanalys
Analysmetod där flera variabler analyseras samtidigt för att förstå samband och korrelationer.
PCA (Principal Component Analysis)
En teknik inom statistiken för att förenkla datamängder.
Processdata
Data som samlas in från en specifik process, ofta i realtid eller över tid.
Missing data
Dataelement som saknas i en datamängd.
Scores
I PCA, en representation av datapunkter i ett reducerat dimensionellt utrymme.
Univariat Dataanalys
Analys av data där endast en variabel beaktas åt gången.
Zimka
Ett verktyg för multivariat dataanalys.