En programserie dedikerad till dataanalys
och dess påverkan...
DataDialog är en tankeväckande och informativ videopodcast som syftar till att utforska och demystifiera världen av dataanalys, data science och big data. Denna serie är inte bara en samling avsnitt utan en resa genom dataanalysens kärna och dess betydande roll i dagens samhälle och näringsliv. Den är skapad med en vision om att göra datanaalys tillgänglig och förståelig för alla.
Ordlista
Terminologin inom dataanalys
Här finner du ord och betydelser inom datavärldens gränser.
B
Big data
Stora datamängder som är så komplexa att traditionella datahanteringsverktyg inte kan bearbeta dem effektivt.
C
Clustering
En teknik inom maskininlärning och statistik för att gruppera objekt så att objekt i samma grupp är mer lika varandra än de i andra grupper.
D
Dataanalys
Processen att undersöka, rengöra, transformera och modellera data för att upptäcka användbar information och stödja beslutsfattande.
E
ETL
Processen att analysera stora datamängder för att hitta mönster, trender och information.
F
Forecasting
Användning av historiska data för att förutsäga framtida händelser eller trender.
G
Graph database
En typ av databas som använder grafer för att lagra, mappa och fråga relationer mellan data.
En grafisk representation av datafördelning i form av staplar.
Histogram
H
I
IoT (Internet of Things)
Nätverk av fysiska objekt - "saker" - som är inbäddade med sensorer, programvara och andra teknologier för att ansluta och utbyta data med andra enheter och system över internet.
J
JSON (JavaScipt Object Notation)
Ett lättviktigt datautbytesformat som är lätt för människor att läsa och skriva och för maskiner att tolka och generera.
K
K-means clustering
En populär klusteranalysmetod inom data mining och maskininlörning.
L
Linear regression
En statisk metod för att modellera relationen mellan en beroende variabel och en eller flera oberoende variabler.
M
Machine learning
En gren av artificiell intelligens som fokuserar på utveckling av system som kan lära sig från och göra förutsägelser eller beslut baserat på data.
N
Neural network
En serie av algoritmer som försöker identifiera underliggande relationer i en uppsättning data genom en process som efterliknar sättet människohjärnan fungerar.
O
Outlier
En datapunkt som avviker markant från andra observationer, vilket kan tyda på variation i mätningen eller en experimentell fel.
P
Predictive analytics
Användning av statistik, maskininlärning och data mining för att analysera nuvarande och historiska fakta för att göra förutsägelser om framtiden.
Q
Quantitative data
Data som kan mätas och uttryckas numeriskt, såsom ålder, inkomst eller temperatur.
R
Regression analysis
En statistisk metod för att undersöka relationer mellan olika variabler.
S
SQL
Ett programmeringsspråk som används för att manipulera data i relationsdatabaser.
T
Time series analysis
En statisktisk teknik som analyserar tidsordnade datasekvenser för att identifiera trender, cykler och andra mönster.
U
Unstructured data
Data som inte är organiserade i en förutbestämd eller lättanvänd struktur, såsom text eller multimedia.
V
Visualization
Processen att omvandla data eller information till grafiska diagram, diagram eller animationer för att göra data lättare att förstå och tolka.
X
XML
Ett flexibelt textformat som används för att struktur och transportera data över internet.
Y
Yield prediction
Användning av dataanalys för att förutsäga avkastningen av en viss process eller investering.
Z
Z-Score
Ett statistisk mått som anger hur många standardavvikelser en datapunkt ligger från medelvärdet i en datamängd.