BLOG
DIGITAL

Blog: Hvor kommer Big Data fra?

Når virksomheden begynder den digitale transformation dukker de første eksempler på Big Data op – uanset om den påbegyndte transformation er bevidst eller ej.

[30. april 2015] Kundernes krav til virksomhedens tilstedeværelse på mobile enheder og sociale medier fører ofte til at virksomheden ønsker at analysere interaktionen mellem virksomheden og kunderne.

Er det Big Data?

Ja, det vil ofte være Big Data – for de fleste virksomheder vil det ikke nødvendigvis være i form af voldsomt store data mængder. Der vil dog ofte være tale om data med voldsomt varierende formater og ofte fyldt med ironi, sarkasme og tvetydigheder. Det er altså en helt anden analyseopgave end at analysere strukturerede data med kendt format og god data kvalitet. Big Data værktøjer er ideelle til denne type analyseopgave.

I takt med at processer og produkter digitaliseres, tilgængeligheden af sensorer stiger og prisen på sensorer falder, så stiger incitamentet til at øge antallet af målepunkter i både processer og produkter og indsamle alle disse målinger via trådløse netværk. Procesindustrien har i årtier samlet denne type data fra hundredevis af målepunkter. Nu øges antallet af målepunkter drastisk og med Internet-of-Things kan der være tale om titusindevis, ja måske millioner af målepunkter.

I dette tilfælde kan begrebet Big Data være mere indlysende. Der kan være tale om meget store data mængder, der ankommer med meget høj frekvens. Disse data er oftest velstrukturerede – analyseopgaven i forbindelse med disse data besværliggøres af at de enkelte data punkter sjældent giver værdi i sig selv – målet med analyse af disse data er oftest at finde mønstre og afvigelser og ofte uden at gøre det ud fra en veldefineret hypotese. Big Data værktøjer er ideelle til at håndtere og analysere denne type data.

En tommefingerregel for hvornår det giver mening at anvende Big Data begrebet med tilhørende værktøj og analysemetoder er følgende: Hvis du selv kan lave en prototype på den ønskede analyse på et lille udsnit af de aktuelle data i Excel, så er der ikke tale om Big Data, med mindre de traditionelle værktøjer har svært ved at håndtere det fulde datasæt på grund af datavolumen, opdateringsfrekvens, varierende format eller upålidelighed. For eksempel er 1 Petabyte ikke Big Data, hvis der er tale om salgstransaktioner i en virksomhed som f.eks. Walmart. Det håndteres enkelt med traditionelle BI-værktøjer og en relationsdatabase. 1 GB bestående af et års sensor målinger med et interval på 10 ms fra en motor kan derimod med fordel betragtes som Big Data og håndteres med dertil egnede værktøjer.

Det nye ved Big Data er, at det er blevet rentabelt at inkludere flere data i analyserne og udføre nye typer af analyser.

Udfordringerne består i at finde værktøjer, infrastruktur og kompetencer til at håndtere disse nye data og analyser og at integrere dem med de eksisterende værktøjer, infrastruktur og kompetencer til en velfungerende helhed.

Hvis du vil vide lidt mere omkring Big Data og IT-arkitektur, gennemgår jeg emnerne i København og Århus. Deltagelse er gratis og du kan tilmelde dig her:

Erik Haahr
Erik Haahr
Managing Consultant
+45 52189364
todo todo