Skillnad på data, data och data

Vad är data och är det någon skillnad?

Det korta svaret är nej. Och ja. Och nja.

Det var väl tydligt och bra?

Egentligen så är ju data bara data. Men hanteringen av data, funktionen av data och i slutändan, konsumering av data skiljer sig väldigt mycket åt.

Innan du fortsätter läsa, det här är ingen heltäckande eller vetenskaplig guide över allt som har med data att göra, det är mer en förenklad översikt för att skrapa lite på ytan för den som är nyfiken och vill ha lite mer förståelse än att bara tänka ”data”.

De datatyper jag tänkte prata lite övergripande och förenklat om är:

Statisk data
Rörlig data
Masterdata
Rådata
Förädlad data
Aggregerad data
Metadata
Funktioner av data

Generellt, innan jag hoppar in i respektive datatyp, så är den datan jag syftar på här typiskt systematiserad och strukturerad data som finns lagrad i ett eller flera system.

Statisk data

Statisk data är information som inte alls ändras (ditt personnummer som du har samma hela livet) eller sällan ändras (ditt mobilnummer, din adress).

För företag kan det vara inventarier, kundregister, byggnadsinformation etc.

Fast data används ofta för att skapa strukturer till funktioner.

Rörlig data

Det här är data som förändras och ofta är knutet till något som är fast, som tid och/eller plats.

Kl. 12:00, 29 Januari var temperaturen 4 grader i Helsingborg.

Ändrar vi plats eller tid är det troligt att datavärdet (temperatur) också ändrar sig.

Masterdata

Data behöver ofta användas på många olika ställen. För att undvika dubbel- (trippel-, quadrupel-, etc) administration sätts ofta automatiska synkningar upp. Det betyder att datan ”Adress” som finns i system 1 kopieras till system 2 och system 3. Ändrar jag ”Adress” i system 1 synkas förändringen ut till system 2 och system 3. Ändrar jag däremot ”Adress” i system 3 syns den bara i system 3 och beroende på hur synkningen ser ut kan ”Adress” i system 3 skrivas över vid nästa synkning eller nästa gång någon ändrar ”Adress” i system 1.

Den data som finns i system 1 är då Masterdata och system 2 och system 3 är konsumenter av datan.

För att göra det lite klurigt kan systemen vara länkade i ett ekosystem där de alla fyller olika funktioner och syften, så alla systemen kan innehålla masterdata och samtidigt vara datakonsument.

Tänk att System 1 är leveranssystem av vilka tidningar som ska skickas ut från en tidningsdistributör.

System 2 är Säljsystem eller CRM där de som ringer ut till kunder registrerar sina kundkontakter och skulle kontakten leda till en prenumeration registreras den i System 3.

System 3 är det system som berättar vilka kunder som prenumererar på vilken eller vilka tidningar.

System 1 – Masterdata ”Leveranser” –> Kopieras till System 2 och System 3 som är datakonsument av ”Leveranser”
System 2 – Masterdata ”Adress” + ”Telefonnummer” –> Kopieras till System 1 och System 3 som är datakonsument av ”Adress” + ”Telefonnummer”
System 3 – Masterdata ”Prenumerationer” –> Kopieras till System 1 och System 2 som är datakonsumenter av ”Prenumerationer”.

I System 1 skapas leveranserna baserat på data från System 2 där det får ”Adress” och ”Telefonnummer” och System 3 där det får ”Prenumerationer”.

I System 2 registreras alla kundkontakter och ifall det blir en prenumeration registreras den i System 3. I System 2 kan säljaren se vilka aktuella prenumerationer som respektive kund har under pågående samtal utan att behöva gå in i System 3. Det är endast vid förändringar i prenumerationer som säljaren behöver gå in i System 3.

I System 3 är alla prenumerationer registrerade och System 3 berättar för System 1 vilka tidningar som ska levererar till respektive kund. Adressen får System 1 från System 2 som uppdateras när säljaren har kontakt med kunden. System 3 är det system som genererar fakturor till kunderna som också nyttjar adressen från System 2.

Rådata data

Rådata kommer typiskt från något som genererar rörlig data. Det kan dessutom röra sig om många olika varianter av rådata.

Jag gör skillnad på den data som kommer från enheten som genererar datan, som kan se olika ut beroende på vad det är för enhet, och strukturerad rådata, där all rådata från enheter sammanställts och ser lika ut.

Exempelvis så kan två olika temperaturmätare från olika fabrikat leverera rådata som ser olika ut. Det kan handla om att de levererar datapaket som är strukturerade på olika sätt eller via olika kommunikationsstandarder som ger olika innehåll i datapaketen. Ena fabrikatet kan leverera temperaturen på första plats i datapaketet, medans det andra fabrikatet kanske levererar ett batterivärde först i datapaketet och själva temperaturvärdet på en annan plats i datapaketet.

Att strukturera rådatan så att allt ser lika ut är då viktigt för att i nästa led kunna bygga funktioner utifrån den strukturerade rådatan. Rådatan behöver då gå genom någon form av tolk/avkodning för att sparas ner strukturerat och likställt som strukturerad rådata.

Förädlad data

Ibland är den data som finns tillgänglig inte den data vi vill använda. Då kan data behöva behandlas för att bli användbar.

Ett café som köper in kaffebönor i säckar som mäts i kilogram vill kanske omvandla inköpsvolymen kilogram kaffebönor till hur många koppar kaffe det går att sälja.

Då kan de använda antalet inköpta kilo kaffe och använda en omräkningsfaktor eller nyckel och istället skapa data för hur många koppar kaffe som går att sälja. 7 gram kaffe per kopp ger ungefär 143 koppar kaffe per inköpt kilogram kaffebönor.

En annan förädling av data kan vara kombinera olika data för att få en ny datatyp som det inte finns, till exempel vid en konsert finns det 1000 sålda biljetter. Vid konserttillfället säljs det 500 flaskor vatten, 800 varmkorvar och 200 chipspåsar. Genom att kombinera biljettantalet med försäljniningssiffror från respektive produkt kan vi generera ny data. Vid konserten köpte 1 av 2 (50%) en flaska vatten, var 8 av 10 (80%) köpte korv och 1 av 5 (20%) köpte chips. Inför nästa konsert kan dessa siffror användas som riktmärke för att se till att ha rätt mängd varor i lager. Om antalet sålda biljetter är 500 eller 2000 istället för 1000 går det att uppskatta försäljningsvolymerna för respektive vara. (Så klart är det en mer komplex beräkning där beteende kan förändras baserat på massor av faktorer som målgrupp i publiken eller tid på dagen, konsertens längd etc.)

Förädlad data kan också vara att omvandla rådata (en mätarställning på en vattenmätare) till ett förbrukningsvärde per timme eller dag (eller någon annan tidsintervall). Skickar mätaren sin mätarställning kommer den i kubikmeter och den räknas hela tiden upp varje gång du använder vatten. Står mätaren på 1000 och du tar en dusch kan den sen stå på 1020. För att få reda på hur mycket vatten du har använt i duschen är startställningen 1000 L och slutställningen 1020 L, skillnaden mellan mätarställningarna är det du har använt. 20 L. Så det förädlade värdet av inkommande mätarställningen är förbrukningen.

Aggregerad data

Aggregera är egentligen att lägga ihop. Om jag har ett hyreshus med fem lägenheter och en tvättstuga och mäter vattenförbrukningen till varje lägenhet kan jag lägga ihop de fem olika mätpunkterna och få hela byggnaders vattenförbrukning. Har jag dessutom en fristående tvättstuga som använder vatten, men inte har någon mätare kan jag räkna ut hur mycket vatten tvättstugan i den fristående byggnaden tar genom att ta bort den aggregerade vattenförbrukningen från de fem lägenheterna från den totala vattenförbrukningen jag får från räkningen av vattenleverantören.

Aggregerad data används typiskt till att se de stora penseldragen och få helhetsbilder, snarare än detaljerna under.

Vad är alla kostnader kring en viss produkts produktionslinje och hur mycket intäkter genererar de produkterna? Vilka är de största energiförbrukarna och var kan vi börja titta på åtgärder för att minska energiförbrukningen?

Metadata

Metadata är data som kläs på annan data. Ett exempel som många kan relatera till är taggar i ett inlägg på sociala medier. Datan är inlägget (texten och/eller bilden). Metadatan är saker som läggs på automatiskt (som platsinformation) eller manuellt (haschtag Mello2025).

I exemplet med vattenmätarna ovan kan metadata för en vattenmätare vara: var sitter den? Är det en kallvattenmätare eller varmvattenmätare? Går den till en tvättstuga eller en lägenhet?

Metadata är sånt som vi ”klär på” annan data med för att kunna använda, sortera eller konsumera den på olika sätt och/eller skapa funktioner.

Om jag har 1000 vattenmätare och bara vill titta på dem som går till tvättstugor och är kallvatten kan jag sortera fram det med hjälp av metadatan. Något som hade blivit betydligt svårare utan metadata, då jag istället manuellt hade behövt ta datan/informationen genom att gå igenom den i kombination med kunskap vad det är jag letar efter.

Funktioner av data

Finns data, fast strukturerad data, rörlig data och/eller metadata kan saker börja hända automatiskt. Vi kan skapa funktioner av data. Automatisera.

I exemplet under Masterdata ovan kan det automatiskt genereras ett fakturautskick varje månad så att kunden får betala för de aktuella prenumerationerna den har, baserat på aktiva prenumerationer, pris för respektive tidning och adress.

Funktionen kan då vara:

Den 1:a varje månad skapas en faktura för varje Kund som är registrerad i System 3. Det som hämtas är:
- Kund information (Namn + Adress (som i exemplet är konsumerad data från System 2)
- Vilka aktiva prenumerationer som finns på respektive kund (datumstyrda)
- Pris för respektive tidning
Detta sammanställs och skickas ut.

En annan funktion kan vara:

För att spara energi för uppvärmning av ett kontor kan uppvärmningen automatiseras.
Klockan 7 Måndag till Fredag ökas inomhustemperaturen till 21 grader.
Klockan 17 Måndag till Fredag sänks inomhustemperaturen till 18 grader.
Utlöses en närvarodetektor på kontoret kvälls- eller helgtid ökas temperaturen till 21 grader i en timme och sänks till 18 grader när ingen rörelse detekterats på en timma.
Utlöses inte en rörelsedetektor på kontoret Måndag till Fredag efter klockan 9 sänks temperaturen till 18 grader tills rörelsesensor aktiveras.

Även om ovan är väldigt lokalt exempel och kanske mer pekar på användning av sensorer snarare än data, så är principen den samma. Baseras den på data (även data från sensorer) och byggs utifrån data och funktioner av data, går det att skala upp på ett helt annat sätt än det traditionella med att använda lokala sensorer.

Kort exempel är gatlyktor. Varje gatlykta skulle kunna ha en egen sensor, ett skymningsrelä, som tänder lampan när det blir mörkt ute. Det skulle då krävas ett skymningsrelä per gatlykta. Utmaningar i det är dels att olika skymningsreläer kan ha olika inställningar och känslighet, så två gatlyktor nära varandra kanske inte tänds samtidigt och styrningen av när de tänds är begränsat till det egna skymningsreläet. Säger du istället att alla gatlyktor i en hel stad ska tändas baserat på en styrsignal som kommer från ett centralt ställe kan du ersätta alla skymningsrelä i varje gatlampa med ett centralt. Väljer du sedan att läsa av ljusvärdet på skymningsreläet istället för att gå på om skymningsreläet tycket att det är mörkt eller inte, kan du skjuta tiden för att tända gatlyktorna till ett visst ljusvärde som du själv bestämmer över. Tänk att skjuta tändandet av alla gatlyktor i en hel stad med fem, tio eller femton minuter. Hur mycket energi spara det? Kombinera dessutom det med andra datakällor som soluppgång och solnedgång. Faktorer som om det är molnigt eller inte. Om det ligger snö på marken eller inte. Plötsligt kan du styra alla gatlyktor i hela staden utifrån flera dataparametrar som ger dig möjlighet att ta hänsyn till många olika faktorer.

Funktioner av data kan också vara för att slippa göra handpåläggning, exempelvis automatiskt räkna ut aggregerad data, eller medelvärden eller förekomster av något med en viss metadata. Funktioner som skapar och paketerar konsumerbar data utifrån inkommande data.