, ,

Big Data – het nieuwe goud?

 

Big Data – het nieuwe goud? Vertilt u zich er niet aan!!

Data is het nieuwe goud en het hebben van data kan u veel voordeel opleveren. Bedrijven als Apple, Facebook en Google verzamelen al uw interesses, bewegingen en aankopen. Om er geld aan te verdienen; de krant staat er vol van.

Maar er gebeurt veel meer!

Bedrijven passen Business Intelligence (BI) toe: gegevens die tijdens ontwikkeling, productie, marketing en verkoop beschikbaar komen worden opgeslagen en tot informatie omgezet om later diezelfde processen te verbeteren of optimaliseren.  Hoe meer historie en gegevens beschikbaar, hoe beter de terugkoppeling naar het proces.

Download dit artikel in PDF: 

Met het opkomende Internet-of-things (IoT) komt er een continue mogelijkheid tot informatie vergaring en uitwisseling met de producten of diensten die geleverd zijn, en neemt de hoeveelheid BI-gegevens exponentieel toe. Al die gegevens dienen te worden opgeslagen en gecombineerd tot nieuwe informatie.

Bedrijven als Apple, Google en Facebook slaan gegevens op om er geld aan te verdienen

Waar vroeger 20% van alle gegevens gestructureerde data betrof, gaat dit door de continue nieuwe aanwas meer naar mínder dan 5%. De rest is ongestructureerd, niet geformatteerd en niet te vatten in b.v. tabellen. Idealiter wordt deze zo veel mogelijk realtime tot gestructureerde data verwerkt, vaak is dit niet mogelijk. Enerzijds omdat de juiste processing capaciteit ontbreekt, maar niet zelden weten we nog niet wat we uit de gegevens willen halen.  Daarom slaan we alles op, om in de toekomst mogelijk te gaan gebruiken. De traditionele IT-omgevingen is er niet op ingericht om deze grote hoeveelheden gegevens kosten effectief op te slaan.

Om dit goed te doen wordt het belangrijk het profiel van de data te kennen, immers, hoe vindt je later de juiste informatie in pakweg 100 miljard verzamelde gegevens items? En daar wringt hem nu net de schoen: CIO’s moeten weten welk (toekomstig) access profiel de gegevens hebben, om te weten hoe deze opgeslagen kunnen worden.

Bedrijven moeten de transformatie maken naar modellen waarin de waarde bepaald wordt van de verzamelde gegevens, om richting te geven aan de besteding van de IT-budgetten. Als u denkt dat dit voor de zeer grote bedrijven geldt heeft u het mis, dit komt ook bij middelgrote ondernemingen voor. Hoeveel data heeft u al verzameld over het ontwerp van uw nieuwste product, of de advertentie campagne die net afgesloten is. Al die informatie wilt u beslist nog jaren inzien.

Tenzij u over onbeperkte middelen beschikt zal ook bij uw CIO de vraag rijzen hoe alleen al de controle over de opslag van al die gegevens behouden blijft. Factoren die dit beïnvloeden zijn:

  • Wat is de relevantie van gegevens, wanneer en hoe zal er naar gerefereerd worden?
  • Levensduur: hoe lang is de data accuraat. Wat is de relevantie van de data als deze termijn verstreken is?
  • wettelijke bewaarregels: wat mag bewaard worden, moet encryptie toegepast worden, wie heeft daar toegang toe? Dit gaat ook op voor het bedrijf (spionage!)
  • Wat is de wettelijke bewaartermijn? Wat vinden mijn bedrijfsprocessen over de bewaartermijn?
  • Wanneer moeten gegevens (wettelijk) verwijderd worden?
  • Hoe snel wilt u de archief gegevens weer online hebben?
  • Hoeveel kopieën wilt u aanhouden van archief data?
  • etc.

Wat te doen?

Vooralsnog zijn er een aantal zekerheden die de CIO kunnen ondersteunen bij het maken van de juiste keuzes: 1) de groei van data is exponentieel; 2) de levensduur en/of bewaartermijnen wordt steeds langer; 3) de relevantie van de informatie wordt (relatief of absoluut gezien) steeds korter, en 4) het aandeel van de gestructureerde data neemt sterk af.

Daaruit kan – ten aanzien van de opslag van gegevens – geconcludeerd worden dat alleen primaire storage zowel uit kosten oogpunt als toegankelijkheid niet voldoende zal zijn om de digitale transformatie te ondersteunen.

Er zal meer en meer behoefte komen aan oplossingen waarin gegevens gearchiveerd kunnen worden op een kosten effectief medium wat past bij de relevantie en levensduur, maar snel en effectief terug gevonden kunnen worden, het Long Time Archive (LTA).

Voor opslag van LTA is high capacity tape  dan een betere oplossing, maar wees beducht op de verborgen kosten? Hoe om te gaan met verouderde technologieën, migraties naar nieuwe media, raadpleegkosten, etc.? Wellicht kan cloud hier een oplossing zijn: lage opslagkosten, hoewel het later raadplegen duur kan zijn.

Ideaal is het als de archief oplossing ondersteunend hierin is en de data op een goeie manier geclassificeerd kan opslaan: type data, mogelijk informatie, terug verwijzing naar originator, bewaarinformatie, toegangsrechten, maar ook fysieke controles op media uitvoert.  Zodat, op het moment dat het LTA geraadpleegd wordt, snel en in overeenstemming met de geldende regelgeving de juiste gegevens set terug gehaald kan worden.

Alleen dan kunnen de kosten van opslag in de hand gehouden worden.

In een toekomstige blog zullen we nader ingaan op de specifieke Do’s and Do’s voor LTA en Cloud.

0 antwoorden

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.