Tilbage

7 faldgruber i Data Warehouse - del 1

Dette er den første i en række af i alt 7 artikler om de 7 faldgruber, som BI Architect Brian Bønk Rueløkke gennem tiden er stødt på i sit arbejde med Data Warehouse.

Der er efterhånden løbet mange tusinde linjers kode og flere TB data igennem blodårene på mig. De mange Data Warehouse og andre datadrevne løsninger, har lært mig meget.

Mange af de løsninger har været faldet ned i en eller flere faldgruber i arbejdet med Data Warehouse. Faldgrupper som man bør styre uden om for at få en mere strømlinet proces.

Hvad er problemet egentlig?

Mange medarbejdere oplever at bunker af arbejde "dumpes" på deres skrivebord. Ironisk nok så har analytikere og andre der arbejder med data sjældent den oplevelse. De har derimod opgaven i at finde svar på spørgsmål fra forretningen i eksisterende data og præsentere dem i et let fordøjeligt format.

Uanset hvordan din specifikke organisation ser ud, er det mere eller mindre det der sker.

Den rette information til de rette mennesker

Det nytter ikke at skabe super detaljerede rapporter til C-level managers og ej heller det modsatte, at skabe de forkromede dashboards med overordnede tal til medarbejderne i leverancen.

Det gælder om at kende sit publikum - (som eks, og ikke udtømmende):

  1. C-level - KPI rapporter og overordnede metrikker for den samlede forretning
  2. Marketing - Basal viden om antallet af besøgende på hjemmesider og andre digitale kanaler. Konverteringsrater for kampagner og kanaler
  3. Salg - anvender meget sandsynligt et CRM system som er konfigureret til at levere 90% af de tal der skal anvendes i dagligdagen. Så måske de kan vente lidt med at komme med i problemløsnings-mode
  4. Produkter og leverance - de fortæller sikkert at de allerede har en lang række rapporter og dataudtræk fra legacy-systemerne som de anvender til noget rapportering. Men du kan bidrage med at nedbringe antallet af timer brugt på manuel dataudtræk og rapportering. Timer de så kan bruge på deres kernekompetencer.
  5. Bogholderiet - de er måske ret anale omkring sikkerhed på data og politiker på samme. Der skal du arbejde lidt på den politiske front for at få dem med på rejsen

Hvad skal JEG så gøre?

Traditionelt er mange organisationer ramt af utroligt mange manuelle data behandlinger, der skal tilvejebringe diverse og mangeartede former for rapportering. Dette er måske endda på trods af, at de godt ved der eksisterer en kæmpe regnemaskine i SQL Serveren og endvidere har stærke tekniske kompetencer.

Direktionen tager beslutninger på et ikke helt korrekt oplyst og datadrevet grundlag

Mange ad-hoc systemer er måske blevet opbygget til brug for rapportering, men de er sjældent på linje med hinanden og har endnu ikke fået det gyldne stempel fra direktionen. Løsningen på mange af deres problemer på rapportering, er ofte at ansætte endnu flere "skrivebordsfolk" til manuelt at knuse data i et sandt Excel-hell.

Der er mange forskellige datakilder. Det indkøbte out-of-the-box system leverer kun en delmængde af de nødvendige rapporter (som måske endda er fejlbehæftede). Direktionen tager beslutninger på et ikke helt korrekt oplyst og datadrevet grundlag.

Det er hvad det er, og situationen du er havnet i. Men hvordan kommer man så videre derfra?

Find løsninger på problemet

Der er med garanti mange udbydere af standard løsninger til præcis dette problem. hvis man dog bare kunne finde det ene der passede perfekt til organisationen og kravene. En drømmeverden der sjældent eksisterer i virkeligheden.

Man falder til jorden med et brag når man opdager at der er ent kæmpe afgrund mellem de eksisterende rapporteringsløsninger og alle legacy-systemerne.

Selv om man kunne overbevise organisationen om at man kunne anskaffe et nyt system der har flere indbyggede rapporteringsmuligheder, så skal man stadig migrere de historiske data og sørge for change management og afsætte flere år til den samlede implementering.

Og det er vel og mærke kun hvis der kan findes penge til investeringen, som kun forværres ved at det er utrolig svært at få den endelige pris når man spørger leverandørerne af systemerne. Det er altid behæftet med en masse antagelser og afvigelseshåndtering.

Er der mon ikke en måde hvorpå alle de dekoblede data kunne bringes sammen og skabe et centralt repositorie for analytisk arbejde i organisationen?

Data Warehousing

Nu begynder der at ske noget - Data Warehouse - alene ordet lyder spændende og smager af teknik.

Live forbindelser til applikationerne og data flyder på magisk vis ind i Data Warehouse

Mange forskellige værktøjer trækker allerede på de forskellige endpoints og datakilder fra de interne systemer, og kan skyde dem hvorhen i verden det måtte være. Dette lyder som svaret på mange spørgsmål, der skal kun lige arbejdes lidt med de eksisterende udtræk og begynde at sende data til.... til.... til hvor egentlig?

Der er måske allerede læst mange spalter fra diverse leverandører af de interne systemer, hvordan de LET kan kaste om sig med data og gemme det i et Data Warehouse. Organisationen og teamet har måske ikke den dybe erfaring med at bygge Data Warehouse, men alene ideen om at have et, lyder meget tiltalende.

Tænk en gang - al virksomhedens data samlet ét sted med live forbindelser til applikationerne og data flyder på magisk vis ind i Data Warehouse.

Forenet under den samme motor kan teamet og hele organisationen begynde at kaste tusindevis at timer imod at bygge rapporter og finde svar på spørgsmål, der end ikke turde stilles tidligere.

Fuldt udstyret med forskellige logiske lag, som hver for sig har deres egen eksistensberettigelse og som bl.a. sørger for beregninger, så man ikke hver gang selv skal gange tal1 med tal2 og dele med Pi. Kunne tilvejebringe godkendte og veldefinerede rapporter på tværs af dimensioner. Og levere forespørgsler på data gennemsigtig og let. Grupperinger på elementer som segmenter, kunder, kohorter og andet godt - se det ville være den ultimative løsning.

Men er det nu også det?

Det kigger jeg videre på næste gang hvor jeg vil skrive om koncepter og planlægning.

Fik du set linket til min gode kollega Sørens indlæg om Excel-hell længere oppe i artiklen? Ellers er det her.