Introduktion till Data Warehouse Design

Ett lager i vanligt ord betyder att lagra något på ett ställe och liknande fall i branscher för att lagra den komplexa mängden data på en plats. Business Intelligence (BI) låter dig fråga data från datakällorna och förtroende kan göras endast när det finns en bra datalagerdesign.

Datalageret integrerar flera datakällor och kommer att ge ett bra stöd för analys och analysrapportering. Om du har en dålig datalagerdesign kommer det att påverka organisationens tillväxt genom att ha felaktiga frågeställningar.

Ta ett popularitetsexempel på Amazon webbshop genom att beställa artikeln och den kan levereras vid vår dörr. När kunden loggar in på e-handelswebbplatsen och söker efter den tillgängliga produkten i butiken. Sedan valde vi och beställde objekt, så snart leverantören accepterar och skickade omedelbart. Här kan vi spara vår tid för att köpa önskad artikel.

Ett liknande fall till detta datalager kan också data lagras och skaffas från transaktionssystemet. Datalageret som ett två huvudkoncept

  • OLAP - Online analytisk bearbetning
  • OLTP - Online Transactionional Processing

Båda är online-behandlingssystem men har vissa skillnader. OLTP hanterar transaktionsapplikationen som ATM, OLAP använder för analytisk behandling som rapportering, prognoser etc.

Kravssamling

  • Kravssamling är en fas i datalagerdesign. Det måste fastställa kriterierna och implementera dem framgångsrikt. Det kommer att finnas två strategier som används för datalagerdesign, den ena kallas verksamheten och en annan kallas teknisk.
  • Affärsstrategin fokuserar på den långsiktiga affärssynen och bidrar till att öka vinsten för tillväxt. Det tekniska strategikravet baseras på användarrapportering, analys, val av hårdvara, utvecklingsmetod, testteknik, implementeringsmiljö och användarutbildning.
  • När vi fastställde den affärs- och tekniska strategin måste vi också utforma BCP-planen (Disaster Recovery). När det sker en katastrof av mänskliga eller naturliga, måste vi ha en plan för att återställa data snabbt och se till att ingen data förlorar. Att utveckla planen för återhämtning av katastrofer är en av de utmanande och ger ett förtroende för organisationen.

Miljöinställning

  • När vi samlat in data för datalagerdesign måste vi göra en korrekt miljöuppsättning för utveckling, testning och produktion. Det bör företrädesvis finnas ett separat system för applikation, databas och separat för rapportering / ETL också.
  • När vi bygger en separat miljö för varje säkerställer att alla förändringar kan utvecklas / testas och sedan gå vidare till produktion.
  • Om vi ​​har en enda miljö som är utformad för alla dessa aktiviteter, kan det vara slut med problem och dataförlust. Till exempel när det inträffade en händelse i systemet kunde vi inte navigera och ta reda på hur vi kan fixa och det gör det mer komplicerat.

Datamodellering

  • När kravsamlingen och miljön har konfigurerats är nästa att utforma hur datakällan, processen och lagringen ansluts i datalageret. Denna teknik kallas för datamodellering. Det kan vara en analys av objektet och förhållandet mellan de andra.
  • När designen av datalageret utformade ingenjörerna hur och var informationen måste lagras. Vid samma tillfälle bör vi också definiera det möjliga sättet att hämta data från datalageret. När källan har identifierats kan teamet bygga logiken och skapa en strukturschemavy.

Typer av datamodell

Det finns tre typer

  • Conceptual
  • Logisk
  • Fysisk

De tre typerna av datamodell nämns nedan:

1. Konceptuell: Det står VAD systemet innehåller och det är designat av affärsarkitekter för att definiera omfattningen för affärsstrategi.

2. Logiskt: Detta definierar HUR det logiska kan skapas i DBMS, det kommer att utformas av Business Analyst och Data Architect för att skapa en uppsättning regler för att lagra / hämta data

3. Fysisk: Detta definierar HUR systemet kan implementeras.

Användning av Data Warehouse-design

Att vara en bra datalagerdesign kan vara tidskrävande när du hämtar data. Varje steg måste följas effektivt för att göra systemet bra. Det kommer att hjälpa organisationen att hantera de komplexa typerna av data och förbättra produktiviteten baserat på trendanalysen. Så varje steg i DWH-arkitekturdesign är viktigt och mer medvetet i urvalsmetoden. Organisationen går in i varje flöde därefter och leder till framgångsrikt implementering av datalageret.

Det finns få viktiga applikationsanvändningar av Data Warehouse

1. Bankindustri: De flesta av bankerna använder datalageret för att lagra en stor mängd transaktionsdata och förmågan att hämta frågedata mycket snabbare. Det kan hanteras som kunddata, marknadstrender, rapporter, analys etc.

2. Finansbransch: Det liknar bank, men det enda fokuset är att förbättra finansiella förändringar genom att analysera kunddata

3. Regering: För närvarande förvaltar regeringen mycket data online och lagrar i den relationsdatabas. Varje data har en relation med varandra som Aadhaar, PAN är kopplat till många källor.

4. Sjukvård: Sjukvårdschefer och tjänster så mycket information. Den upprätthåller kliniska detaljer, kundregister och hjälper dem att förutsäga resultaten, analysera feedbacken och generera rapporterna.

5. Försäkring: Försäkringsbolag som främst används för datamönster, kundtrend och underhåll av register.

6. Tillverknings- och distributionsindustri: Den används mest i alla branscher för lagring av information om information och hjälper dem att förutsäga efterfrågan på tillverkning och försäljning. Analysera den sålda varan som ger bättre beslutsfattande tekniker.

7. Återförsäljartjänster: Återförsäljare är mellanhand mellan tillverkaren och kunden. Datalager hjälper dem för kampanjer och trender för att köpa varor.

8. Telefonbransch: Telefonbranscher hanterar många historiska data som hjälper till att göra kunddatautvecklingen och mål att driva reklamkampanjer.

Fördelar med Data Warehouse

  • Levererar förbättrad affärsinformation
  • Säkerställer datakvalitet och konsekvens
  • Sparar tid och pengar
  • Spårar historiskt intelligenta data
  • Genererar hög avkastning

Dis-fördel med Data Warehouse

  • Extra rapportarbete
  • Oflexibilitet och homogenisering av data
  • Ägarproblem
  • Krav på stora mängder resurser
  • Dolda problem konsumerar tid

Rekommenderade artiklar

Detta är en guide till Data Warehouse Design. Här diskuterar vi datalagerdesigntekniken, kravsamling, miljöuppsättning, användningar, fördel / Dis-fördel. Du kan också titta på följande artikel för att lära dig mer -

  1. Fördelarna med Data Warehouse
  2. Implementering av datalager
  3. Datalagermodellering
  4. Data Warehouse-verktyg
  5. Topp 4 olika typer av datamodeller

Kategori: