Vad är datamodellen?

Tolkning och dokumentation av befintlig mjukvarudesign och utvecklingsförfaranden och transaktioner kallas informationsmodellering. Metoderna och instrumenten för informationsmodellering förenklar de komplexa systemkonstruktionerna för att göra det enklare för omkonstruktion att använda information. Det används för att utforma ett informationslager logiskt och fysiskt. I det här ämnet kommer vi att lära oss om Data Warehouse Modeling.

Behov av datalagermodellering

  1. Affärskravssamling
  2. Förbättra databasens prestanda
  3. Tillhandahåller dokumentation av käll- och målsystemet

1. Samling av företagskrav

Ett datalager är vanligtvis utformat för att bestämma de enheter som krävs för datalageret och fakta som måste registreras med dataarkitekter och affärsanvändare. Denna första design har mycket iteration innan den slutliga modellen beslutas.

Vi måste övervinna de rådande nackdelarna i designfasen på denna punkt. Eftersom ett befintligt system implementerar ett datalager, integrerar arkitekter ibland en stor del av det gamla systemet i den nya designen, vilket sparar tid eller avslöjande.

Den logiska modellen fångar effektivt företagets behov och fungerar som en grund för den fysiska modellen.

2. Förbättra databasens prestanda

Kontroll av effektivitet är en väsentlig egenskap hos ett datalager. I ett datalager är enorm information involverad, så det är mycket viktigt att använda en datamodellprodukt för metadata och datahantering som används av BI-konsumenter.

Den fysiska modellen lägger till indexering för att optimera databasens effektivitet. Planerna ändras också ibland. Till exempel, om ett stjärnschema lovar snabbare dataåterhämtning, kan det ändras till ett snöflingaschema

3. Tillhandahåller dokumentation av käll- och målsystemet

När man utvecklar ett ETL-system är de fysiska och logiska modellerna för käll- och målsystemen mycket viktiga att kontrollera.

Denna dokumentation erbjuds genom informationsmodellering som referens för framtiden.

Konceptuell datamodell

Det högsta förhållandet mellan de olika enheterna bestäms av en konceptuell datamodell.

Det är det första steget mot att skapa en top-down datamodell som representerar företagets exakta presentation.

Utformar den totala databasstrukturen och listar ämnesområdena

Omfattar enheter och interaktioner mellan enheter. Symboliska notationer (IDEF1X eller IE) representerar förbindelsen mellan ämnesfälten. I en informationsmodell visar kardinaliteten en eller flera förhållanden

Modell för relationsdata

Modellering av relativ information i transaktionsorienterade OLTP-scheman används. En relationell datamodell har betydande funktioner:

  • Användning av nyckel
  • Dataredundans
  • Förhållande mellan data

Användning av nyckel

Huvudnyckeln i en tabell är nyckeln. Det används som en enda identifiering. En kolumn som inte är noll är en primär nyckel. För huvudnyckeln används den främmande nyckeln. De länkar informationen från en tabell till en annan tabell och ansluter.

Dataredundans

Förhållande informationsmodell tillämpar lagar om informationsintegritet

Dataredundans elimineras. En del information samlas inte upp flera gånger. Detta säkerställer konsistensen mellan data och begränsad datalagring

Förhållande mellan data

All data lagras i tabeller och varje relation har kolumner och rader.

En rubrik och en kropp ska finnas på bordet. Rubriken är tabellistan med kolumner och tabellen består av raderna. Tupeln är det enda värdet som produceras genom en kolumn- och radkorsning.

Flerdimensionell datamodell

En organisation som återspeglar företagets betydelsefulla enheter och kopplingen mellan dem är ett logiskt perspektiv av en flerdimensionell datamodell. Databaserna och tabellerna är inte begränsade till en naturlig databas. ER-diagrammen visas inte.

  • attribut
  • Fakta
  • Dimensionera

a. Dimensionera

  1. En aspekt är en datainsamling som består av enskilda informationskomponenter som inte överlappar varandra
  2. Du kan ställa in, gruppera och filtrera information för visning och bläddring av slutanvändare.

b. Fakta

  1. En kolumntabell som används för att svara på företagsfrågor av numeriska skäl.
  2. Åtgärderna är tillsatser, halvtillsatser och icke-tillsatsmedel

c. attribut

  1. De abstrakta villkoren är utformade för att underlätta sammanfattningen av information i en studie
  2. De kan också beskrivas som kolumnrubriker som inte ingår i en rapportberäkning.

Fördelar med den dimensionella modellen

  1. Standardisering av dimensioner gör det enkelt att rapportera över affärsområden.
  2. Dimensionellt också för att lagra data för att göra det lättare att hämta data från data när data lagras i databasen.
  3. Företaget är mycket förståeligt för den dimensionella modellen. Denna modell är baserad på företagets villkor så att företaget förstår betydelsen av varje verklighet, aspekt eller funktion.
  4. För snabb informationsfrågor deformeras och optimeras dimensionella modeller. Många relationsdatabasplattformar erkänner denna modell och optimerar frågeställningarnas prestationsplaner.
  5. Dimensionella modeller kan rymma förändringar bekvämt. Dimensionstabeller kan innehålla ytterligare kolumner utan att påverka användningen av dessa tabeller av aktuella företagens intelligensappar.

Modeller för bästa praxis

Innan datamodellen påbörjas bör en fullständig analys av kundföretagens behov genomföras. Det borde vara oerhört viktigt att möta kunderna för att diskutera krav och tekniker för informationsmodellering och att företagets ämnesspecialister omedelbart ska bekräfta det.

Företaget ska förstå datamodellen, vare sig det är i ett grafiskt / metadataformat eller som affärsregler för texter.

Rekommenderade artiklar

Detta är en guide till Data Warehouse Modeling. Här diskuterar vi datamodellen, varför behövs den i datalagring tillsammans med dess fördelar och typer av modeller. Du kan också titta på följande artikel för att lära dig mer -

  1. Data Warehouse-verktyg
  2. Typer av datalager
  3. Dataanalysverktyg
  4. Data Science Tools
  5. Oracle Data Warehousing

Kategori: