Introduktion till dimensionstabell
En dimensionstabell finns i stjärn- eller snöflingaschemat. Dimensionstabeller hjälper till att beskriva dimensioner, dvs dimensionvärden, attribut och nycklar. Den är i allmänhet liten i storlek. Storleken kan variera från flera till tusen rader. Den beskriver objekten som finns i faktabellen. Dimensionstabell hänvisar till insamlingen eller gruppen av information som är relaterad till alla mätbara händelser. De utgör en kärna för dimensionell modellering. Den innehåller en kolumn som kan betraktas som en primär nyckelkolumn som hjälper dig att identifiera varje dimensionerrad eller post. Det förenas med faktatabellerna genom denna nyckel. När det skapas en nyckel som kallas surrogatnyckel som genereras av systemet används för att identifiera raderna i dimensionen på ett unikt sätt.
Varför måste vi använda?
- Det hjälper till att lagra historien om informationen eller dimensionell information.
- Det är lätt att förstå än de normaliserade tabellerna.
- Fler kolumner kan läggas till i tabellen utan att det påverkar de befintliga applikationer som använder dem.
Typer av dimensionstabell
Följande är de olika typerna av dimensionstabellen:
1. SCD (sakta förändrade dimensioner)
Dimensionattribut som tenderar att förändras långsamt med tiden snarare än att ändras i ett regelbundet tidsintervall kallas långsamt förändrade dimensioner. För t.ex. adress- och telefonnummer ändras men inte regelbundet. Låt oss se ett exempel på en man som reser till olika länder så att han måste byta adress enligt det landet. Detta kan göras på tre sätt:
Typ1: Skriv över föregående värde. Denna metod är lätt att tillämpa och hjälper till att spara utrymme och därmed minska kostnaderna. Men historien går förlorad i detta scenario.
Tabellen före ändringen
ID | NAMN | LAND | NATIONALITET |
1001 | Rachel | Indien | indisk |
Tabell efter förändringen
ID | NAMN | LAND | NATIONALITET |
1001 | Rachel | Kina | indisk |
Typ2: Lägg till en ny rad med det nya värdet. I den här metoden sparas historiken och kan användas när det behövs. Men det tar stort utrymme och ökar därmed kostnaden.
Tabellen före ändringen
ID | NAMN | LAND | NATIONALITET |
1001 | Rachel | Indien | indisk |
Tabell efter förändringen
ID | NAMN | LAND | NATIONALITET |
1001 | Rachel | Indien | indisk |
1001 | Rachel | Kina | indisk |
Type3: Lägg till en ny kolumn. Det är den bästa metoden eftersom historien enkelt kan upprätthållas.
Tabellen före ändring
ID | NAMN | LAND | NATIONALITET |
1001 | Rachel | Indien | indisk |
Tabell efter ändring
ID | NAMN | LAND | GAMLA LAND | NATIONALITET |
1001 | Rachel | Kina | Indien | indisk |
2. Konformerad dimension
Denna dimension delas mellan flera ämnesområden eller datamark. Samma kan användas i olika projekt utan att några ändringar görs i samma. Detta används för att upprätthålla konsistensen. Konformerade dimensioner är de som är exakt samma eller en korrekt delmängd av någon annan dimension.
3. Skräpdimension
En skräpsdimension är en grupp attribut med låg kardinalitet. Det innehåller olika eller olika attribut som inte är relaterade till något annat attribut. Dessa kan användas för att implementera RCD (snabbt föränderlig dimension) såsom flaggor, vikter etc.
4. Degenererad dimension
Det attribut som lagras i själva faktabellen och inte som en separat dimensionstabell, dessa attribut kallas degenererad dimension. För t.ex. biljettnummer, fakturanummer, transaktionsnummer etc.
5. Rollspel Dimension
Att ha flera relationer med faktatabellen kallas rollspeldimension. Med andra ord är det när samma dimensionsknapp med alla dess relaterade attribut förenas med många utländska nyckelpresent i faktatabellen. Det kan uppfylla flera syften inom samma befintliga databas.
Hur fungerar det i Data Warehouse?
- Dimension hänvisar till insamlingen eller gruppen av information som är relaterad till en mätbar händelse. De utgör en kärna för dimensionell modellering. När en dimension skapas genereras en struktur i ett projekt. Skapat kan användas i olika projekt och det återspeglar idén om återanvändbarhet. När en ändring görs i någon av den återspeglas dess effekt endast i den specifika tabellen. När en rapport ska skapas kan användaren ta informationen från som dimensionstabeller innehåller all nödvändig information.
- Vid utförande av dimensioneringsmodeller laddas atomdata in i dimensionella strukturer. Sedan genereras eller byggs dimensionella modeller runt affärsprocesserna. Vid skapandet måste det komma ihåg att filtrera domänvärden och lagra etiketter för rapporterna i dessa tabeller. Det måste säkerställas att surrogatnyckel (Systemgenererad nyckel som används under skapandet av dimensionstabell som hjälper till att identifiera varje post som finns i dimensionstabellen på ett unikt sätt) måste användas medan dimensionstabellen skapas. Det måste denormaliseras eftersom deras uppgift är att låta användaren läsa och analysera informationen lika effektivt än att hantera transaktioner. Dimensionens huvudmål är att tillhandahålla filtrering, utföra gruppering och effektiv märkning.
fördelar
Nedan visas de olika fördelarna med dimensionstabellen:
- Det har en enkel struktur.
- Det är lätt att analysera och förstå.
- Denormaliserade data.
- Hjälper till att upprätthålla historisk information för alla dimensioner.
- Lätt att hämta data från den.
- Snabbt att skapa och implementera.
- Det ger sammanhanget för alla affärsprocesser.
Slutsats - dimensionstabell
Detta är en integrerad del av datamodelleringen. Det används i stjärn- eller snöflingaschema. Den innehåller måtten, nycklarna och värdena för attributen i faktabellen. Det finns olika typer som används i olika scenarier.
Rekommenderade artiklar
Detta är en guide till dimensionstabellen. Här har vi diskuterat typer, hur fungerar dimensionstabell i datalageret med fördelar. Du kan också gå igenom våra andra relaterade artiklar för att lära dig mer-
- Fakta Tabell vs Dimension Tabell
- Vad är fakta tabell?
- Vad är Tableau?
- Datainsamling i Tableau