Introduktion till Star Schema

Stjärnschema är det enklaste tillvägagångssättet och dimensionella modellen där funktionstabeller, dimensioner och fakta är ordnade på ett organiserat sätt och det används mest i Business Intelligence och Data Warehousing. Ett stjärnskema bildas genom att ordna varje faktum med dess relaterade dimensioner som liknar en stjärna. Ett faktum är ett resultat som är oändligt, till exempel försäljningsinformation och inloggning. En dimension är insamlingen av referensdata inklusive fakta, som datum, information om produkten och kunder. Stjärnschema är optimerat för enorma datafrågor i datalagring, online analytisk bearbetning av databubar och även ad-hocfrågor.

Hur skapar jag ett stjärnschema?

Här kommer användaren att skapa Star Schema genom konvertering av enhet-relation-modellen. Modeller med enhetsförhållanden är för komplexa för att förklara de funktionella mängderna och attributen så att det förenklas till dimensionellt stjärnschema enligt följande:

  • Hitta företagsproceduren från enhet-relation-vy och förstå modellen som kan delas upp i flera dimensionella modeller. En enhetsrelation består av affärsdata.
  • Hitta många till många tabeller i entitetsförhållanden som förklarar företagsförfarandet och konverterar dem till dimensionella modellverklighetstabeller. Denna tabell innehåller data som består av faktatabellen och en dimensionstabell med numeriska värden och unika nyckelattribut.
  • Tanken bakom denna process är att differentiera de utbytebaserade informationstabellerna eller de information som raderas. Så det är nödvändigt att utforma många till många relationer. Till exempel finns det i ERP-databasen fakturadetaljer som är utbytstabellen. Detaljer som uppdateras och uppdateras är utbytebaserade tabeller. Nu jämför vi båda tabellerna, härleds det att uppgifterna är verkligen statiska.
  • Verklighetstabellen är en representation av en dimensionell modell som visar många till många nätverk mellan ändliga mätningar. Detta resulterar i att utländska nycklar i verklighetstabeller delar många till många, vilket är en räknbar relation. de flesta av tabellerna faller under utbytebaserade tabeller
  • Det sista steget i utformningen av stjärnschema är att de-normalisera bosättningstabellerna till mätbord. Den obligatoriska nyckeln är att skapa en duplikatnyckel. Denna nyckel bygger på verklighetstabellen som hjälper till att förstå. Hitta datum och tid från entitet-relation design och arkivera dimensionstabellen. Datum sparas som datum- och tidsstämplar. En kolumn med datumdimension representerar år, månad eller datum eller tid

Exempel: Tidsdimensionell tabell har TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek vilket kan vara viktiga kriterier för dimensionella tabeller. På samma sätt har alla tabeller unik id och attribut. Frågespråk som SQL kan tillämpas på data mining, datalager och dataanalys.

Syntax of Cube Definition:

Define cube (cube-name)(dimension-list): (measure-list)

Kuber används för att adressera varningarna på olika nivåer och responstid för att svara på frågan är minimal. Det finns som en förbyggd design och kan tillämpas i nödvändiga situationer. Att skapa Star-schema är mycket enkelt och effektivt att tillämpa och är också anpassningsbart. Slutförande av faktabellen och dimensionstabellen är obligatorisk, vilket i sin tur bildas som stjärna och kan formas med SQL-frågor eller körkod. Denna design är gjord för bättre förståelse och enkel hämtning av data.

Egenskaper av Star Schema

1. Stjärnschema ger snabba aggregeringar och beräkningar som sålda totala föremål och intäkter från intäkter som erhållits i slutet av varje månad. Dessa detaljer och processer kan filtreras enligt kraven genom att utforma lämpliga frågor.

2. Den har kapacitet att filtrera data från normaliserade data och tillhandahålla datalagringsbehov. Den tillhörande informationen till den normaliserade tabellen staplas i fliken för flera dimensioner. En unik nyckel genereras för varje faktabord för att identifiera varje rad.

3. Faktabell är mätningen av specifika händelser inklusive ändliga antalvärden och består av främmande nycklar relaterade till dimensionella tabeller. Denna tabell är inramad med faktavärden på atomnivå och tillåter att lagra flera poster åt gången. Det finns tre olika typer av faktabord.

4. Faktatabeller för transaktioner består av data om specifika händelser som semesterhändelser, försäljningsevenemang.

5. Registrera fakta för givna perioder som kontoinformation i slutet av varje kvartal.

6. Tabeller med snabb aggregering under en viss period kallas ackumulering av snapshot-tabeller.

7. Dimensionella tabeller ger detaljerade attributdata, poster som finns i faktatabellen. Dimensionstabellen kan ha olika funktioner. Måttabeller används huvudsakligen som Tid och datum Dimensionstabell, Produkt- och inköpsordern Måttabell, Anställd- och kontodetaljer Måttabell, Geografi och platsdimensionell tabell. Dessa tabeller tilldelas en enda heltaldatatyp som är den duplicerade primärnyckeln.

8. Användaren kan designa sitt bord enligt krav. Om han till exempel behöver en säljdimensionell tabell med produkt- och kundnyckel, datum- och tidsnyckel, kommer intäkterna från inkomstgenererade nyckel. Om affärsmannen ramar in en produktdimensionell tabell med nyckelattribut som färg, datum för den köpta artikeln, kampanjnyckeln och klientnyckeln.

fördelar

  • Det är utformat med enkel logik och frågor som är enkla att extrahera data från transaktionsprocessen.
  • Den har en gemensam rapporteringslogik som impliseras dynamiskt.
  • Stjärnschema kan erbjuda en ökad prestanda för rapportering av applikationer.
  • Stjärnschema designat av matning av kuber som används av Online Transaction Process för att bygga och få kuberna att fungera effektivt.

nackdelar

  • Den har hög integritet och ett högt de-normaliserat tillstånd. Om användaren inte uppdaterar värdena kommer hela processen att kollapsas. Skyddet och säkerheten är inte tillförlitliga upp till gränsen. Den är inte lika flexibel som en analytisk modell och utvidgar inte sitt effektiva stöd till många relationer.
  • Stjärnschema distribueras i databasen för att kontrollera snabbare återställning av data. Frågan används för att välja behov snarare än att söka i hela databasen. De filtrerade och valda data kan tillämpas i olika fall. Därför är detta stjärnschema en enkel modell som lätt kan antas.

Rekommenderad artikel

Detta är en guide till Vad är Star Schema? Här diskuterar vi introduktionen till stjärnschema och dess egenskaper tillsammans med fördelar och nackdelar. Du kan också gå igenom våra andra föreslagna artiklar för att lära dig mer -

  1. Översikt av fakta tabell
  2. Star Schema vs Snowflake Schema | Topp skillnader
  3. Datalagermodellering med typer
  4. AWS-databaser med fördelar
  5. AWS Data Pipeline

Kategori: