Introduktion till datavarehousing intervjufrågor och svar
Vad är ett datavarehus?
Datalager är ett centralt arkiv som lagrar heterogen data från olika källor. Uppgifterna i ett lager kan användas för analytisk rapportering, strukturerade eller ad hocfrågor och användas vid beslutsfattande. Processen att samla in data från flera källor och lagra dem i det centrala förvaret kallas Data Warehousing.
Uppgifterna kan vara av flera typer som strukturerade, halvstrukturerade eller ostrukturerade data. Uppgifterna från olika källor behandlas, transformeras och intas till en enda databas som kallas ett datalager. Användare kan komma åt den bearbetade informationen i datalageret genom olika verktyg som Business Intelligence-verktyg, SQL-klienter, kalkylblad och många andra verktyg. Den här informationen hjälper dig att utföra data mining-operationer som hjälper till att hitta ett mönster i data.
Om du nu letar efter ett jobb som är relaterat till Data Warehousing måste du förbereda dig för intervjufrågorna om Data Warehousing 2019. Det är sant att varje intervju är olika enligt de olika jobbprofilerna. Här har vi förberett de viktiga frågorna och svaren för datavarehousingintervjuer som hjälper dig att få framgång i din intervju.
Låt oss nu förstå några av de viktiga intervjufrågorna från Datawarehousing från 2019 som kan ställas i en intervju. Men detta betyder inte att det här är de enda frågorna som kommer att ställas i en intervju, du måste vara beredd grundligt på varje ämne som vi diskuterar här. Dessa frågor är indelade i två delar är följande:
Del 1 - Data Warehousing intervju Frågor (grundläggande)
Den här första delen täcker grundläggande intervallfrågor och svar på datavarehousing
Q1. Vad är datalagring?
Svar:
Data Warehousing är en process för att samla in data från olika källor som bearbetar den och lagra en enorm databas, alltså kan den bearbetade informationen användas för olika ändamål som analytisk rapportering, business intelligence eller data mining etc. Den grundläggande idén bakom datalageret är ingenting men lagrar enorma mängder data.
Q2. Skillnaden mellan databas och datavarehus?
Svar:
Nedan hittar du de olika tabellerna som stöds av Data Warehousing:
Databas | Datalager |
Insamling av data som används för lagring, åtkomst och hämtning | Insamling av data som används för att utföra analys |
Begränsad till den enda applikationen | Kan användas av flera applikationer |
Lagrar normaliserade data | Data behöver inte normaliseras, vanligtvis lagras som denormaliserade data |
ER-baserad och applikationsorienterad | snöflinga eller starta schemabaserade och ämnesorienterade |
Används för transaktionshantering | Används för datamodellering och analys |
Låt oss gå vidare till nästa datavarehousing-intervjufrågor
Q3. Vilka är stadierna i datalagring?
Svar:
Allmänna stadier för datalageret är:
- Offline operativ databas: Data kopieras från operativsystemet till en annan server för att utföra olika operationer.
- Offline Data Warehouse: Data i Data Warehouse uppdateras regelbundet från den operativa databasen.
- Data Time Warehouse i realtid: Data Warehouse uppdateras när någon transaktion sker i det operativa systemet.
- Integrated Data Warehouse: Data Warehouse uppdateras kontinuerligt när någon transaktion utförs i operativsystemet.
Q4. Vad är Business Intelligence (BI)?
Svar:
Detta är de grundläggande intervjufrågorna om datalagring som ställs i en intervju. BI är en teknikdriven process för att analysera data och presentera meningsfull insikt för slutanvändarna som hjälper till att bättre fatta beslut. BI omfattar olika verktyg som hjälper till att förstå datatrender och -mönster dolda i datan. Några av de verktyg som används mycket är SAP Business Intelligence, MicroStrategy, Science, Tableau och många fler.
Q5. Vilka är komponenterna i Data Warehouse?
Svar:
Fyra komponenter i Data Warehouse är:
- Load Manager: Den utför alla operationer som är förknippade med utvinning och belastning av data till lagret.
- Warehouse Manager: Den utför operationer förknippade med data i lagret. Den utför operationer som analys av data för att säkerställa konsistens, skapande av index och vyer och många andra operationer.
- Query Manager: Den utför alla åtgärder relaterade till användarfrågor. Funktionerna för denna komponent är direkta frågor till lämpliga tabeller.
- Slutanvändaråtkomstverktyg: Verktyg som används av slutanvändare för att komma åt data. Det kategoriseras i olika grupper som
- Verktyg för rapportering av data
- Frågaverktyg
- Programutvecklingsverktyg
- EIS-verktyg
- OLAP och Data mining-verktyg
Del 2 - Data warehousing intervju Frågor (avancerat)
Låt oss nu titta på de avancerade frågorna om datavarehousingintervjuer.
Q6. Vad är Dimensionstabellen?
Svar:
Dimensionstabell i ett datalager är en tabell i ett stjärnschema. Dimensionstabeller används för att lagra dimension eller attribut som beskriver data i fakta-tabellen. Produktdimension kan till exempel innehålla namn, beskrivning, enhetspris, vikt, färg och många andra attribut. Systemet som genereras nyckeln används unikt för att identifiera raden i dimensionstabellen. Denna nyckel fungerar som en primär nyckel i dimensionstabellen och används som utländsk nyckeltabell i faktumtabellen som hjälper till att gå samman mellan de två tabellerna.
Q7. Vad är fakta tabell?
Svar:
Ett faktabord är stjärnbordets mittbord, omgiven av en dimensionstabell i ett datalager. Fakta tabell består av kvantitativa statistik eller fakta i affärsprocessen. Fakta tabell fungerar med en dimensionstabell och den lagrar data som ska analyseras. Faktatabellen innehåller en utländsk nyckelkolumn som fungerar som en primär nyckel i dimensionstabellen denna tangent tillåter sammankoppling mellan dessa två tabeller.
Låt oss gå vidare till nästa datavarehousing-intervjufrågor
Q8. Vad är Data Mart?
Svar:
Data Mart är en delmängd i datalageret som vanligtvis innehåller en specifik uppsättning data relaterade till en specifik affärsgren. Data Mart är liten och används för att fråga eller analysera en specifik uppsättning data, till exempel data relaterade till "Försäljning", "Kunder", "Beställ" etc.
Q9. Vad är Operations Data Store (ODS)?
Svar:
Detta är de mest ställda Data Warehousing intervjufrågorna i en intervju. En ODS är den typ av databas som lagrar data som används av operativa system innan de lagras i ett datalager. Det fungerar som mellanliggande databas. Ett ODS innehåller korttidsdata medan ett datalager innehåller historiska data.
Q10. Förklara datalagerarkitektur.
Svar:
Det inkluderar följande steg:
- Datakällskikt: I detta skede samlas data från olika källor och lagras i en relationsdatabas. Data inkluderar sociala mediedata, operativa data, transaktionsdata och många fler.
- Datasceneringslager: I detta steg extraheras och bearbetas data från datakällskiktet eftersom data kommer från olika källor och med olika format. De extraherade uppgifterna kommer att underkastas kvalitetskontroller och slutresultaten kommer att vara rena och organiserade data som kommer att laddas in i datalageret.
- Datalagringslager: Det här lagret är där data från sceneringsområdet lagras som ett enda centralt arkiv. Beroende på verksamhetens krav kan lagring vara ett datalager, datamart eller ett operativt datalager.
- Datapresentationslager: Detta lager används av användare för att komma åt data. Användare kan utföra olika frågor eller köra en analys för att utföra rapporter.
Rekommenderad artikel
Detta har varit en guide till listan över intervjufrågor och svar på datavarehousing, så att kandidaten lätt kan slå samman dessa intervallfrågor om datavarehousing. Här i det här inlägget har vi studerat de viktigaste intervjufrågorna om datalagring som ofta ställs i intervjuer. Du kan också titta på följande artiklar för att lära dig mer -
- RMAN intervjufrågor och svar
- Top 10 intervjufrågor för dataanalytiker
- De flesta ställer frågor om viloläge intervju
- PowerShell-intervjufrågor
- Komplett guide till Oracle Data Warehousing