Introduktion till ETL-intervjufrågor och svar

ETL står för Extract-Transform-Load. Det är en systemfundament för datalager, där data utvinns från de olika källorna och sedan transformeras data där data upprätthålls eller behandlas för att göra kvaliteten, konsistensen av data i ett lämpligt presentationsformat och sedan slutligen data laddas i Data Warehouse i presentationsformat så att det kan hjälpa slutanvändaren att få informationen enkelt och fatta beslut.

Nedan visas de bästa ETL-intervjufrågorna från 2019 som ofta ställs i en intervju

Om du letar efter ett jobb som är relaterat till ETL måste du förbereda dig för intervjufrågorna om ETL 2019. Även om varje intervju är annorlunda och omfattningen av ett jobb också är annorlunda, kan vi hjälpa dig med de bästa ETL-intervjufrågorna och svaren, vilket hjälper dig att ta språnget och få din framgång i din intervju.

Del 1 - ETL-intervjufrågor (grundläggande)

Den här första delen täcker grundläggande ETL-intervjufrågor och svar

1. Utöka ETL-systemet i datalageret? Förklara

Svar:
Extract-Transform-Load (ETL) -systemet är grunden för datalageret. Ett korrekt utformat ETL-system extraherar data från källsystemen, upprätthåller datakvalitet och konsistensstandarder, bekräftar data så att separata källor kan användas tillsammans och levererar slutligen data i ett presentationsklart format så att applikationsutvecklare kan bygga applikationer och slutanvändare kan fatta beslut.

2. Betydelsen av ETL-systemet i datalageret?

Svar :
Tar bort misstag och korrigerar saknade data. Det ger dokumenterade mått på förtroende för data. Fångar flödet av transnationella data för förvaring. Justerar data från flera källor som ska användas tillsammans. Strukturerar data för att kunna användas av slutanvändarverktyg.

3. Vad är den dagliga processen i ETL-systemet?

Svar :
Bygg utvecklings- / test / produktionssviten för ETL-processer. Förstå avvägningarna för olika datorstrukturer i rummet, inklusive platta filer, normaliserade scheman, XML-scheman och star join (dimensionella) scheman. Analysera och extrahera källdata. Bygg ett omfattande datasystem för datorrengöring. Strukturera data i dimensionella scheman för den mest effektiva leveransen till slutanvändare, affärsintelligensverktyg, data-gruvverktyg, OLAP-kuber och analytiska applikationer. Leverera data effektivt både till mycket centraliserade och djupt distribuerade datalager med samma tekniker. Ställ in den övergripande ETL-processen för optimal prestanda.

Låt oss gå till nästa ETL-intervjufrågor.

4. Dataformat i ETL-systemet?

Svar :
Det finns olika dataformat i ETL, några av dem är platta filer, XML-datauppsättningar, oberoende DBMS-arbetsbord, normaliserade entitets / relationsscheman (E / R) och dimensionella datamodeller.

5. Dataprofilering i ETL-system?

Svar :
Dataprofilering är en systematisk undersökning av kvaliteten, omfattningen och sammanhanget för en datakälla för att göra det möjligt att bygga ett ETL-system. På ett extremt sätt kräver en mycket ren datakälla som har hållits väl innan den anländer till datalageret minimal transformation och mänsklig intervention för att ladda direkt i slutdimensionstabeller och faktabeller.

6. Vad är en ETL-validerare?

Svar :
ETL Validator är ett datatestningsverktyg som i hög grad förenklar testningen av dataintegration, datavarehus och datamigreringsprojekt. Den använder vår patenterade ELV-arkitektur för att extrahera, ladda och validera data från datakällor som databaser, platta filer, XML, Hadoop och BI-system.

Del 2 - ETL-intervjufrågor (avancerat)

Låt oss nu titta på de avancerade frågorna om ETL-intervjuer.

7. Vad är operationerna i ETL-systemet?

Svar :
Följande tre operationer: Extraherar data från ditt transnationella system som kan vara en Oracle, Microsoft eller någon annan relationsdatabas. Transformerar data genom att utföra datorensningsoperationer. En belastning är en process för att skriva data till måldatabasen.

8. Namnge några av de ETL-verktyg som mest används på marknaden?

Svar:
Det finns olika ETL-verktyg som används på marknaden men några av de fuktigt föredragna ETL-verktygen
• Oracle Warehouse Builder (OWB)
• SAP-datatjänster.
• IBM Infosphere Informationsserver.
• SAS Data Management.
• Power Center Informatica.
• Elixir Repertoire för Data ETL.
• Data Migrator (IBI)
• SQL Server Integration Services (SSIS)

9. Vilka roller och ansvar har ETL-teamet?

Svar:
ETL-teamets roller på högsta nivå är att bygga datalagerets bakrum.
• Leverera data mest effektivt till slutanvändarverktyg
• Lägg till värde till data i rengörings- och efterlevnadsstegen
• Skydda och dokumentera avstamning av data
• Extrahera data från de ursprungliga källorna
• Kvalitetssäkring och rengöring av data
• Upprätta etiketter och mått i uppgifterna
• konsistens mellan de ursprungliga källorna
• Leverera data i ett fysiskt format som kan användas av frågaverktyg,
• Rapportera författare och instrumentpaneler.

Låt oss gå till nästa ETL-intervjufrågor.

10. Vilken roll har konsekvensanalysen i ETL-systemet?

Svar:
Effektanalys undersöker metadata som är associerade med ett objekt (i detta fall en tabell eller kolumn) och bestämmer vad som påverkas av en förändring i dess struktur eller innehåll. Ändring av datainsamlingsobjekt kan bryta processer som är avgörande för korrekt laddning av datalageret. Att tillåta ad-hoc-ändringar i datainsamlingsobjekt är skadligt för framgången för ditt projekt. När en tabell har skapats i iscenesättningsområdet måste du utföra en konsekvensanalys innan några ändringar görs i den. Många ETL-verktygsleverantörer tillhandahåller effektanalysfunktionalitet, men denna funktionalitet förbises ofta under ETL-produktens proof-of-concept eftersom det är en funktion i rummet och
Inte riktigt viktigt förrän datalageret är igång och börjar utvecklas.

11. Hur behandlar du plattfil med fast längd?

Svar:
En fillayout med fast längd bör innehålla filnamnet, där fältet börjar; dess längd; och dess datatyp (vanligtvis text eller nummer). Ibland levereras slutpositionen. Om det inte är det måste du beräkna slutpositionen för varje fält baserat på dess startposition och längd om det krävs av ditt ETL-verktyg. I de flesta ETL-verktyg måste du sannolikt mata in fillayouten för den platta filen en gång. När layouten har matats in kommer verktyget ihåg layouten och förväntar sig samma layout varje gång det interagerar med den faktiska platta filen. Om fillayouten ändras eller data flyttas från dess tilldelade positioner måste ETL-processen programmeras för att misslyckas. När du bearbetar platta filer med fast längd kan du försöka bekräfta att positionerna för data i filen är korrekta. En snabb kontroll för att validera positionerna är att testa valfritt datum (eller tid) för att se till att det är ett giltigt datum. Om positionerna flyttas innehåller datumfältet troligen alfabetecken eller ologiska siffror. Andra fält med mycket specifika domäner kan testas på samma sätt. XML erbjuder mer konkret valideringsförmåga. Om datavalidering eller konsistens är ett problem, försök att övertyga dataleverantören att leverera data i XML-format.

12.Varför realtid ETL i datalager?

Svar:
Datavarehus behövs för att tillhandahålla en oöverträffad uppsättning data till företagets beslutsfattare, vilket ger ett tillförlitligt informationsgolv att stå på. För aktuell rapportering mot en blinkande databas riktades företagets användare till produktionsapplikationerna som driver verksamheten. Därför var användarna tvungna att gå till datalageret för att få en historisk bild av vad som hände i branschen i går och var tvungna att titta över många OLTP-system för att få en bild av vad som hände idag. Företagsanvändare accepterade aldrig helt denna uppdelning. Datalager behöver naturligtvis absolut ständiga kundinformationsströmmar från en operation, men allt mer operativa system förlitar sig på datalagerberikning av kundinformation också. Därför är det förutsägbart att organisationer har börjat utforska arkitektoniska alternativ som kan stödja mer generaliserade integrationsscenarier som flyttar operativa data mellan applikationer och samtidigt in och ut ur lagret med allt större akuthet.

Rekommenderade artiklar

Detta har varit en guide till Lista över ETL-intervjufrågor och svar så att kandidaten lätt kan slå ned dessa ETL-intervjufrågor. Du kan också titta på följande artiklar för att lära dig mer -

  1. Azure Paas vs Iaas - Funktioner
  2. 9 Fantastiska MapReduce intervjufrågor och svar
  3. Topp 11 mest användbara RDBMS-intervjufrågor och svar
  4. 10 mest fantastiska PHP-intervjufrågor för erfarna
  5. Känner till de 5 användbara DBA-intervjufrågorna och svaret

Kategori: