Ab initio intervjufrågor och svar

Så du har äntligen hittat ditt drömjobb i Ab initio men undrar hur du ska knäcka Ab initio-intervjun och vad som kan vara de troliga frågorna om Ab initio-intervjuer för 2018. Varje intervju är annorlunda och omfattningen av ett jobb är också annorlunda. Med detta i åtanke har vi utformat de vanligaste Ab initio intervjufrågorna och svaret för 2018 för att hjälpa dig att få framgång i din intervju.

Nedan visas de översta frågorna om initiointervjuer som ofta ställs i en intervju. Dessa intervjufrågor är indelade i två delar är följande:

Del 1 - Ab initio intervjufrågor (grundläggande)

Den här första delen täcker grundläggande intervjufrågor och svar på Ab initio.

1. Vilka komponenter eller funktioner finns tillgängliga i ab initio?

Svar:
De viktigaste komponenterna i ab initio finns här nedan,

KomponentÄndamål
DedupTa bort dubbletter
Ansluta sigFör att gå med i flera inputdatasatser baserat på ett gemensamt nyckelvärde.
SorteraDenna komponent omordnar data. Det tar sorteringsordningen och släpper data till minnet
FiltreraEventuellt villkorsrelaterat borttagande av data.
ÅterskapaDetta är komponenten är främst för parallelliteten eftersom en extra kopia av data är användbar medan andra noder inte är tillgängliga.
sammanfogaDenna komponent är att kombinera flera inmatningsdata.

2. Vilka typer av parallellbehandling?

Svar:
Detta är de vanliga frågorna om Ab initio-intervjuer som ställs i en intervju. Olika typer av parallellbehandling är,

  1. Komponentparallellism
  2. Dataparallellism
  3. Pipeline parallellism

Komponentparallellism: En applikation som har flera komponenter som körs på systemet samtidigt. Men uppgifterna är separata. Detta uppnås genom komponentbearbetning på komponentnivå.

Dataparallalism: Data delas upp i segment och körs samtidigt. Denna typ av process uppnås med hjälp av dataparallalism

Pipeline parallelism: En applikation med flera komponenter men körs på samma dataset. Detta använder pipeline-parallellitet.

3. Vad är det olika sättet att uppnå partitionerna?

Svar:
Det finns flera sätt att göra partitionerna.

partitionerBeskrivning
UttryckUppdelning av data enligt datamanipulationsspråket.
NyckelGruppera data med specifika nycklar
LastbalanseringDynamisk lastbalansering
ProcentsatsSegregera data där utgångsstorleken är på bråkdelarna 100
RäckviddDela uppgifterna jämnt baserat på en nyckel och ett intervall mellan noderna
Rund robinDistribuera informationen jämnt i blockstorlek över utgångspartitionerna.

Låt oss gå till nästa Ab initio-intervju Frågor.

4. Vad är ett multifilsystem?

Svar:
Multifile är en uppsättning kataloger på olika noder i ett kluster. De har en identisk katalogstruktur. Multifilsystemet leder till bättre prestanda eftersom det är parallellbehandling där data finns på flera skivor.

Det skapas med kontrollpartitionen på en nod och datapartitioner på de andra noderna för att distribuera behandlingen för att förbättra prestandan.

5. Skillnad mellan Hadoop och Ab initio?

Svar:

HadoopAb initio
Öppen källaEgentligt program
Parallell bearbetning genom kartläggare och reducerareParallell bearbetningsarkitektur
Alla typer av data passar bäst härBäst för traditionella EDW-implementationer
Feltolerans uppnåsFeltolerans uppnås inte
MapReduce styrs på alla komponenter eller funktionerKomponenter som gå med, gruppera, sortera är lätt

genomförde

Billig som öppen källkod och kan testa alla fall för affärsanvändning.Dyrt och tillämpligt på ett affärsvärde med höga värden på grund av kostnaden
Löst kopplade komponenter där anpassade funktioner är byggdaTätt sammankopplade mellan komponenterna eftersom de rekommenderas starkt baserat på företagets användningsfall.

Del 2 - Ab initio intervjufrågor (avancerat)

Låt oss nu titta på de avancerade intervjufrågorna om Ab initio.

6. Vilken typ av layouter stöder Ab initio?

Svar:

  • Stöder seriella och parallella layouter.
  • En graflayout stöder både seriella och parallella layouter åt gången.
  • Ett flerfilsystem är ett 4-vägs parallellt system
  • En komponent i ett grafsystem kan köra 4-vägs parallellt system.

7. Vad är förhållandet mellan Enterprise metadatamiljö (EME), Grafisk utvecklingsmiljö (GDE) och samarbetssystem?

Svar:
CoOperating System: Det fungerar ovanpå operativsystemet och detta tillhandahålls av ab initio och det är basen för alla Ab Initio-processer. Luftkommandon är en av funktionerna som kan installeras på olika operativsystem som UNIX, Linux, IBM osv

Dessa är följande funktioner som den tillhandahåller,
- Hanterar och kör Ab Initio-grafer och styr ETL-processerna
- Tillhandahålla tillägg
- ETL-processer övervakning och felsökning
- Metadatahantering och interaktion med EME

GDE: Det är en designkomponent och används för att köra ab initio-graferna.

Grafer bildas av komponenterna (fördefinierade eller användardefinierade) och flöden och parametrarna. Det tillhandahåller ETL-processen i Ab Initio som representeras av diagram.

Möjlighet att köra, felsöka processloggarna jobb och spåra exekveringsloggar

Enterprise Meta-Environment (EME): Det är en miljö för lagring och även metadatahantering (Både affärsmässiga och tekniska metadata). Metadata nås från den grafiska utvecklingsmiljön och även webbläsaren eller den samarbetsvilliga kommandoraden. Det är ab initio förvar för alla platshållare.

Låt oss gå till nästa frågor om Ab initio-intervjuer.

8. Hur bearbetas data och vad är grunden för denna strategi?

Svar:
Det finns vissa aktiviteter som kräver insamling av uppgifterna och det bästa är att bearbeta till stor del beror på samma i många fall. Innan data behandlas måste den ligga på någon platshållare som en väl definierad lagring. Denna uppgift beror på några viktiga faktorer

1. Insamling av data
2. Presentation
3. Slutresultat
4.Analysis
5.Sorting

9. Vad är skillnaden mellan partitionering med key och round robin?

Svar :
Detta är de avancerade frågorna om Ab initio-intervjuer som ställs i en intervju. Partition med nyckel
I detta måste vi ange nyckeln baserad på vilken partitionen kommer att ske. Det resulterar i välbalanserade data på grund av de nyckelbaserade partitionerna. Det är användbart för nyckelberoende
parallellitet.
Partition av round robin: På detta sätt fördelar data jämnt i blockstorleken bitar postarna är uppdelade på ett sekventiellt sätt över outputpartitionen. Det är inte nyckeln
baserat och resultaten är välbalanserade data, särskilt med en blockstorlek på 1. Den är användbar för
registrera oberoende parallellism.

10. Hur förbättrar du grafens prestanda?

Svar :
Det finns många sätt som grafens prestanda kan förbättras.
1) Minska användningen av flera komponenter i vissa faser.
2) Använd ett förfinat och väl definierat värde på maxvärden för sortering och sammanfogning av komponenter
3) Minimera användningen av reguljära uttrycksfunktioner som re_index i överföringsfunktionerna
4) Minimera sorterad sammanfogningskomponent och ersätt dem om möjligt med anslutning / hash-anslutning i minnet
5) Använd endast obligatoriska fält i sortering, omformatera, gå med i komponenter
6) Använda fas eller flödesbuffring vid fall av sammanslagning eller sorterade sammanfogningar
7) Använd hash-anslutning om de två uppsättningarna av ingångar är små annars är det bättre att välja den sorterade sammanfogningen för den enorma ingångsstorleken
8) För större datasatser bör du inte använda sändningen som partitionerad
9) Minska antalet sorteringskomponenter under bearbetning.
10) Undvik omuppdelning av data i onödan

Rekommenderad artikel

Detta har varit en guide till Lista över Ab initio intervjufrågor och svar så att kandidaten lätt kan slå ned dessa Ab initio intervjufrågor. Här i det här inlägget har vi studerat de bästa frågorna om Ab initio-intervjuer som ofta ställs i intervjuer. Du kan också titta på följande artiklar för att lära dig mer -

  1. Androidintervjufrågor - Topp 10 användbara frågor
  2. Statistikintervjufrågor | Användbart och mest frågat
  3. Minitab-intervjufrågor - Topp 7 användbara frågor att lära sig
  4. Splunk intervjufrågor och svar du borde veta