Ab initio intervjufrågor och svar
Så du har äntligen hittat ditt drömjobb i Ab initio men undrar hur du ska knäcka Ab initio-intervjun och vad som kan vara de troliga frågorna om Ab initio-intervjuer för 2018. Varje intervju är annorlunda och omfattningen av ett jobb är också annorlunda. Med detta i åtanke har vi utformat de vanligaste Ab initio intervjufrågorna och svaret för 2018 för att hjälpa dig att få framgång i din intervju.Nedan visas de översta frågorna om initiointervjuer som ofta ställs i en intervju. Dessa intervjufrågor är indelade i två delar är följande:
Del 1 - Ab initio intervjufrågor (grundläggande)
Den här första delen täcker grundläggande intervjufrågor och svar på Ab initio.
1. Vilka komponenter eller funktioner finns tillgängliga i ab initio?
Svar:
De viktigaste komponenterna i ab initio finns här nedan,
Komponent | Ändamål |
Dedup | Ta bort dubbletter |
Ansluta sig | För att gå med i flera inputdatasatser baserat på ett gemensamt nyckelvärde. |
Sortera | Denna komponent omordnar data. Det tar sorteringsordningen och släpper data till minnet |
Filtrera | Eventuellt villkorsrelaterat borttagande av data. |
Återskapa | Detta är komponenten är främst för parallelliteten eftersom en extra kopia av data är användbar medan andra noder inte är tillgängliga. |
sammanfoga | Denna komponent är att kombinera flera inmatningsdata. |
2. Vilka typer av parallellbehandling?
Svar:
Detta är de vanliga frågorna om Ab initio-intervjuer som ställs i en intervju. Olika typer av parallellbehandling är,
- Komponentparallellism
- Dataparallellism
- Pipeline parallellism
Komponentparallellism: En applikation som har flera komponenter som körs på systemet samtidigt. Men uppgifterna är separata. Detta uppnås genom komponentbearbetning på komponentnivå.
Dataparallalism: Data delas upp i segment och körs samtidigt. Denna typ av process uppnås med hjälp av dataparallalism
Pipeline parallelism: En applikation med flera komponenter men körs på samma dataset. Detta använder pipeline-parallellitet.
3. Vad är det olika sättet att uppnå partitionerna?
Svar:
Det finns flera sätt att göra partitionerna.
partitioner | Beskrivning |
Uttryck | Uppdelning av data enligt datamanipulationsspråket. |
Nyckel | Gruppera data med specifika nycklar |
Lastbalansering | Dynamisk lastbalansering |
Procentsats | Segregera data där utgångsstorleken är på bråkdelarna 100 |
Räckvidd | Dela uppgifterna jämnt baserat på en nyckel och ett intervall mellan noderna |
Rund robin | Distribuera informationen jämnt i blockstorlek över utgångspartitionerna. |
Låt oss gå till nästa Ab initio-intervju Frågor.
4. Vad är ett multifilsystem?
Svar:
Multifile är en uppsättning kataloger på olika noder i ett kluster. De har en identisk katalogstruktur. Multifilsystemet leder till bättre prestanda eftersom det är parallellbehandling där data finns på flera skivor.
Det skapas med kontrollpartitionen på en nod och datapartitioner på de andra noderna för att distribuera behandlingen för att förbättra prestandan.
5. Skillnad mellan Hadoop och Ab initio?
Svar:
Hadoop | Ab initio |
Öppen källa | Egentligt program |
Parallell bearbetning genom kartläggare och reducerare | Parallell bearbetningsarkitektur |
Alla typer av data passar bäst här | Bäst för traditionella EDW-implementationer |
Feltolerans uppnås | Feltolerans uppnås inte |
MapReduce styrs på alla komponenter eller funktioner | Komponenter som gå med, gruppera, sortera är lätt
genomförde |
Billig som öppen källkod och kan testa alla fall för affärsanvändning. | Dyrt och tillämpligt på ett affärsvärde med höga värden på grund av kostnaden |
Löst kopplade komponenter där anpassade funktioner är byggda | Tätt sammankopplade mellan komponenterna eftersom de rekommenderas starkt baserat på företagets användningsfall. |
Del 2 - Ab initio intervjufrågor (avancerat)
Låt oss nu titta på de avancerade intervjufrågorna om Ab initio.
6. Vilken typ av layouter stöder Ab initio?
Svar:
- Stöder seriella och parallella layouter.
- En graflayout stöder både seriella och parallella layouter åt gången.
- Ett flerfilsystem är ett 4-vägs parallellt system
- En komponent i ett grafsystem kan köra 4-vägs parallellt system.
7. Vad är förhållandet mellan Enterprise metadatamiljö (EME), Grafisk utvecklingsmiljö (GDE) och samarbetssystem?
Svar:
CoOperating System: Det fungerar ovanpå operativsystemet och detta tillhandahålls av ab initio och det är basen för alla Ab Initio-processer. Luftkommandon är en av funktionerna som kan installeras på olika operativsystem som UNIX, Linux, IBM osv
Dessa är följande funktioner som den tillhandahåller,
- Hanterar och kör Ab Initio-grafer och styr ETL-processerna
- Tillhandahålla tillägg
- ETL-processer övervakning och felsökning
- Metadatahantering och interaktion med EME
GDE: Det är en designkomponent och används för att köra ab initio-graferna.
Grafer bildas av komponenterna (fördefinierade eller användardefinierade) och flöden och parametrarna. Det tillhandahåller ETL-processen i Ab Initio som representeras av diagram.
Möjlighet att köra, felsöka processloggarna jobb och spåra exekveringsloggar
Enterprise Meta-Environment (EME): Det är en miljö för lagring och även metadatahantering (Både affärsmässiga och tekniska metadata). Metadata nås från den grafiska utvecklingsmiljön och även webbläsaren eller den samarbetsvilliga kommandoraden. Det är ab initio förvar för alla platshållare.
Låt oss gå till nästa frågor om Ab initio-intervjuer.
8. Hur bearbetas data och vad är grunden för denna strategi?
Svar:
Det finns vissa aktiviteter som kräver insamling av uppgifterna och det bästa är att bearbeta till stor del beror på samma i många fall. Innan data behandlas måste den ligga på någon platshållare som en väl definierad lagring. Denna uppgift beror på några viktiga faktorer
1. Insamling av data
2. Presentation
3. Slutresultat
4.Analysis
5.Sorting
9. Vad är skillnaden mellan partitionering med key och round robin?
Svar :
Detta är de avancerade frågorna om Ab initio-intervjuer som ställs i en intervju. Partition med nyckel
I detta måste vi ange nyckeln baserad på vilken partitionen kommer att ske. Det resulterar i välbalanserade data på grund av de nyckelbaserade partitionerna. Det är användbart för nyckelberoende
parallellitet.
Partition av round robin: På detta sätt fördelar data jämnt i blockstorleken bitar postarna är uppdelade på ett sekventiellt sätt över outputpartitionen. Det är inte nyckeln
baserat och resultaten är välbalanserade data, särskilt med en blockstorlek på 1. Den är användbar för
registrera oberoende parallellism.
10. Hur förbättrar du grafens prestanda?
Svar :
Det finns många sätt som grafens prestanda kan förbättras.
1) Minska användningen av flera komponenter i vissa faser.
2) Använd ett förfinat och väl definierat värde på maxvärden för sortering och sammanfogning av komponenter
3) Minimera användningen av reguljära uttrycksfunktioner som re_index i överföringsfunktionerna
4) Minimera sorterad sammanfogningskomponent och ersätt dem om möjligt med anslutning / hash-anslutning i minnet
5) Använd endast obligatoriska fält i sortering, omformatera, gå med i komponenter
6) Använda fas eller flödesbuffring vid fall av sammanslagning eller sorterade sammanfogningar
7) Använd hash-anslutning om de två uppsättningarna av ingångar är små annars är det bättre att välja den sorterade sammanfogningen för den enorma ingångsstorleken
8) För större datasatser bör du inte använda sändningen som partitionerad
9) Minska antalet sorteringskomponenter under bearbetning.
10) Undvik omuppdelning av data i onödan
Rekommenderad artikel
Detta har varit en guide till Lista över Ab initio intervjufrågor och svar så att kandidaten lätt kan slå ned dessa Ab initio intervjufrågor. Här i det här inlägget har vi studerat de bästa frågorna om Ab initio-intervjuer som ofta ställs i intervjuer. Du kan också titta på följande artiklar för att lära dig mer -
- Androidintervjufrågor - Topp 10 användbara frågor
- Statistikintervjufrågor | Användbart och mest frågat
- Minitab-intervjufrågor - Topp 7 användbara frågor att lära sig
- Splunk intervjufrågor och svar du borde veta