Introduktion till Hiveintervjufrågor och svar

I den nya datatiden är Hive en öppen källkodsverktygspaket ETL och datalagringsinfrastruktur för datalagring för att lagra strukturerad och ostrukturerad data byggd på distribuerat filsystem (HDFS)
för att analysera, fråga och bryta enorma volymdatasatser genom att aktivera SQL-liknande språk som kallas HiveQL (HQL) och enkel utförande av frågan genom att planera Hadoop MapReduce.

Hive är byggd ovanpå Hadoop för att bearbeta och analysera Big Data och gör frågan enkel.
Hive skapades ursprungligen av Facebook, senare förbättrades den och utvecklades som en öppen källa av Apache Software Foundation och gav den namnet Apache Hive. Det finns många företag nu som använder Apache Hive för sina Big Data-lösningar.

Om du letar efter ett jobb som är relaterat till Hive, måste du förbereda dig för 2018 Hive Interview Questions. Även om varje intervju är annorlunda och omfattningen av ett jobb också är annorlunda, kan vi hjälpa dig med topp 2018 Hiveintervjufrågor och svar, vilket hjälper dig att ta steget och få framgång i din intervju.

Nedan visas den översta listan över Hiveintervjufrågor som mest ställs i en intervju. Dessa frågor är uppdelade i två delar är följande:

Del 1 - Hiveintervjufrågor (grundläggande)

Den första delen täcker grundläggande Hiveintervjufrågor och svar.

1. Lista upp de olika komponenterna i Hive-arkitekturen?

Svar:
Det finns fem kärnkomponenter i Hive-arkitekturen listas nedan:
• Användargränssnitt (UI): Det fungerar som en kommunikator mellan användare och drivrutiner när användaren skriver de frågor UI accepterar det och kör det på drivrutinen, det finns två typer av gränssnitt tillgängliga, de är kommandorad och GUI-gränssnitt.
• Driver: Det upprätthåller livscykeln för HiveQL-frågan. Den tar emot frågor från användargränssnittet och skapar sessionen för att behandla frågan.
• Compiler: Den tar emot frågeplanerna från föraren och får den information som krävs från Metastore för att utföra planen.
• Metastore: Det lagrar informationen om data som en tabell; det kan vara en intern eller extern tabell. Den skickar metadatainformationen till kompilatorn för att köra frågan.
• Utför motor: Hive-tjänsten kommer att utföra resultatet i exekveringsmotorn. den kör frågan i MapReduce för att bearbeta data. Det ansvarar för att kontrollera varje steg för alla dessa komponenter.

2. Vilka är de olika typerna av lägen som Hive kan använda?

Svar:
Detta är de vanliga Hiveintervjufrågor som ställs i en intervju. Hive kan arbeta i två lägen baserat på datastorleken,
Dessa lägen är:
• Läget för kartminskning
•Lokalt läge

3. Vilka är scenarierna där Hive kan användas och inte kan användas?

Svar :
När du skapar datalagerapplikationer när dina data är statiska när din applikation inte behöver hög responstid, när datavolymen är enorm, när data inte ändras snabbt och när du använder frågor istället för skript. Hive stöder endast OLAP-transaktioner, det passar inte för OLTP-transaktioner.

Låt oss gå till nästa Hive-intervjufrågor.

4. Vilka är filformaten som Hive stöder? Lista vilken typ av program som stöds av HIVE?

Svar:
Som standard stöder Hive Text File-format och det stöder också det binära filformatet som sekvensfil, ORC-filer, parkettfiler, Avro-datafiler.
• Sekvensfil: Det är vanligtvis en binärformatfil som kan komprimeras och kan delas.
• ORC-fil: Optimerad rad kolumnerfil registreras kolumnbaserad fil och kolumnorienterad lagringsfil.
• Parkettfil: Det är en kolumnorienterad binär fil, den är mycket effektiv för storskaliga frågor.
• Avro-datafil: Det är samma som sekvensfilformat som är en delbar, komprimerbar och radorienterad fil.
Den maximala storleken på strängdatatypen som tillåts i Hive är 2 GB.

Hive är ett datalagerramverk som är lämpligt för de applikationer som är skrivna i Java, C ++, PHP, Python eller Ruby.

5. Vilka är de olika typerna av tabeller som finns i Hive?

Svar:
Det finns två typer av tabeller i Hive-applikationen, de är:
• Hanterade tabeller: Data och schema kontrollerar Hive.
• Externa tabeller: Endast schemat kontrollerar Hive.

Del 2 - Hiveintervjufrågor (avancerat)

Låt oss nu titta på de avancerade frågorna om Hive-intervjuer.

6. Vad är en Metastore in Hive? Lista och förklara de olika typerna av Hive Metastores-konfiguration?

Svar:
Metastore in Hive används för att lagra metadatainformationen, det är ett centralt arkiv i Hive. Det gör det möjligt att lagra metadatainformationen i en extern databas. Som standard lagrar Hive Metadata-information i Derby-databasen men den kan också lagras i andra databaser som Oracle, MySql etc.
Det finns tre typer av Metastore-konfiguration, de är:
• Inbäddad metastore: Det är ett standardläge; det kan komma åt Hive-biblioteket lokalt, alla kommandoradsoperationer utförs i inbäddat läge. Hive-tjänsten, metastore-tjänsten och databasen körs i samma JVM.
• Lokal metastore: Den lagrar data i en extern databas som MySql eller Oracle. Hive-tjänsten och metastore-tjänsten körs i samma JVM, den ansluts till databasen som körs i separat JVM.
• Fjärrmetastore: Den använder fjärrläget för att köra frågor, här kör metastore-tjänsten och bikupetjänsten i en separat JVM. Du kan ha flera metastore-servrar för att öka tillgängligheten.

7. Vad är en Hive Query-processor? Vilka är de olika komponenterna i Hive Query-processorn?

Svar:
Detta är de vanliga frågorna om Hiveintervju i en intervju. Hive Query Processor används för att konvertera SQL till MapReduce-jobb. Baserat på beroendeplanen utförs jobben.
Komponenterna i Hive Query Processor listas nedan:
• Semantisk analysator
• UDF: s och UDAF: er
• Optimizer
•Operatör
• Parser
• Exekveringsmotor
• Skriv kontroll
• Generering av logisk plan
• Generering av fysisk plan

8. Vad är funktionen för Object-Inspector i Hive?

Svar:
Den består av Hive som används för att identifiera strukturen för de enskilda kolumnerna och den inre strukturen för radobjekt. De komplexa objekten som är lagrade i flera format kan nås med Object-Inspector in Hive.
Object-Inspector kommer att identifiera strukturen för ett objekt och sätt att komma åt de interna fälten i objektet.

Låt oss gå till nästa Hive-intervjufrågor.

9. Vilka är de olika sätten att ansluta applikationerna till Hive Server?

Svar:
Det finns tre sätt att ansluta applikationerna till Hive-servern, de är:
• Sparsam klient: Detta används för att köra alla hive-kommandon med ett annat programmeringsspråk som Java, C ++, PHP, Python eller Ruby.
• ODBC Driver: Detta stöder ODBC-protokollet
• JDBC Driver: Detta stöder JDBC-protokollet

10. Vad är standardläs- och skrivklasserna i Hive?

Svar:
Nedan är läs- och skrivklasserna tillgängliga i Hive:
• TextInputFormat - Den här klassen används för att läsa data i vanlig textformat.
• HiveIgnoreKeyTextOutputFormat - Den här klassen används för att skriva data i vanligt textformat.
• SequenceFileInputFormat - Den här klassen används för att läsa data i Hadoop Sequence-filformat.
• SequenceFileOutputFormat - Den här klassen används för att skriva data i Hadoop Sequence-filformat.

Rekommenderad artikel

Detta har varit en guide till Lista över Hiveintervjufrågor och svar så att kandidaten lätt kan slå ned dessa Hiveintervjufrågor. Du kan också titta på följande artiklar för att lära dig mer -

  1. Topp 5 användbara DBA-intervjufrågor och svar
  2. 12 mest fantastiska GitHub-intervjufrågor och svar
  3. 15 viktigaste rubinintervjufrågor och svar
  4. Topp 10 mest användbara HBase-intervjufrågor