Introduktion till Hbase-intervjufrågor och svar

HBase är ett populärt kolumnorienterat NoSQL-databashanteringssystem som körs ovanpå Hadoop Distribuerat filsystem (HDFS). Det är väl lämpat för glesa datamängder, som är vanliga i många fall med stor dataanvändning.

Här är de 10 mest ställda frågorna och svaren på HBase-intervju 2019: Så du har äntligen hittat ditt drömjobb i HBase men undrar hur du kan knäcka Hbase-intervjun och vad som kan vara de troliga frågorna om Hbase-intervju. Varje intervju är annorlunda och omfattningen av ett jobb är också annorlunda. Med detta i åtanke har vi utformat de vanligaste Hbase-intervjufrågorna och svaren för att hjälpa dig att få framgång i din intervju. Dessa frågor är indelade i två delar är följande:

Del 1 - HBase Interview Questions (Basic)

Den här första delen täcker grundläggande intervallfrågor och svar från HBase.

1. När ska du använda HBase?

Svar:
Hbase är inte lämpligt för alla användningsfall. Ett bäst lämpligt scenario kan identifieras med följande kontroller -
i.Datavolym: Bör ha petabytes av data som ska behandlas i en distribuerad miljö.
ii.Application: HBase är inte lämplig för OLTP-system (Online Transaction Processing) som kräver komplexa flersatstransaktioner. Det saknar också komplext SQL-stöd som krävs för relationell analys.Det är att föredra när du har en enorm mängd data med en något annorlunda schema.
iii.Cluster-hårdvara: HBase körs ovanpå HDFS. Och HDFS fungerar effektivt med ett stort antal noder (minst 5). Så HBase kan vara ett bra val endast med bra hårdvarusupport.
iv.Inot Traditional RDBMS: Hbase kan inte stödja något användningsfall som kräver traditionella funktioner som Gå med i flera tabeller, komplexa SQls med kapslade eller fönsterfunktioner etc.
v.Snabb slumpmässig åtkomst till data: Om du behöver en slumpmässig och realtidsåtkomst till dina data, är HBase en lämplig kandidat. Det passar också perfekt för att lagra stora tabeller med multistrukturerad data.

2. Vad är skillnaden mellan Cassandra och HBase?

Svar:
Både HBase och Cassandra har distribuerat NoSQL-databasen för Big Data från Hadoop-ekosystemet. Båda byggda för olika användningsfall.
HBase har typ av master-slavarkitektur med flera komponenter som Zookeeper, Namenode, HBase Master (Hmaster) och datanoder etc. Cassandra behandlar alla noder som mästare vilket innebär att alla noder är lika och utför alla funktioner.
HBase är optimerad för läsningar, skrivning händer bara med huvudnoden och har stark konsistens för läsning efter skrivning. Cassandra har utmärkt läsprestanda i en rad om eventuell konsistens väljs.
Hbase stöder inte infödda sekundära index, Cassandra stöder sekundära index på kolumnfamiljer där kolumnnamnet är känt.
Ursprungligen skapades Hbase i Google och de kallade det BigTable. Även nu är API: er för Bigtable och HBase kompatibla. Ursprunget till Cassandra är från ett papper för DynamoDB som är NoSQL-databas från AWS.

Låt oss gå till nästa HBase intervjufrågor.

3. Vilka är de viktigaste komponenterna i Hbase?

Svar:
HBase a har tre viktiga komponenter - HMaster, Region Server och ZooKeeper.
i.HBase Master - HBas-tabeller är indelade i regioner. Under uppstarten beslutar Master vilken region som ska tilldelas vilken regionserver (Regionservern kommer att vara en nod i ett kluster). Det hanterar även tabellmetadatafunktioner som skapa eller ändra schemat. Denna komponent spelar också en viktig roll i felhämtningen
ii. Regionserver - Som nämnts ovan händer det faktiska dataskrivning och läsning. Dessa är faktiska klusternoder. Detta kommer att ha regioner med många tabeller som bestäms genom att starta och avsluta radtangenterna. En typisk regionserver kan tjäna upp till tusen regioner
iii.ZooKeeper - ZooKeeper är ett klusterkoordinationsramverk som används allmänt i Hadoop ekosystem. Zookeeper spårar alla servrar (Master- och region-servrar) som finns i kluster HMaster-kontakter ZooKeeper och meddelanden produceras vid fel.

4. Vad är HBase Bloom-filter?

Svar:
Detta är de vanliga HBase-intervjufrågorna som ställs i en intervju. Ett HBase Bloom-filter är en effektiv mekanism för att testa om en butikfil (När något skrivs till HBase skrivs det först till ett minneslager, när den här minnesbutiken når en viss storlek spolas den till disken till en butikfil ) innehåller en specifik rad eller rad-col-cell. Normalt är det enda sättet att avgöra om en radnyckel finns i en butikfil att kontrollera filens blockindex, som har startradknappen för varje block i butikfilen. Bloom-filter fungerar som en datastruktur i minnet som hjälper till att minska hårddiskavläsningen till endast de filer som sannolikt innehåller den raden - inte alla lagringsfiler. Så det fungerar som ett minne i minnet för att indikera sannolikheten för att hitta en rad i en viss butikfil.

5. Vad är komprimering? Förklara olika typer av det.

Svar:
HBase lagrar alla mottagna operationer i sitt minnesområde i minnesbutiken. När minnesbufferten är full spolas den till hårddisken. Eftersom detta kan skapa många små filer i HDFS kan HBase då och då välja filer som ska komprimeras till en större. En komprimering kallas Mindre när HBase väljer endast några av HFiles som ska komprimeras men inte alla. I en större komprimering väljs alla filer för att komprimeras tillsammans. En större komprimering fungerar som en mindre, förutom att borttagningsmarkörerna kan tas bort efter att de har applicerats på alla relaterade celler och alla extra versioner av samma cell kommer också att släppas.

Del 2 - HBase Interview Questions (Advanced)

Låt oss nu titta på de avancerade frågorna om HBase Interview.

6.Hur HBase-version?

Svar:
När en datauppsättning infogas / uppdateras / raderas kommer HBase att skapa en ny version för den kolumnen. Faktisk borttagning sker bara under komprimering. Om en viss cell överskred ett antal tillåtna versioner kommer extra versioner att släppas under komprimering

7. Vad är skillnaden mellan att få och skanna?

Svar:
Get kommer att returnera en enda enda rad från Hbase-tabellen baserat på den angivna radnyckeln. Skannekommando returnerar uppsättning rader beroende på givet sökvillkor. Vanligtvis blir snabbare än skanning. Så bör föredra att använda det om möjligt.

Låt oss gå till nästa HBase intervjufrågor.

8. Vad händer när du raderar en rad?

Svar:
Vid tidpunkten för radering raderas inte kommandodata fysiskt från filsystemet, utan görs osynliga genom att ställa in en markör. Fysisk radering sker under en komprimering
Kolumn-, version- och familjeteringsmarkörer är tre olika typer av markörer som markerar radering av en kolumn, respektive kolumnversion och kolumnfamilj.

9. Förklara skillnaden mellan HBase och Hive.

Svar:
Detta är den avancerade HBase-intervjufrågan som ställs i en intervju. HBase och Hive är båda helt olika Hadoop-baserade tekniker för databehandling. Hive är ett relationellt SQL-kompatibelt distribuerat lagringsramverk medan HBase är ett NoSQL-nyckelvärdeslager. Hive fungerar som ett abstraktionslager ovanpå Hadoop med SQL-stöd. Basdatatillgångsmönstret är mycket begränsat med två primära operationer - get and scan. HBase är idealisk för databehandling i realtid där Hive är ett idealiskt val för batchdatabehandling.

10. Vad är Hlog och HFile?

Svar:
HLog är den framåtloggade filen, även känd som WAL och HFile är den verkliga datalagringsfilen. Data skrivs först till den framåtloggade filen och skrivs också i MemStore.När MemStore är full, matas innehållet i MemStore till disken i HFiles.

Rekommenderad artikel

Detta har varit en guide till Lista över Hbase-intervjufrågor och svar så att kandidaten lätt kan slå ned dessa Hbase-intervjufrågor. Du kan också titta på följande artiklar för att lära dig mer -

  1. Användbara gruppintervjufrågor
  2. Viktiga grundläggande intervjutips
  3. Väsentliga steg för intervjuförberedelser
  4. Intervjufrågor för att ställa en finansiell kandidat