Vad är HBase?
HBase är en databas som är kolumnorienterad distribuerad databas utformad för att fungera på Distribuerat filsystem som kallas HDFS (HDFS - Stands for Hadoop Distribuerat filsystem). För att hantera stora datasätt i en vid miljö kommer Hadoop in i bilden.
Definition av HBase
I en distribuerad miljö stöder HBase optimistiskt uppdateringsgraden på ett högt bord och det kan också horisontellt skala upp klustren. Det möjliggör i huvudsak enorma tabeller i databasen.
Den viktigaste tekniken för lagring av loggar är att använda Writ-Ahead Logs (WAL).
Till exempel - HBase är den bästa hanteringsmiljön för data som är strukturerade. Facebook är ett av de största exemplen där den använder meddelandeplattformen, som har miljarder rader och miljoner kolumner.
Datakonsistens är en av de viktiga faktorerna under läs / skrivoperationer, HBase ger en stark inverkan på konsistensen. För att administrera servrarna i varje region krävs huvudsakligen arkitekturen för HBase. HBase är oerhört kodad på Java, som avsåg att driva ett toppnivåprojekt i Apache år 2010.
Förstå HBase
HBase hanterar automatiskt failover- och lastbalansering med regionserverreplikation. Det kan också fånga metadata. Sharding är det koncept som främst används i HBase. Som vi redan vet kommer HBase att bestå av regioner där de drivs av regionens servrar och varje region kommer att delas upp med hjälp av regionservrar på helt olika datanoder. HBase kan dela antingen manuellt eller automatiskt.
För att skala upp klustren kan vi i stället för att göra servrar kraftfullare lägga till ett n-antal maskiner till klusterna. Också i farten kan vi skapa ett flertal kluster. När regionens servernod körs börjar klusteret att återbalansera av sig själv. HBase har en unik egenskap för att lagra varje kolumn individuellt inte som någon annan relationsdatabas som lagrar baserat på raderna. Det stöder också enkla funktioner genom att bara använda kommandoradsverktyget.
Hur gör HBase att arbeta så enkelt?
Det enda skälet är på grund av lagringsmekanismen. I grund och botten är HBase en segmentordnad databas. Dessutom är tabellerna i det ordnade efter kolumn. Här karakteriserar bordkonstruktionen bara sektionsfamiljer, som är de viktigaste uppsättningarna. Trots det kan man tänka sig att en tabell har olika sektionsfamiljer och här kan varje segmentfamilj ha valfritt antal segment. Dessutom, här på plattan, vilket resulterar i avsnitt uppskattningar läggs bort angränsande. Dessutom har varje cellberäkning av tabellen en tidsstämpel här.
I ett HBas hänvisar tabellen till ackumulering av kolumner. Linjen hänvisar till samlingen av sektionsfamiljer. Sektionsfamiljen hänvisar till samling av segment. Avsnittet hänvisar till ackumulering av uppsättningar av nyckelkänslor.
Vad kan du göra med HBase?
Samtidigt som vi måste ha oregelbunden, pågående läs / komposera åtkomst till Big Data, använder vi Apache HBase. Det är tänkbart att ha utomordentligt stora tabeller över grupper av utrustningsutrustning med Apache HBase. Efter Googles Bigtable är HBase en icke-social databas som visas. I grund och botten, eftersom Bigtable inte uppträder i Google File System, på samma sätt tar HBase ett skott på toppen av Hadoop och HDFS.
Arbetar med HBase
Antag att tabellerna i en tabell placeras i minnessidorna. Dessa sidor överförs till det viktiga minnet, med en chans att de inte officiellt visas i minnet. Om det är en chans att en rad har en sida och vi behöver alla särskilda avsnitt, till exempel kompensation eller entusiasmhastighet från alla linjer för någon slags utredning, måste varje sida som innehåller segmenten skaffa minnet; så denna sida in & page out kommer att resultera i mycket I / O, vilket kan leda till försenad hanteringstid.
I databaser som ligger i avsnitt kommer varje segment att läggas bort på sidor. Med en chans att vi måste få ett visst segment kommer det att finnas mindre I / O eftersom bara de sidor som innehåller det förutbestämda segmentet borde ha förts det primära minnet och läst, och vi behöver inte ta med och granska var och en av sidor som innehåller rader / poster nedan i minnet.
Så den typ av förfrågningar där vi helt enkelt måste få uttryckliga segment och inte hela post (er) eller uppsättningar fungerar bäst i databasen för segmentet, vilket är värdefullt för utredning där vi kan få några avsnitt och göra några numeriska aktiviteter.
Ansökan
- För att skriva tunga applikationer kan vi använda Apache HBase.
- Dessutom, medan vi måste ge snabb slumpmässig åtkomst till tillgängliga data, använder vi HBase.
- Vissa företag använder också HBase internt, som Facebook, Twitter, Yahoo och Adobe, etc.
fördelar
- HBase har arbetat med hjälp för produktivt tryck och informationstryck.
- Detta stöder snabb återhämtning av information.
- Organisation och design kopplas bort. Den kan mycket väl skalas ut och är därför allt annat än svår att förlänga.
- Detta är användbart för eliten på totala frågor, (till exempel COUNT, Total, AVG, MIN och MAX).
- Detta är produktivt för fördelning eftersom det ger höjdpunkter i programmerat skärmningsinstrument för att förmedla större områden till små.
Varför ska vi använda HBase?
- Det har en helt cirkulerad konstruktion och kan hantera otroligt omfattande information.
- Det fungerar för en otroligt godtycklig läsning och komponerar aktiviteter.
- Det har hög säkerhet och enkel administration av information.
- Det ger en anmärkningsvärd hög kompositgenomströmning.
- Skalning för att möta extra förutsättningar är konsekvent och snabb.
- Kan användas för både organiserade och halvorganiserade informationstyper.
- Det är bra när du inte behöver bry dig med full RDBMS-kapacitet.
- Det har en oklanderligt uppmätt och rak anpassningsbarhet.
- Informationen granskar och komponerar är noggrant pålitliga.
- Bordskärning kan effektivt arrangeras och automatiseras.
- Olika servrar ges programmerat failover-stöd.
- MapReduce-anställningar kan stöds med HBas-tabeller.
- kunden får överensstämmer med Java-API: er.
Varför behöver vi HBase?
HBase är en dynamisk NoSQL-databas som ser utökas under denna dag och ålder som övermannas med Big Data. Den har extremt okomplicerade Java-programmeringsrötter som kan skickas för att skala HBase i större skala. Det finns en hel del affärssituationer där vi bara arbetar med otillräcklig information som är att söka efter ett gäng informationsfält som samordnar specifika kriterier i informationshandtaget som räknas i miljarder. Det är mycket bristtolerant och starkt och kan hantera olika typer av information vilket gör den värdefull för förändrade affärssituationer.
Det är ett segmentordnat bord som gör det enkelt att söka efter rätt information bland miljarder informationsfält. Du kan utan mycket sträcka skärpa informationen i tabeller med rätt installation och automatisering. HBase är helt passande för systematisk beredning av information. Eftersom förklarande förberedelser har enorma mått av information som krävs gör det att förfrågningar överträffar den bristningspunkt som är tänkbar på en ensam server. Detta är den punkt då den spridda lagringen kommer in i bilden.
Det finns likaledes ett krav för att ta hand om en hel del pausar och komponerar, vilket helt enkelt är orealistiskt med användning av en RDBMS-databas, varför HBase är den idealiska möjligheten för sådana applikationer. Läs- / kompositionsgränsen för denna innovation kan skalas till till och med miljoner / sekund vilket ger den en extra föredragen ståndpunkt. Facebook använder det mycket för kontinuerligt informera applikationer och Pinterest använder för många uppdrag som kör upp till 5 miljoner uppgifter för varje sekund.
Rätt publik för att lära sig HBase Technologies?
- Programvaruutvecklare och Mainframe-proffs.
- Projektledare, Big Data-analytiker och testpersonal.
- Java-utvecklare, professionell datahantering.
Tillämpningsområde och karriärstillväxt
Som vi förmodligen är medvetna stiger Hadoop-miljön och vi kan säga HBase är det perfekta steget för att hantera toppen av HDFS (Hadoop Distribuerad filsystem). Därefter, från och med nu, kommer att lära sig HBase vara användbart i utvecklingen. Faktum är att även organisationer söker efter konkurrenter som kan skicka HBase informationsmodeller i skala på expansiva Hadoop-klasser som består av produktionsutrustning. Längs dessa linjer, kommer att lära oss denna HBase-innovation hjälpa oss att utföra några uppgifter, eftersom skicka Load Utility för att stapla ett dokument, samordna det med Hive, ta reda på HBase API och HBase Shell. Följaktligen kommer att lära sig det att ta vårt yrke till följande dimension.
Slutsats
Efter att ha lärt dig HBase kommer du oftast att utföra olika uppgifter, skicka Load Utility för att stapla en post, integrera den med Hive, ta reda på HBase API och HBase Shell. Detta kan hjälpa dig i ditt yrke att ta ditt yrke till följande dimension.
Rekommenderad artikel
Detta har varit en guide till Vad är HBase? Här diskuterade vi koncept, definition, arbete, tillämpning och fördelar med HBase. Du kan också gå igenom våra andra föreslagna artiklar för att lära dig mer -
- Vad är databehandling?
- Vad är ett datavarehus?
- Vad är definitionen av datamining?
- Vad är datavetenskap?
- Steg att följa i Mainframe Testing