Last ned PDF
Følgende er ofte stilte spørsmål i intervjuer for nybegynnere og også erfaren HBase-utvikler.
1) Forklar hva som er Hbase?
Hbase er et kolonneorientert databasestyringssystem som kjører på toppen av HDFS (Hadoop Distribute File System). Hbase er ikke en relasjonell datalager, og den støtter ikke strukturert spørrespråk som SQL.
I Hbase regulerer en masternode klyngen og regionserverne for å lagre deler av tabellene og driver arbeidet med dataene.
2) Forklar hvorfor du bruker Hbase?
- Lagringssystem med høy kapasitet
- Distribuert design for å imøtekomme store bord
- Kolonneorienterte butikker
- Horisontalt skalerbar
- Høy ytelse og tilgjengelighet
- Hovedmålet til Hbase er millioner av kolonner, tusenvis av versjoner og milliarder rader
- I motsetning til HDFS (Hadoop Distribute File System) støtter den tilfeldig CRUD-operasjoner i sanntid
3) Nevn hva som er hovedkomponentene i Hbase?
- Zookeeper: Det gjør koordineringsarbeidet mellom klient og Hbase Maser
- Hbase Master: Hbase Master overvåker Region Server
- RegionServer: RegionServer overvåker regionen
- Region: Den inneholder i minnedatalager (MemStore) og Hfile.
- Katalogtabeller: Katalogtabeller består av ROOT og META
4) Forklar hva består Hbase av?
- Hbase består av et sett med bord
- Og hver tabell inneholder rader og kolonner som tradisjonell database
- Hver tabell må inneholde et element definert som en primærnøkkel
- Hbase-kolonne angir et attributt til et objekt
5) Nevn hvor mange operasjonelle kommandoer i Hbase?
Operasjonell kommando i Hbases er omtrent fem typer
- Få
- Sette
- Slett
- Skann
- Inkrement
6) Forklar hva som er WAL og Hlog i Hbase?
WAL (Write Ahead Log) ligner på MySQL BIN-logg; den registrerer alle endringene som forekommer i data. Det er en standard sekvensfil av Hadoop og den lagrer HLogkey's. Disse nøklene består av et løpende nummer så vel som faktiske data og brukes til å spille av ennå ikke vedvarende data etter et serverkrasj. Så, i kontanter for serverfeil, fungerer WAL som en livslinje og henter tapte data.
7) Når skal du bruke Hbase?
- Datastørrelsen er enorm: Når du har tonnevis og millioner av poster å operere
- Komplett redesign: Når du flytter RDBMS til Hbase, ser du på det som et komplett re-design, så bare å endre portene
- SQL-Less-kommandoer: Du har flere funksjoner som transaksjoner; indre sammenføyninger, typte kolonner, etc.
- Infrastrukturinvesteringer: Du må ha nok klynger for at Hbase skal være veldig nyttig
8) Hva er kolonnefamilier i Hbase?
Kolonnefamilier utgjør den grunnleggende enheten for fysisk lagring i Hbase som funksjoner som komprimering påføres.
9) Forklar hva som er radnøkkelen?
Radnøkkel er definert av applikasjonen. Ettersom den kombinerte nøkkelen er forhåndsfiksert av radetasten, lar den applikasjonen definere ønsket sorteringsrekkefølge. Det tillater også logisk gruppering av celler og sørg for at alle celler med samme radnøkkel er samlokalisert på samme server.
10) Forklar sletting i Hbase? Nevn hva er de tre typene gravsteinsmarkører i Hbase?
Når du sletter cellen i Hbase, blir ikke dataene faktisk slettet, men en gravsteinmarkør er satt, noe som gjør de slettede cellene usynlige. Hbase slettet blir faktisk fjernet under komprimering.
Tre typer gravsteinsmarkører er der:
- Slett markør for versjon: For sletting markerer den en enkelt versjon av en kolonne
- Slette markør: For sletting markerer den alle versjonene av en kolonne
- Slettemarkør for familie: For sletting markerer den hele kolonnen for en kolonnefamilie
11) Forklar hvordan sletter Hbase faktisk en rad?
I Hbase, uansett hva du skriver vil bli lagret fra RAM til disk, er disse diskskriver uforanderlig sperringskomprimering. Under slettingsprosessen i Hbase sletter større komprimeringsprosesser markøren mens mindre komprimeringer ikke gjør det. Ved normal sletting resulterer det i en slett gravsteinsmarkør - disse slettingsdataene de representerer blir fjernet under komprimering.
Også, hvis du sletter data og legger til mer data, men med et tidligere tidsstempel enn gravsteins tidsstempel, kan ytterligere Gets maskeres av slett / gravsteinsmarkøren, og du vil derfor ikke motta den innsatte verdien før etter den største komprimeringen.
12) Forklar hva som skjer hvis du endrer blokkstørrelsen til en kolonnefamilie i en allerede okkupert database?
Når du endrer blokkstørrelsen til kolonnefamilien, opptar de nye dataene den nye blokkstørrelsen mens de gamle dataene holder seg innenfor den gamle blokkstørrelsen. Under datakomprimering vil gamle data ta den nye blokkstørrelsen. Nye filer når de skylles, har en ny blokkstørrelse, mens eksisterende data vil fortsette å bli lest riktig. All data skal transformeres til den nye blokkstørrelsen, etter neste store komprimering.
13) Nevn forskjellen mellom Hbase og Relational Database?
Hbase | Relasjonsdatabase |
|
|
14) Hva er HBaseFsck-klasse?
Det er et verktøynavn som kalles tilbake er tilgjengelig i HBase, som er implementert av HBaseFsck-klassen. Den tilbyr flere kommandolinjebrytere som påvirker dens oppførsel.
15) Hva er de viktigste nøkkelstrukturene til HBase?
Radnøkkel og Kolonnøkkel er de to viktigste nøkkelstrukturene som brukes i HBase
16) Diskuter hvordan du kan bruke filtre i Apache HBase
Filtre i HBase Shell. Den ble introdusert i Apache HBase 0.92 som hjelper deg å utføre filtrering på serversiden for å få tilgang til HBase over HBase-skall eller sparsommelighet.
17) HBase-støtte syntaksstruktur som SQL ja eller nei?
Nei, dessverre, SQL-støtte for HBase er ikke tilgjengelig for øyeblikket. Ved å bruke Apache Phoenix kan vi imidlertid hente data fra HBase gjennom SQL-spørringer.
18) Hva er betydningen av komprimering i HBase?
På tidspunktet for tunge innkommende skrivinger er det umulig å oppnå optimal ytelse ved å ha en fil per butikk. HBase hjelper deg med å kombinere alle disse HFiles for å redusere antall diskfrø for hver lesing. Denne prosessen er kjent som komprimering i HBase.
19) Hvordan vil du implementere koblinger i HBase?
HBase, ikke støtte blir med direkte, men bruker MapReduce-jobber, sammenføyningsspørsmål kan implementeres ved å hente data ved hjelp av forskjellige HBase-tabeller.
20) Forklar JMX angående HBSE
Java Management Extensions eller JMX er en eksportstatus for Java-applikasjoner som er standard for dem.
21) Hva er bruken av MasterServer?
Master sever hjelper deg med å tilordne en region til regionserveren også. Det hjelper deg også med å håndtere lastbalanseringen vi bruker MasterServer.
22) Definer begrepet sparsommelighet
Apache Thrift er skrevet i C ++. Det gir skjemakompilatorer for forskjellige programmeringsspråk som C ++, Perl, PHP, Python, Ruby og mer.
23) Hvorfor bruke HColumnDescriptor-klassen?
Detaljene angående kolonnefamilien som kompresjonsinnstillinger, Antall versjoner, lagres .i HColumnDescriptor.
24) Hva er en celle i HBase?
En celle i HBase er den minste enheten i en Hbase-tabell. Det hjelper deg å holde et stykke data i form av en tuple {rad, kolonne, versjon}
25) Hva er et Bloom-filter?
HBase støtter Bloom Filter hjelper deg med å forbedre klyngens samlede gjennomstrømning. Et HBase Bloom-filter er en plasseffektiv mekanisme for å teste om en HFile inneholder en viss rad- eller rad-kolonne-celle.
26) Fortell meg om hvilke typer HBase-operasjoner?
Ans. To typer HBase-operasjoner er:
- Les Operasjon
- Skriv operasjon
27) Hva er bruken av HBase HMaster?
En mesters hovedansvar er:
- Koordinering av regionens servere
- Administratorfunksjoner
28) Hvilken teknikk kan du bruke i HBase for å få tilgang til HFile direkte uten hjelp fra HBase?
For å få tilgang til HFile direkte uten å bruke HBase, bruker vi HFile.main () -metoden.
29) Kan regionstjeneren være lokalisert på alle DataNodes?
Ja, Region Servers kjører på de samme serverne som DataNodes
30) Navngi filteret som godtar sidestørrelsen som parameter i HBase
Et filter med navnet PageFilter godtar sidestørrelsen som parameter.
Dette dokumentet er komponert med verktøyene for øyeblikkelig HTML-omformer.
- Neste