Tabelloperasjoner som oppretting, endring og dropping av tabeller i Hive kan observeres i denne opplæringen.
I skjermbildet nedenfor lager vi en tabell med kolonner og endrer tabellnavnet.
1. Opprette tabellen guru_sample med to kolonnenavn som "empid" og "empname"
2. Viser tabeller i guru99-databasen
3. Guru_sample vises under tabeller
4. Endring av tabell "guru_sample" som "guru_sampleNew"
5. Igjen når du utfører "show" -kommandoen, vil den vise det nye navnet Guru_sampleNew
Dropping table guru_sampleNew:
Tabelltyper og dens bruk:
Kommer til tabeller er det akkurat slik vi lager i tradisjonelle relasjonsdatabaser. Funksjonalitetene som filtrering, sammenføyning kan utføres på bordene.
Hive håndterer to typer bordstrukturer som interne og eksterne tabeller, avhengig av innlasting og utforming av skjema i Hive.
Interne bord
- Intern tabell er tett sammenkoblet i naturen. I denne typen tabeller må vi først lage tabell og laste inn dataene.
- Vi kan kalle denne som data om skjema .
- Ved å droppe denne tabellen vil både data og skjema bli fjernet.
- Den lagrede plasseringen av denne tabellen vil være på / bruker / bikube / lager.
Når skal du velge internt bord:
- Hvis behandlingsdataene er tilgjengelige i det lokale filsystemet
- Hvis vi vil at Hive skal administrere den komplette livssyklusen til data inkludert sletting
Eksempelkodebit for intern tabell
1. For å lage den interne tabellen
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Last inn dataene i den interne tabellen
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Vis innholdet i tabellen
Hive>select * from guruhive_internaltable;
4. Å slippe den interne tabellen
Hive>DROP TABLE guruhive_internaltable;
Hvis du droppet guruhive_internaltable, vil metadataene og dataene fra den bli slettet fra Hive.
Fra følgende skjermbilde kan vi observere utdataene
I koden ovenfor og fra skjermbildet gjør vi følgende ting,
- Lag den interne tabellen
- Last inn dataene i den interne tabellen
- Vis innholdet i tabellen
- Å slippe det interne bordet
Eksterne tabeller
- Eksternt bord er løst koblet i naturen. Data vil være tilgjengelig i HDFS. Tabellen skal opprette på HDFS-data.
- På en annen måte kan vi si som å skape skjema på data .
- Når du slipper tabellen, faller det bare skjema, dataene vil fremdeles være tilgjengelige i HDFS som før.
- Eksterne tabeller gir et alternativ for å opprette flere skjemaer for dataene som er lagret i HDFS i stedet for å slette dataene hver gang skjemaoppdateringer
Når skal du velge eksternt bord:
- Hvis behandlingen av data er tilgjengelig i HDFS
- Nyttig når filene brukes utenfor Hive
Eksempelkodebit for ekstern tabell
1. Opprett ekstern tabell
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Hvis vi ikke spesifiserer stedet på tidspunktet for tabelloppretting, kan vi laste dataene manuelt
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Vis innholdet i tabellen
Hive>select * from guruhive_external;
4. Å slippe den interne tabellen
Hive>DROP TABLE guruhive_external;
Fra følgende skjermbilde kan vi observere utdataene
I koden ovenfor gjør vi følgende ting
- Lag den eksterne tabellen
- Last inn dataene i den eksterne tabellen
- Vis innholdet i tabellen
- Dropper eksternt bord
Forskjellen mellom interne mot eksterne tabeller
Trekk | Innvendig | Utvendig |
---|---|---|
Skjema | Data om skjema | Skjema for data |
Lagringssted | / usr / bikube / lager | HDFS-plassering |
Datatilgjengelighet | Innenfor lokalt filsystem | Innen HDFS |