Hive Create, Alter & Drop Table

Innholdsfortegnelse:

Anonim

Tabelloperasjoner som oppretting, endring og dropping av tabeller i Hive kan observeres i denne opplæringen.

I skjermbildet nedenfor lager vi en tabell med kolonner og endrer tabellnavnet.

1. Opprette tabellen guru_sample med to kolonnenavn som "empid" og "empname"

2. Viser tabeller i guru99-databasen

3. Guru_sample vises under tabeller

4. Endring av tabell "guru_sample" som "guru_sampleNew"

5. Igjen når du utfører "show" -kommandoen, vil den vise det nye navnet Guru_sampleNew

Dropping table guru_sampleNew:

Tabelltyper og dens bruk:

Kommer til tabeller er det akkurat slik vi lager i tradisjonelle relasjonsdatabaser. Funksjonalitetene som filtrering, sammenføyning kan utføres på bordene.

Hive håndterer to typer bordstrukturer som interne og eksterne tabeller, avhengig av innlasting og utforming av skjema i Hive.

Interne bord

  • Intern tabell er tett sammenkoblet i naturen. I denne typen tabeller må vi først lage tabell og laste inn dataene.
  • Vi kan kalle denne som data om skjema .
  • Ved å droppe denne tabellen vil både data og skjema bli fjernet.
  • Den lagrede plasseringen av denne tabellen vil være på / bruker / bikube / lager.

Når skal du velge internt bord:

  • Hvis behandlingsdataene er tilgjengelige i det lokale filsystemet
  • Hvis vi vil at Hive skal administrere den komplette livssyklusen til data inkludert sletting

Eksempelkodebit for intern tabell

1. For å lage den interne tabellen

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Last inn dataene i den interne tabellen

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Vis innholdet i tabellen

 Hive>select * from guruhive_internaltable;

4. Å slippe den interne tabellen

 Hive>DROP TABLE guruhive_internaltable;

Hvis du droppet guruhive_internaltable, vil metadataene og dataene fra den bli slettet fra Hive.

Fra følgende skjermbilde kan vi observere utdataene

I koden ovenfor og fra skjermbildet gjør vi følgende ting,

  • Lag den interne tabellen
  • Last inn dataene i den interne tabellen
  • Vis innholdet i tabellen
  • Å slippe det interne bordet

Eksterne tabeller

  • Eksternt bord er løst koblet i naturen. Data vil være tilgjengelig i HDFS. Tabellen skal opprette på HDFS-data.
  • På en annen måte kan vi si som å skape skjema på data .
  • Når du slipper tabellen, faller det bare skjema, dataene vil fremdeles være tilgjengelige i HDFS som før.
  • Eksterne tabeller gir et alternativ for å opprette flere skjemaer for dataene som er lagret i HDFS i stedet for å slette dataene hver gang skjemaoppdateringer

Når skal du velge eksternt bord:

  • Hvis behandlingen av data er tilgjengelig i HDFS
  • Nyttig når filene brukes utenfor Hive

Eksempelkodebit for ekstern tabell

1. Opprett ekstern tabell

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Hvis vi ikke spesifiserer stedet på tidspunktet for tabelloppretting, kan vi laste dataene manuelt

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Vis innholdet i tabellen

 Hive>select * from guruhive_external;

4. Å slippe den interne tabellen

 Hive>DROP TABLE guruhive_external;

Fra følgende skjermbilde kan vi observere utdataene

I koden ovenfor gjør vi følgende ting

  • Lag den eksterne tabellen
  • Last inn dataene i den eksterne tabellen
  • Vis innholdet i tabellen
  • Dropper eksternt bord

Forskjellen mellom interne mot eksterne tabeller

Trekk Innvendig Utvendig
Skjema Data om skjema Skjema for data
Lagringssted / usr / bikube / lager HDFS-plassering
Datatilgjengelighet Innenfor lokalt filsystem Innen HDFS