logo

Kas yra ŽIVE

„Hive“ yra duomenų saugyklos sistema, naudojama struktūriniams duomenims analizuoti. Jis pastatytas Hadoop viršuje. Jį sukūrė „Facebook“.

„Hive“ suteikia galimybę skaityti, rašyti ir valdyti didelius duomenų rinkinius, esančius paskirstytoje saugykloje. Jis vykdo SQL panašias užklausas, vadinamas HQL (Hive query language), kurios viduje konvertuojamos į MapReduce užduotis.

Naudodami „Hive“, galime praleisti tradicinio požiūrio į sudėtingų „MapReduce“ programų rašymo reikalavimą. Hive palaiko duomenų apibrėžimo kalbą (DDL), duomenų manipuliavimo kalbą (DML) ir vartotojo nustatytas funkcijas (UDF).

„Hive“ savybės

Tai yra šios „Hive“ funkcijos:

  • Avilys yra greitas ir keičiamas.
  • Jis teikia į SQL panašias užklausas (ty HQL), kurios netiesiogiai transformuojamos į MapReduce arba Spark užduotis.
  • Jis gali analizuoti didelius duomenų rinkinius, saugomus HDFS.
  • Tai leidžia saugoti įvairius saugojimo tipus, pvz., paprastą tekstą, RCFile ir HBase.
  • Jis naudoja indeksavimą, kad paspartintų užklausas.
  • Jis gali veikti su suspaustais duomenimis, saugomais Hadoop ekosistemoje.
  • Jis palaiko vartotojo apibrėžtas funkcijas (UDF), kur vartotojas gali teikti savo funkcijas.

Avilio apribojimai

  • Avilys negali apdoroti duomenų realiuoju laiku.
  • Jis nėra skirtas internetiniam sandorių apdorojimui.
  • Avilio užklausose yra didelė delsa.

Skirtumai tarp avilio ir kiaulės

Avilys Kiaulė
Avilį dažniausiai naudoja duomenų analitikai. Pig dažniausiai naudoja programuotojai.
Jis seka į SQL panašias užklausas. Ji vadovaujasi duomenų srauto kalba.
Jis gali tvarkyti struktūrinius duomenis. Jis gali tvarkyti pusiau struktūrinius duomenis.
Jis veikia HDFS klasterio serverio pusėje. Jis veikia HDFS klasterio kliento pusėje.
Avilys yra lėtesnis nei kiaulė. Kiaulė yra palyginti greitesnė už avilį.