Hive

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Apache Hive
Логотип программы Apache Hive
Тип Система управления базами данных
Автор Facebook
Разработчик Apache Software Foundation
Написана на Java
Операционная система Кроссплатформенное программное обеспечение
Языки интерфейса Английский
Первый выпуск 9 ноября 2011[1]
Аппаратная платформа Java Virtual Machine
Последняя версия
Репозиторий git.apache.org/hive.git
svn.apache.org/repos/asf…
Состояние Активный
Лицензия Apache License 2
Сайт hive.apache.org
Логотип Викисклада Медиафайлы на Викискладе

Hive — система управления базами данных на основе платформы Hadoop с SQL-подобным языком запросов, позволяет выполнять запросы, агрегировать и анализировать данные; компонент экосистемы Hadoop.

Создан корпорацией Facebook, в 2011 году передан под открытой лицензией в фонд Apache.

Работает напрямую с HDFS и Apache HBase, поддерживает основные форматы Hadoop. Запросы могут выполняться через Tez, Spark или Hadoop MapReduce[3].

Язык запросов — HiveQL — приближен к SQL, при этом не реализует все возможности стандарта SQL-92. В язык встроены функции для работы с форматами XML и JSON, поддержка нескалярных типов данных, таких как массивы, структуры, ассоциативные массивы[4], реализован достаточно широкий набор агрегатных функций, поддерживаются определяемые пользователем функции, блокировки.

Пример сеанса работы с Hive с применением HiveQL — удаление таблицы, создание таблицы, загрузка в неё данных из текстового файла и запрос для подсчёта, сколько раз каждое слово встречалось в файле:

DROP TABLE IF EXISTS docs;
CREATE TABLE docs (line STRING);
LOAD DATA INPATH 'input_file' OVERWRITE INTO TABLE docs;
CREATE TABLE word_counts AS
SELECT word, count(1) AS count FROM
 (SELECT explode(split(line, '\s')) AS word FROM docs) temp
GROUP BY word
ORDER BY word;

Примечания

[править | править код]
  1. https://projects.apache.org/json/projects/hive.json
  2. Apache Hive 3.1.3 Released — 2022.
  3. About Apache Hive. Дата обращения: 11 августа 2016. Архивировано 30 августа 2016 года.
  4. SQL Differences Between Impala and Hive. Дата обращения: 11 августа 2016. Архивировано 9 августа 2016 года.