大数据之hive Hive CLI 常用命令 DDL/DML/ 运维 速查表

大数据阿木 发布于 2025-07-11 9 次阅读


Hive CLI 常用命令速查表:DDL/DML/运维篇

Hive 是一个建立在 Hadoop 之上的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的 SQL 查询功能。Hive CLI 是与 Hive 交互的主要方式,通过命令行界面执行各种操作。本文将围绕 Hive CLI,提供一份DDL(数据定义语言)、DML(数据操作语言)以及运维相关的常用命令速查表,帮助用户快速掌握 Hive 的基本操作。

一、DDL 命令

DDL 命令用于创建、修改和删除数据库对象,如数据库、表、分区等。

1. 创建数据库

sql

CREATE DATABASE IF NOT EXISTS database_name;


2. 删除数据库

sql

DROP DATABASE IF EXISTS database_name;


3. 显示所有数据库

sql

SHOW DATABASES;


4. 显示数据库中的表

sql

SHOW TABLES IN database_name;


5. 创建表

sql

CREATE TABLE IF NOT EXISTS table_name (


column_name column_type,


...


) ROW FORMAT DELIMITED


FIELDS TERMINATED BY 't'


STORED AS TEXTFILE;


6. 修改表结构

sql

ALTER TABLE table_name ADD COLUMNS (column_name column_type);


7. 删除表

sql

DROP TABLE IF EXISTS table_name;


8. 重命名表

sql

ALTER TABLE table_name RENAME TO new_table_name;


二、DML 命令

DML 命令用于插入、查询、更新和删除数据。

1. 插入数据

sql

LOAD DATA INPATH 'hdfs_path' INTO TABLE table_name;


2. 查询数据

sql

SELECT FROM table_name;


3. 更新数据

sql

UPDATE table_name SET column_name = value WHERE condition;


4. 删除数据

sql

DELETE FROM table_name WHERE condition;


三、运维命令

运维命令用于管理 Hive 的配置、元数据以及集群状态。

1. 设置 Hive 配置

sql

SET hive.exec.dynamic.partition=true;


2. 显示当前配置

sql

SHOW VARIABLES LIKE 'hive.';


3. 创建或删除元数据表

sql

CREATE TABLE IF NOT EXISTS meta_table (


...


) STORED AS ORC;


sql

DROP TABLE IF EXISTS meta_table;


4. 查看元数据表

sql

SHOW TABLES IN meta_database;


5. 查看集群状态

sql

SHOW CLUSTERS;


6. 查看当前用户

sql

SHOW CURRENT_USER;


四、总结

本文介绍了 Hive CLI 的常用命令,包括 DDL、DML 和运维命令。通过这些命令,用户可以轻松地创建、修改和删除数据库对象,以及进行数据操作和集群管理。熟练掌握这些命令对于使用 Hive 进行大数据分析至关重要。

五、扩展阅读

- [Hive 官方文档](https://cwiki.apache.org/confluence/display/Hive/LanguageManual)

- [Hive CLI 使用指南](https://www.tutorialspoint.com/hive/hive_cli_commands.htm)

- [Hive 元数据存储](https://www.cnblogs.com/pankx/p/6127985.html)

通过不断学习和实践,相信您将能够熟练运用 Hive CLI 进行大数据分析。