Hive CLI 常用命令速查表:DDL/DML/运维篇
Hive 是一个建立在 Hadoop 之上的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的 SQL 查询功能。Hive CLI 是与 Hive 交互的主要方式,通过命令行界面执行各种操作。本文将围绕 Hive CLI,提供一份DDL(数据定义语言)、DML(数据操作语言)以及运维相关的常用命令速查表,帮助用户快速掌握 Hive 的基本操作。
一、DDL 命令
DDL 命令用于创建、修改和删除数据库对象,如数据库、表、分区等。
1. 创建数据库
sql
CREATE DATABASE IF NOT EXISTS database_name;
2. 删除数据库
sql
DROP DATABASE IF EXISTS database_name;
3. 显示所有数据库
sql
SHOW DATABASES;
4. 显示数据库中的表
sql
SHOW TABLES IN database_name;
5. 创建表
sql
CREATE TABLE IF NOT EXISTS table_name (
column_name column_type,
...
) ROW FORMAT DELIMITED
FIELDS TERMINATED BY 't'
STORED AS TEXTFILE;
6. 修改表结构
sql
ALTER TABLE table_name ADD COLUMNS (column_name column_type);
7. 删除表
sql
DROP TABLE IF EXISTS table_name;
8. 重命名表
sql
ALTER TABLE table_name RENAME TO new_table_name;
二、DML 命令
DML 命令用于插入、查询、更新和删除数据。
1. 插入数据
sql
LOAD DATA INPATH 'hdfs_path' INTO TABLE table_name;
2. 查询数据
sql
SELECT FROM table_name;
3. 更新数据
sql
UPDATE table_name SET column_name = value WHERE condition;
4. 删除数据
sql
DELETE FROM table_name WHERE condition;
三、运维命令
运维命令用于管理 Hive 的配置、元数据以及集群状态。
1. 设置 Hive 配置
sql
SET hive.exec.dynamic.partition=true;
2. 显示当前配置
sql
SHOW VARIABLES LIKE 'hive.';
3. 创建或删除元数据表
sql
CREATE TABLE IF NOT EXISTS meta_table (
...
) STORED AS ORC;
sql
DROP TABLE IF EXISTS meta_table;
4. 查看元数据表
sql
SHOW TABLES IN meta_database;
5. 查看集群状态
sql
SHOW CLUSTERS;
6. 查看当前用户
sql
SHOW CURRENT_USER;
四、总结
本文介绍了 Hive CLI 的常用命令,包括 DDL、DML 和运维命令。通过这些命令,用户可以轻松地创建、修改和删除数据库对象,以及进行数据操作和集群管理。熟练掌握这些命令对于使用 Hive 进行大数据分析至关重要。
五、扩展阅读
- [Hive 官方文档](https://cwiki.apache.org/confluence/display/Hive/LanguageManual)
- [Hive CLI 使用指南](https://www.tutorialspoint.com/hive/hive_cli_commands.htm)
- [Hive 元数据存储](https://www.cnblogs.com/pankx/p/6127985.html)
通过不断学习和实践,相信您将能够熟练运用 Hive CLI 进行大数据分析。
Comments NOTHING