Impala命令使用手册

mac2025-05-05 15

什么是Impala？

用于处理存储在Hadoop集群中的大量数据的大规模并行处理sql查询引擎，提供高性能和低延迟，提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。

Impala安装

http://www.dba.cn/book/impala/IMPALAJiaoCheng/IMPALAHuanJing.html

Impala Shell

使用Impala-shell进入命令行界面

数据库操作

创建数据库

create database if not exists databaseName;

删除数据库

drop database if exists databaseName;

选择数据库

use databaseName;

显示所有数据库

show databases;

表操作

创建表

create table if not exists databaseName.tableName ( column1 dataType, column2 dataType, column3 dataType, … columnN dataType );

插入记录

insert into tableName (column1, column2, column3, …columnN) values (value1, value2, value3, …valueN);

查询记录

select column1, column2, columnN from tableName;

查看表的信息

describe tableName;

更改表名

alter table [oldDBName.]oldTableName rename to [newDBName.]newTableName;

表中添加列

alter table tableName add columns ( column1 dataType, column2 dataType, … columnN dataType );

表中删除列

alter table tableName drop columnName;

更改表中列的名称和类型

alter table tableName change oldColumnName newColumnName newDataType;

删除表

drop table if exists databaseName.tableName;

截断表(删除所有表数据)

truncate tableName;

显示所有表

show tables;

视图操作

创建视图

create view if not exists viewName as select statement;

更改视图

alter view dataBaseName.viewName as select statement;

删除视图

drop view dataBaseName.viewName;

其他操作

数据排序（升序-asc，降序-desc）

select * from tableName order by colName [ASC|DESC] [NULLS FIRST|NULLS LAST];

组查询

select data from tableName group by colName;

过滤查询（having常与group by一起使用）

select data from tableName group by colName having 过滤条件;

结果集行数限制（numExpression为限制行数）

select * from tableName limit numExpression;

结果集偏移（offset=3,即结果集从第3行开始输出）

select * from tableName limit 5 offset 3;

结果集组合

query1 union query2;

结果集定义别名（将select 1的结果集定义为别名x）

with x as (select 1)

去除重复记录

select distinct data from tableName;

最新回复(0)