代码托管地址:GitHubImpala是由Cloudera开发的一款开源的大规模并行处理(MPP)查询引擎。与Hive相同的元数据、SQL语法、ODBC驱动程序和用户界面(HueBeeswax)可以直接在HDFS或HBase上提供快速和交互式的SQL查询。Impala是在Dremel的启发下开发的,第一个版本于2012年底发布。Impala不再使用缓慢的Hive+MapReduce批处理,而是使用分布式查询引擎(由三部分组成:QueryPlanner、QueryCoordinator和QueryExecEngine)类似于商业并行关系数据库中使用的引擎,可以直接从HDFS或HBase中查询数据,具有SELECT、JOIN和统计功能,大大降低了延迟。
