本课程由黑马程序员提供。
Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。 它是一个用C ++和Java编写的开源软件。 与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。Impala通过使用标准组件(如HDFS,HBase,Metastore,YARN和Sentry)将传统分析数据库的SQL支持和多用户性能与Hadoop的可扩展性和灵活性相结合。
本课程讲解了大数据分布式计算的发展及Impala的应用场景,对比Hive、MapReduce、Spark等类似框架讲解了内存式计算原理,以及如何基于Impala构建高性能交互式SQL分析平台。