大家好,spark跟hive功能特点不同,spark主要用于实时处理,hive主要做离线查询,不存在替不替代问题。
spark是基于内存的计算框架,特点是效率快,Spark的核心组件是core,SparkSql,SparkStreaming和MLlib。
Hive是基于hdfs存储的数据仓库(非数据库),在Hadoop中用来处理结构化数据。,底层功能是编辑hql来解析MapReduce运行。开发人员可以编写sql语句转化为MapReduce任务运行,它是用来开发SQL类型脚本用于做MapReduce操作的平台。
回到顶部