hadoop、hive和spark

1)HDFS分布式文件系统; 2)MapReduce计算引擎(基于进程,效率低); 3)YARN任务调度和集群资源管理工具; 1)MapReduce编程复杂; 2)HDFS上的文件缺少Schema,不方便操作; 1)使用类SQL(HQL)的...
阅读全文