hadoop、hive和spark

1)HDFS分布式文件系统; 2)MapReduce计算引擎(基于进程,效率低); 3)YARN任务调度和集群资源管理工具; 1)MapReduce编程复杂; 2)HDFS上的文件缺少Schema,不...
阅读全文