本书分为两个部分,共12章。第1章到第5章介绍了大数据的本体论、机器学习的基本理...
3天前 9 10

MapReduce作为一种分布式海量数据处理的编程框架,已经得到业界的广泛关注。随着Ha...
3天前 9 10

通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了...
3天前 8 10

本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Ha...
3天前 9 10

Holden Karau是Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速...
4天前 8 10

Kafka Streams是Kafka提供的一个用于构建流式处理程序的Java库,它与Storm、Spark...
4天前 11 10

大数据时代,MapReduce的重要性不言而喻。Hadoop作为MapReduce框架的一个实现,受...
5天前 13 10

Hadoop和云服务出现的历史背景,以及何时适用Hadoop的背景知识 安装并配置Hadoop集...
5天前 17 10

《Pig编程指南》不仅为初学者讲解ApachePig的基础知识,同时也向有一定使用经验的...
5天前 21 10
没有账号?注册  忘记密码?