- ISBN编号: (咨询特价)
商品基本信息,请以下列介绍为准 | |
商品名称: | Hadoop权威指南(第3版,修订版) |
作者: | |
译者: | 东师范大学数据科学与工程学院 |
市场价: | (咨询特价) |
ISBN号: | (咨询特价) |
出版社: | 清华大学出版社 |
商品类型: | 图书 |
其他参考信息(以实物为准) | ||
装帧:平装 | 开本:B5 | 语种:中文 |
出版时间:(咨询特价)-01 | 版次:1 | 页数:679 |
印刷时间:(咨询特价)-01 | 印次:1 | 字数:(咨询特价)千字 |
目录 | |
第1章 初识Hadoop 1 1.1 数据!数据! 1 1.2 数据的存储与分析 3 1.3 相较于其他系统的优势 4 1.3.1 关系型数据库管理系统 5 1.3.2 网格计算 7 1.3.3 志愿计算 9 1.4 Hadoop发展简史 10 1.5 Apache Hadoop和Hadoop生态系统 14 1.6 Hadoop的发行版本 15 1.6.1 本含的内容 16 1.6.2 兼容性 17 第2章 关于MapReduce 19 2.1 气象数据集 19 2.2 使用Unix工具来分析数据 21 2.3 使用Hadoop来分析数据 23 2.3.1 map和reduce 23 2.3.2 Java MapReduce 24 2.4 横向扩展 33 2.4.1 数据流 34 2.4.2 combiner函数 37 2.4.3 运行分布式的MapReduce作业 39 2.5 Hadoop Streaming 40 2.5.1 Ruby版本 40 2.5.2 Python版本 43 2.6 Hadoop Pipes 44 第3章 Hadoop分布式文件系统 49 …… |
初识Hadoop 在古时候,人们用牛来拉重物。当一头牛拉不动一根圆木时,人们从来没有考慢要培育更强壮的牛。同理,我们也不该想方设法打造超级计算机,而应该千方百计综合利用更多计算机来解决问题。 ——格蕾斯·霍珀(Grace Hopper) 1.1 数据!数据! 我们生活在这个数据大炸的时代,很难估算全球电子设备中存储的数据总共有多少。国际数据公司(IDC)曾经发布报告称,2006年数字世界(digital universe)项目统计得出全球数据总量为0.18 ZB并预测在2011年将达到1.8 ZB。 1 ZB等于1021字节,等于1000 EB(exabytes),1 000 000 PB (petabytes),等于大家更熟悉的10亿TB(terrabytes)!这相当于全世界每人一个硬盘中保存的数据总量! 数据“洪流”有很多来源。以下面列出的为例: l 纽约证交所每天产生的交易数据多达1 TB ...... |
内容简介 | |
准备好释放数据的强大潜能了吗?借助于这本《Hadoop权威指南》,你将学习如何使用Apache Hadoop构建和维护稳定性高、伸缩性强的分布式系统。本书是为程序员写的,可帮助他们分析任何大小的数据集。本书同时也是为管理员写的,帮助他们了解如何设置和运行Hadoop集群。本书通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的最新动态,包括新增的MapReduce API,以及MapReduce 2及其灵活性更强的执行模型(YARN)。 |
作者简介 | |
Tom White,数学王子&Hadoop专家。身为Apache Hadoop提交者八年之久,Apache软件基金会成员之一。全球知名云计算公司Cloudera的软件工程师。Tom拥有英国桥大学数学学士学位和利兹大学科学哲学硕士学位。 |