本书是通俗易懂的大数据算法教程。通篇采用师生对话的形式,旨在用通俗的语言、轻松的气氛,帮助读者理解大数据计算领域中的基础算法和思想。本书由背景篇、理论篇、应用篇和实践篇四部分组成。背景篇介绍大数据、算法、大数据算法等基本概念和背景;理论篇介绍解决大数据问题的亚线性算法、磁盘算法、并行算法、众包算法的基本思想和理论知识;应用篇介绍与大数据问题息息相关的数据挖掘和推荐系统的相关知识;实践篇从实际应用出发,引导读者动手操作,帮助读者通过实际程序和实验验证磁盘算法、并行算法和众包算法。在讲解每一个大数据问题之前,本书都会介绍大量的经典算法和基础数据结构知识,不仅可以帮助学习过数据结构与算法、算法设计与分析等课程的同学复习,同时能够让入门的“小菜鸟”们,不会因为没有学习过经典算法而对本书望而却步,轻松地掌握大数据算法!
王宏志 林可(零基础学大数据算法)
作者博士毕业以来一直哈尔滨工业大学计算机学院任职,根据2012年教育部学科评估,该学科排名第4。王博士现任软件与理论学科副教授,博士生导师。发表论文100余篇,出版学术专著《XML查询处理》和英文专著《Innovative Techniques and Applications of Entity Resolution》,撰写3篇专著章节,拥有3项软件著作权,完成经典教材《算法导论(第三版)》最后5章的翻译,其论文被SCI/EI检索60余次,引用300余次,其中5篇论文发表于**国际会议上。获得微软学者(亚太地区40人获奖)、中国优秀数据库工程师(全国10人获奖)、IBM博士英才(大中华区8人获奖)等称号,“海量数据计算的理论和技术”获得黑龙江省自然科学奖1项,其博士论文“XML数据查询处理技术的研究”获得哈尔滨工业大学优秀博士论文和中国计算机学会优秀博士论文。其在2014年与慕课网开设《大数据算法》课程,这是国内首次公开开设与大数据算法相关的课程,迄今已经有超过2万人选课。其2008年在国际**会议VLDB上发表的论文是2000年