IP属地广东

机器学习-实用案例解析

价格	￥69.00对比
发货	广东东莞市
销量	暂无
评价	已有 0 条评价
人气	已有 2 人关注
数量	+- 库存100本

联系方式

加关注0

新图书资料发布

VIP会员第1年

资料未认证

保证金未缴纳

广东-东莞市
上次登录 08-03 08:45 •
图书 (先生)

进入主页更多商品

商品详情
评价详情(0)

内容简介

当今各行业，尤其是互联网，数据规模越来越大，要从中有效地发现模式来提高生产力，用传统的方式已经几乎不可能，只能借助计算机来完成诸多使命。因此，机器学习这一新兴的学科变得越来越重要，它已经在搜索、、数据挖掘等多个领域闪耀光芒。机器学习是一门交叉学科，内容涉及概率论、统计学、高等数学、计算机科学等多门学科。该学科致力于设计一种让计算机具有“学习”能力的算法，通过发现经验数据中隐藏的模式，实现对未知数据的预测。
　　大数据时代是机器学习好的时代，因为数据不再是问题，各类问题都可以收集到海量的数据。但是，对于很多人来说，这一门交叉学科本身却神秘而陌生，对于没有系统学习过相关基础学科的人来说尤其感到“高不可攀”。如今已出版的机器学习相关书籍中，很多都有这个特点：公式多，晦涩难懂。这让很多程序员出身的人望而却步。然而，在第一次读到本书的英文版时，译者就相信：机器学习可以讲解得通俗易懂，让知识的传递实现“润物细无声”。
　　本书秉承的原则是：实践出真知，只要多动手，没有攻克不了的技术难题。因此作者预期的阅读对象是如电脑黑客般的人，要求对技术有发自内心的求知欲和好奇心，愿意自己动手而非纸上谈兵。全书精心选择了12个机器学习案例，由浅入深，面面俱到，既有基础知识（如数据分析），也有当前热门的社交网站案例。书中的每一个案例都由作者娓娓道来，逐一剖析关键算法的代码，没有丝毫学究气息，触动每个机器学习初学者的内心处。
　　书中所有算法都采用R语言实现。R语言是一门用于统计学的开源脚本语言，基于它的开源性，有来自世界各地的开源拥护者贡献的各种统计学相关的程序包，稳定且方便，尤其是它对数据可视化的支持，更是一柄利器，既轻巧又实用。书中所有源代码和数据在原书的官方网站上都可以免费下载。在阅读过程中，犹如作者亲至身侧，为你讲解代码和思路，为你排除错误和优化效果。
　　全书案例既有分类问题，也有回归问题；既包含监督学习，也涵盖无监督学习。所选择的案例妙趣横生，如分析UFO目击记录、破译密码、预测股票、分析美国参议员“结党”的情况，等等，这里就不“剧透”了，大家自己去享受学习的乐趣吧。
　　书中12个案例之间的依赖关系不是强（除R语言基础知识外，其余某几章仅有个别知识点之间存在依赖性），可以像连续剧一样，逐一播放，也可以像一个个小品一般，挑感兴趣的内容分别播放。学习完这些案例之后，相信你会窥见机器学习的一斑，然后再根据自己的实际情况更深入地学习。
　　本书翻译工作由三位来自互联网世界的工程师通力协作完成，其中，来自新浪微博的陈开江负责完成前言及第1～4章的翻译；来自阿里B2B的刘逸哲负责完成第5、8、9和11章的翻译；来自阿里一淘的孟晓楠负责完成第6、7、10和12章的翻译；同时，全书审校工作由来自北京理工大学的罗森林教授义务承担。
　　本书能够得以出版，先要感谢机械工业出版社的吴怡编辑，是她给了我们三位工程师这个学习知识并传递知识的机会，她经验丰富，在翻译过程中给予了我们许多建设性的指导意见。其次，要感谢罗森林教授，他在百忙之中为我们担任全书的审校工作，从而让国内的机器学习者能感受到这本书应有的魅力。，我们要感谢互联网，因为译者与本书的缘分始于互联网，从看到原书、报名翻译、组成翻译团队、翻译过程中的讨论，所有这样都是通过互联网完成的。
　　虽然经过罗森林教授认真审校并且给我们提出了宝贵意见，但是由于译者本身水平有限，书中译文势必还存在不妥甚至错误之处，恳请机器学习界的广大前辈、同仁们不吝赐教，促使我们继续为

前言
第1章使用R语言
　R与机器学习
第2章数据分析
　分析与验证
　什么是数据
　推断数据的类型
　推断数据的含义
　数值摘要表
　均值、中位数、众数
　分位数
　标准差和方差
　可视化分析数据
　列相关的可视化
第3章分类：垃圾过滤
　非此即彼：二分类
　漫谈条件概率
　试写第一个贝叶斯垃圾分类器
第4章排序：智能收件箱
　次序未知时该如何排序
　按优先级给邮件排序
　实现一个智能收件箱
第5章回归模型：预测网页访问量
　回归模型简介
　预测网页流量
　定义相关性
第6章正则化：文本回归
　数据列之间的非线性关系：超越直线
　避免过拟合的方法
　文本回归
第7章优化：密码破译
　优化简介
　岭回归
　密码破译优化问题
第8章 PCA：构建股票市场指数
　无监督学习
　主成分分析
第9章 MDS：可视化地研究参议员相似性
　基于相似性聚类
　如何对美国参议员做聚类
第10章 kNN：系统
　k近邻算法
　R语言程序包安装数据
第11章分析社交图谱
　社交网络分析
　用黑客的方法研究Twitter的社交关系图数据
　分析Twitter社交网络
第12章模型比较
　SVM：支持向量机
　算法比较
　参考文献

点赞 0举报收藏 0

机器学习-实用案例解析

新图书资料发布

内容简介

目录