网络机器人吧社区

【好书共享】机器学习入门

生信技能树 2019-01-10 13:07:06

为什么要学机器学习

2016年的时候,机器学习就很火,那时候我也跟风下载吴恩达老师的视频,买了西瓜书。但是我并没有看,因为不知道学来用什么。随着自己的博文渐渐能够被大家检索到,我认识了一些做算法开发的小伙伴,他们都学习得非常好,演林师弟已经发表了一篇宏基因组分类相关的算法文章了,现在在做第二个算法开发。并且做这项工作并不需要经费、数据和其他人合作。目的是功利的,但是也是生物信息方面的继续深入学习,生信光用软件分析数据来解决问题也是很棒的,但是自己懂算法会造工具用自己的方法来解决自己的问题,那样在未来的发展会更好。即使我未来补从事科学研究,我也比较想往数据挖掘方面转。洲更买了私人定制的数据分析课程,我看了课程表就有机器学习,所以学习机器学习是百利无一害的,前提是我要保证自己在实验室工作的顺利进展,两方面同时开展。后来除了看西瓜书以外,我还看了莫烦小哥的机器学习视频:https://morvanzhou.github.io/,还专门写过scikit-learn的学习笔记。

好啦,机器学习的学习热度仍然不减,Panda姐实验室的老板最近对DL颇感兴趣,还专门花了5万块钱买GPU的工作站。所以趁着图灵社区友情赞助,Panda姐挑了几本书学习,现在推荐给大家。

入门书籍推荐

R

Mastering Machine Learning with R, Second Edition

《精通机器学习:基于R(第2版)》

 

  • 利用 R 包轻松应用机器学习方法 

  • 展示各类机器学习方法的优势与潜在问题 

  • 技术与理论并重,通过丰富的商业案例实现机器学习高级概念

  • 在 AWS 等云平台上利用 R 亲手实践机器学习

 

机器学习是近年来的热门技术话题,R 语言是处理其中大量数据的有力工具。

本书为读者提供机器学习和 R 语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高级选择特性、K最近邻和支持向量机等,力图平衡实践中的技术和理论两方面。 

Python

Introduction to Machine Learning with Python

《Python机器学习基础教程》

 

  • 使用 Python 和 scikit-learn 库一步一步构建一个有效的机器学习应用

  • 培养自己动手构建机器学习解决方案的能力

  • scikit-learn 库核心贡献者作品

 

本书主要内容包括:

  • 机器学习的基本概念及其应用;

  • 实践中最常用的机器学习算法以及这些算法的优缺点;

  • 在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;

  • 模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;

  • 管道的概念;

  • 如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。 

《Python机器学习基础教程》是图灵今年出版的非常受欢迎的 Python 机器学习入门书,这本书的特色依然是着重讨论机器学习算法的实践,涵盖在实践中实现机器学习算法的所有重要内容。

Machine Learning in Action

《机器学习实战》


  • 通过实战入门机器学习畅销经典

  • 介绍并实现机器学习的主流算法

  • 面向日常任务的高效实战内容

  • 可将数学矩阵描述的机器学习算法转化为可以实际工作的应用程序


全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用 Python 代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

《机器学习实战》是图灵最受读者欢迎的一本机器学习图书,也是机器学习领域的经典参考书。完全零基础的小伙伴阅读这本书会吃力,这本书的理论基础内容相对薄弱,涉及数学部分的知识也做到了尽量简单,它的特色是让你可以使用最基本的 Python 语法,通过实战快速上手机器学习,并能实现常见的应用,比如邮件过滤、数据分类等。这本书应该是用Python2.7来实现的(但现在大家用的比较多是Python3.6,所以在实现的时候要自己改写实现),较前面两本书的不同之处就是它不是用包装好的模块或者包里的函数,而是自己用代码来实现机器学习的各个主流算法。

写在最后

至于具体要购买哪一本,还需要做更深入的比较,比如你个人的阅读需求、知识储备,图书本身的讲解风格,等等,都是非常关键的考量因素。说到底,不管是多么权威的作者写的书,多么权威的推荐者给出的推荐,之于你,都是备选和参考。明智的做法当然是从自身需求出发,去严肃认真地试读 1- 2章的内容,仔细查看图书目录,跟自己打算掌握的知识框架对比,这样才可能从琳琅满目的备选中取最适合当前自己需要的那一瓢饮。


往期赠送:

【好书分享】《R语言实战(第2版)》

【好书分享】Python从入门到进阶

【好书共享】Linux命令行与shell脚本编程,你会了么


评论赠书

读者可从老规矩,分享一下你为什么要学习机器学习,然后想要获得哪本赠书!(Panda姐将精选评论挑选 4~6 位赠出)

Copyright © 网络机器人吧社区@2017