网络机器人吧社区

学习机器学习有哪些好工具推荐呢?

大数据技术 2019-02-10 15:53:21

来自:知乎.

链接:http://www.zhihu.com/question/20472776

问题:请问学习机器学习有哪些好工具推荐呢?


回答者:肖智博,做过几个项目


竟然没有人提scikit.learn !!!!!!!!!!


震惊过后好好说话吧,其实语言什么的都不是主要的。


首先推荐一个大而全的网站 http://mloss.org,这个网站搜集了非常多的机器学习包,几乎涵盖了你听过的所有语言。


如果你是用python的话,那么numpy, scipy, matplotlib是基础的,然后就是大名鼎鼎的scikit.learn了。最近pandas也很火,可以提供类似R中dataframe的数据结构,pandas的作者 最近出版了一本书 Python for Data Analysis。


如果你想追求速度,那么可以考虑Cython和PyPy。


Anyhow,Python是一门很灵活的语言,很多基于C和C++的包也提供了python接口(比如shogun)


回答者:林淼,应用架构师


我是主推Python系的机器学习工具链的。主要的理由是:


1.现在的研究热点大都用Python实现。


2.Python可以编译到C(通过Cython),所以可以很好的保护源码。相对于Java的混淆字节码来说,编译到C之后的Python源码几乎不可能被分析。


3.Python是免费的,虽然用起来比matlab要麻烦。但是有开源社区的支持,包括最近公布的numbapro可以把Python JIT到CUDA/GPU平台运行。极大的简化了性能优化的工作。


4.Python在Linux集群上可以跑,但是matlab貌似是不行的。


回答者:李殷皓,还没有入门的数据狗


统计学出身的话,推荐R,免费开源,包数量多,社区强大。有本书叫mahine learning for hackers用的就是R。


回答者:zywang,Software Engineer


上面说的都是一些应用起来比较方便的工具,并不适合所有的初学者。如果你的目的是应用现成的工具,那还可以。如是你需要进一步了解算法,以后可能会定制适合自己的问题的算法,那就要找一些简单的开源软件,看一下别人是什么实现一个算法的。


回答者:马泽锋,做一名具有硅谷气质的工程师


一站式解决方案


好评:scikit-learn, weka

差评:mahout,不解释


平常做调研用的一些工具


推荐系统:svd-feature
分类/回归问题:liblinear, libsvm


liblinear适用于大数据集,注重训练效率,不支持kernel trick。


来自:知乎.

链接:http://www.zhihu.com/question/20472776



●本文编号6,以后想阅读这篇文章直接输入6即可。

●输入m可以获取到全部文章目录



Copyright © 网络机器人吧社区@2017