Python科学计算之Scipy


起步

SciPy 库建立在 Numpy 库之上,提供了大量科学算法,例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等,主要包括这些主题:

  • 特殊函数 (scipy.special)
  • 积分 (scipy.integrate)
  • 最优化 (scipy.optimize)
  • 插值 (scipy.interpolate)
  • 傅立叶变换 (scipy.fftpack)
  • 信号处理 (scipy.signal)
  • 线性代数 (scipy.linalg)
  • 稀疏特征值 (scipy.sparse)
  • 统计 (scipy.stats)
  • 多维图像处理 (scipy.ndimage)
  • 文件 IO (scipy.io)


[译]机器学习分类


起步

在这篇文章中,我们将介绍最流行的机器学习算法。

在场中浏览主要算法以获得可用的方法的感觉是有用的。

有很多算法可用,当算法名称被抛出时,它可以感觉压倒性,你希望只知道它们是什么,它们适合的地方。

我想给你两种方法来思考和分类你可能在现场遇到的算法。


scikit-learn 机器学习


起步

scikit-learn 是一个比较流行的开源机器学习库。它支持许多分类,回归,聚类算法,包括支持向量机,逻辑回归,朴素贝叶斯,随机森林,梯度boosting,k-means 和 DBSCAN,并且可以与 Numpy 与 SciPy 库进行交互。

本文参考: http://www.scipy-lectures.org/packages/scikit-learn/index.html http://scikit-learn.org/stable/tutorial/basic/tutorial.html

scikit-learn的基本功能主要被分为六个部分,分类,回归,聚类,数据降维,模型选择,数据预处理,具体可以参考官方网站上的文档。


Python科学计算之Pandas


起步

Pandas 是 python 的一个数据分析包,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此 pandas 为时间序列分析提供了很好的支持。 Pandas 的名称来自于面板数据(panel data)和python数据分析 (data analysis) 。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。

在我看来,对于 Numpy 以及 MatplotlibPandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy当然是另一个主要的也十分出色的科学计算库。