分类 Python 下的文章

聚类算法之K-means


起步

所谓聚类( Clustering ),就是将相似的事物聚集在一 起,而将不相似的事物划分到不同的类别的过程,是数据分析之中十分重要的一种手段。与此前介绍的决策树,支持向量机不同的监督学习不同,聚类算法是非监督学习( unsupervised learning ),在数据集中,并不清楚具体的类别。


回归算法之非线性回归


起步

非线性回归是线性回归的延伸,线性就是每个变量的指数都是 1,而非线性就是至少有一个变量的指数不是 1。生活中,很多现象之间的关系往往不是线性关系。选择合适的曲线类型不是一件轻而易举的工作,主要依靠专业知识和经验。常用的曲线类型有 幂函数,指数函数,抛物线函数,对数函数和S型函数


神经网络NN算法(应用篇)


起步

在神经网络的理论篇中,神经元在对权重进行求和后,需要进行一个非线性转化,即作为参数传入激活函数去。这个激活函数是一个 S 型函数( Sigmoid )。

Image.png

虽然理论篇给了一个函数,但事实上,S 函数不是指某个函数,而是一类函数,那篇只是给了这类中的一个,S 函数详细可以看维基上的: https://zh.wikipedia.org/wiki/S函数 。下面有两个函数满足这样的S 函数:

  • 双曲函数( tanh );
  • 逻辑函数(logistic function