flowchart

Sklearn 快速入门教程

Regression 回归

大致浏览一下回归:

考虑下面 == 如果样本的数据量 >= 100k

SGD Refressor（随机梯度下降）

考虑下面 == 如果样本的数据量 < 100k 并且少数特征是重要

Lasso 或 ElasticNet

Lasso 和 ElasticNet 项目案例

考虑下面 == 如果样本的数据量 < 100k 并且少数特征是不重要

ridge-regression 或 SVR(kernel='linear')

ridge-regression 项目案例

SVR(kernel='linear') 项目案例

考虑下面 == 如果无效

EnsembleRegressors 或 SVR(kernel='rbf')

EnsembleRegressors-RandomForestRegressor 项目案例

EnsembleRegressors-AdaBoostRegressor 项目案例

SVR(kernel='rbf') 项目案例

Classification 分类

大致浏览一下分类:

判断数据样本条数是否小于 100k， yes 的话，采用 Linear SVC

SVM 中 Linear SVC 的项目案例

如果上面的 Linear SVC 模型不 work

那么继续判断样本数据是否是文本数据

如果 yes，采用朴素贝叶斯模型 Naive Bayes 的项目案例
如果 no，采用 k-近邻分类算法 KNeighbors Classifier 的项目案例和 Nearest Neighbors regression 项目案例

如果 k-近邻算法不 work ,采用 SVC 或者 Ensemble Classifiers 算法

SVC 的项目案例
Ensemblle Classifiers 的项目案例分为了两部分来弄随机森林：面部补全和使用 AdaBoost 的决策树回归

回到最初的问题上，数据样本条数是否小于 100k, no 的话，采用 SGD Classifier 算法（随机梯度下降）

SGD Classifier 的项目案例

如果 SGD 不 work 的话，采用 kernel approximation

kernel approximation 的项目案例

Clustering 聚类

大致浏览一下聚类：

Dimensionality Reduction 降维

大致浏览一下降维：

Randomized PCA

Randomized PCA 项目案例

考虑下面 == 无效并且如果样本的数据量 < 10k

Isomap 或 Spectral Embedding

考虑下面 == 无效并且如果样本的数据量 >= 10k

Kernel Approximation

考虑下面 == 无效并且无效

Name		Name	Last commit message	Last commit date
parent directory ..
images		images
src/regression		src/regression
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Files

flowchart

flowchart

README.md

Sklearn 快速入门教程

Regression 回归

SGD Refressor（随机梯度下降）

Lasso 或 ElasticNet

ridge-regression 或 SVR(kernel='linear')

EnsembleRegressors 或 SVR(kernel='rbf')

Classification 分类

Clustering 聚类

Dimensionality Reduction 降维

Randomized PCA

Isomap 或 Spectral Embedding

Kernel Approximation

LLE

Files

flowchart

Directory actions

More options

Directory actions

More options

Latest commit

History

flowchart

Folders and files

parent directory

README.md

Sklearn 快速入门教程

Regression 回归

SGD Refressor（随机梯度下降）

Lasso 或 ElasticNet

ridge-regression 或 SVR(kernel='linear')

EnsembleRegressors 或 SVR(kernel='rbf')

Classification 分类

Clustering 聚类

Dimensionality Reduction 降维

Randomized PCA

Isomap 或 Spectral Embedding

Kernel Approximation

LLE