2021-05-12 14:32:11
Mahout原始碼目錄說明
在Mahout實現的機器學習演算法見下表
演算法類 |
演算法名 |
中文名 |
分類演算法 |
Logistic Regression |
邏輯回歸 |
Bayesian |
貝葉斯 |
|
SVM |
支援向量機 |
|
Perceptron |
感知器演算法 |
|
Neural Network |
神經網路 |
|
Random Forests |
隨機森林 |
|
Restricted Boltzmann Machines |
有限波爾茲曼機 |
|
聚類演算法 |
Canopy Clustering |
Canopy聚類 |
K-means Clustering |
K均值演算法 |
|
Fuzzy K-means |
模糊K均值 |
|
Expectation Maximization |
EM聚類(期望最大化聚類) |
|
Mean Shift Clustering |
均值漂移聚類 |
|
Hierarchical Clustering |
層次聚類 |
|
Dirichlet Process Clustering |
狄里克雷過程聚類 |
|
Latent Dirichlet Allocation |
LDA聚類 |
|
Spectral Clustering |
譜聚類 |
|
關聯規則挖掘 |
Parallel FP Growth Algorithm |
並行FP Growth演算法 |
回歸 |
Locally Weighted Linear Regression |
區域性加權線性回歸 |
降維/維約簡 |
Singular Value Decomposition |
奇異值分解 |
Principal Components Analysis |
主成分分析 |
|
Independent Component Analysis |
獨立成分分析 |
|
Gaussian Discriminative Analysis |
高斯判別分析 |
|
進化演算法 |
並行化了Watchmaker框架 |
|
推薦/協同過濾 |
Non-distributed recommenders |
Taste(UserCF, ItemCF, SlopeOne) |
Distributed Recommenders |
ItemCF |
|
向量相似度計算 |
RowSimilarityJob |
計算列間相似度 |
VectorDistanceJob |
計算向量間距離 |
|
非Map-Reduce演算法 |
Hidden Markov Models |
隱馬爾科夫模型 |
集合方法擴充套件 |
Collections |
擴充套件了java的Collections類 |
Mahout最大的優點就是基於hadoop實現,把很多以前執行於單機上的演算法,轉化為了MapReduce模式,這樣大大提升了演算法可處理的資料量和處理效能。
本文永久更新連結地址:http://www.linuxidc.com/Linux/2017-04/143208.htm
相關文章