騰訊分布式計算平台Angel1.0正式版是騰訊公司出品的機器學習高性能分布式計算平台,擁有非常快速的分布式計算能耐,具有廣泛的適用性,需要的用戶趕快來下載吧。
Angel 是一個基於參數服務器(Parameter Server)理念開發的高性能分布式機器學習平台,它基於騰訊內部的海量數據進行了反複的調優,並具有廣泛的適用性和穩定性,模型維度越高,優勢越明顯。Angel 由騰訊和北京大學聯合開發,兼顧了工業界的高可用性和學術界的創新性。
據介紹,Angel 是騰訊大數據部門發布的「第三代計算平台」,是由騰訊大數據與香港科技大學、北京大學聯合使用 Java 和 Scala 語言開發的麵向機器學習的高性能分布式計算框架。它采用了參數服務器架構,解決了上一代框架的擴展性問題,支持數據並行及模型並行的計算模式,能支持十億級別維度的模型訓練。
1.ParameterServer 功能
基於 Matrix/Vector 的模型自動切分和管理,兼顧稀疏和稠密兩種格式
支持對 Model 進行 Push 和 Pull 操作,可以自定義複雜的 psFunc
提供多種同步控製機製(BSP/SSP/ASP)
2. 開發運行
語言支持:係統基於 Scala 和 Java 開發,用戶也可以自由選擇
部署方便:可以直接在 Yarn 社區版本中運行,也支持本地調試模式
數據切分: 自動切分讀取訓練數據,默認兼容了 Hadoop FS 接口
增量訓練:訓練過程中會自動 Checkpoint,而且支持加載模型後,增量訓練
3.PS Service
隻啟動 PSServer 和 PSAngent,為其他分布式計算平台提供 PS 服務
基於 PS-Service,不需要修改 Spark 核心代碼,直接開發 Spark-on-Angel 算法,該模式無縫支持 Breeze 數值運算庫
4. 算法庫
集成 Logistic Regression,SVM,KMeans,LDA,MF,GBDT 等機器學習算法
多種優化方法,包括 ADMM,OWLQN,LBFGS 和 GD
支持多種損失函數、評估指標,包含 L1、L2 正則項
5. 算法優化
LDA 采用了 F+LDA 算法用於加速采樣的速度,同時利用流式參數獲取的方法減少網絡參數獲取的延遲
GBDT 使用兩階段樹分裂算法,將部分計算轉移到 PS,減少網絡傳輸,提升速度
140.5M / 09-05
76.4M / 03-25
55M / 06-05
237.9M / 04-13
900.9M / 03-02
96.2M / 07-06
311.2M / 07-06
335M / 07-06
200M / 07-06
413.8M / 07-06
484.7M / 09-27
165.4M / 09-05
353.9M / 06-05
131.8M / 04-13
195.6M / 03-03
45.6M / 09-08
665.2M / 07-06
2.84G / 07-06
93M / 07-06
338.3M / 07-06
1.38G / 07-26
488.3M / 07-16
109.8M / 06-03
142M / 01-08
1.2M / 11-23
548.8M / 04-13
1.6M / 04-13
1.48G / 03-18
646.6M / 03-03
133.7M / 03-03
110.5M / 09-05
33.4M / 09-05
325.8M / 08-12
60M / 04-29
254M / 04-25
659M / 04-23
1M / 12-26
253.4M / 12-08
253M / 12-08
1.19G / 11-16
369M / 09-22
181.5M / 09-22
201.2M / 09-05
488.3M / 07-16
248.9M / 12-08
248.9M / 12-08
100.6M / 03-06
148.9M / 03-06
1.12G / 07-06
1.25G / 07-06
1.76G / 09-22
1.92G / 04-17
116.2M / 04-10
201.5M / 04-13
7.31G / 07-01
94.3M / 07-06
2.48G / 07-06
7.63G / 07-06
1M / 07-06
778.1M / 07-06
561.8M / 07-11
72M / 07-06
548.7M / 07-06
1.00G / 07-06
9.13G / 07-06
126.2M / 07-06
72M / 07-06
105.1M / 07-06
132M / 07-06
132M / 07-06