超越多顯卡多機器：分散式機器學習超速實戰書籍資訊、閱讀筆記、書籍評論與評分

購買商店

超越多顯卡多機器：分散式機器學習超速實戰

$790.00

內容描述

在Hadoo/Spark/Mahout/Tensorflow上跑多機器多片GPU的機器學習
機器學習在神經網路和GPU流行起來之後大放異彩，連販夫走足都CNN/RNN朗朗上口，然而許多企業/研究機關/學校在花了大筆預算購買昂貴的硬體時，卻不知如何採購，更不用說如何應用這些硬體來進行研發或產品開發了。本書作者是知名電商的創辦人，其不止在機器學習上有十足的實務經驗，在面對大量資料的場景下，更能利用前人的智慧，用上了Big Data最流行的Hadoop/Spark平台。尤有甚者，在新一代的AI函數庫面世時，也能充分利用這些函數庫的GPU加速，將多機器，多GPU的資源應用在大型專案上。
▌業界獨有
全書以Hadoop/Spark為基礎，加上使用了最流行的TensorFlow on Hadoop，更使用了分散式系統最老牌的Mahout，有別於一般只介紹Python/TensorFlow的坊間書籍，是市場上唯一僅有完整從Hadoop一直延伸到神經網路。
▌內容完整豐富
本書以分散式機器學習為主線，以實戰為主要目的。共分為8章，分別介紹網際網路公司巨量資料和人工智慧、巨量資料演算法系統架構、巨量資料基礎、Docker容器、Mahout分散式機器學習平台、Spark分散式機器學習平台、分散式深度學習實戰、完整工業級系統實戰（推薦演算法系統實戰、人臉辨識實戰、對話機器人實戰）等內容。
適合讀者
適合分散式機器學習的初學者閱讀，對於有一定經驗的分散式巨量資料方向的從業人員及演算法工程師，也可以從書中獲取很多有價值的知識，並透過實戰專案更佳地理解分散式機器學習的核心內容。

目錄大綱

第1 章網際網路公司巨量資料和人工智慧那些事
1.1 巨量資料和人工智慧在網際網路公司扮演的角色和重要性
1.2 巨量資料部門組織架構和各種職務介紹
第2 章巨量資料演算法系統架構
2.1 經典應用場景
2.2 應用系統架構設計
第3 章巨量資料基礎
3.1 Hadoop 巨量資料平台架設
3.2 Hive 資料倉儲實戰
3.3 HBase 實戰
3.4 Sqoop 資料ETL 工具實戰
3.5 Spark 基礎
第4 章 Docker 容器
4.1 Docker 介紹
4.2 Docker 容器部署
第5 章 Mahout 分散式機器學習平台
5.1 Mahout 採擷平台
5.2 Mahout 機器學習演算法
第6 章 Spark 分散式機器學習平台
6.1 Spark 機器學習函數庫
6.2 各個演算法介紹和程式設計實戰
第7 章分散式深度學習實戰
7.1 TensorFlow 深度學習框架
7.2 MXNet 深度學習框架
7.3 神經網路演算法
第8 章完整工業級系統實戰
8.1 推薦演算法系統實戰
8.2 人臉辨識實戰
8.3 對話機器人實戰
參考文獻

作者介紹

陳敬雷
充電了麼創始人。擁有十幾年互聯網從業經驗，在技術領域，尤其在大數據和人工智慧方向有豐富的演算法工程落地實戰經驗。目前專注於大數據和人工智慧驅動的上班族線上教育行業，研發了充電了麼App，用深度學習演算法、NLP、推薦引擎等技術來高效提升線上學習效率。

超越多顯卡多機器：分散式機器學習超速實戰

購買商店

超越多顯卡多機器：分散式機器學習超速實戰

$790.00

內容描述

目錄大綱

作者介紹

相關書籍

資料科學的統計實務 : 探索資料本質、扎實解讀數據，才是機器學習成功建模的第一步

Deep Learning in Computer Vision: Principles and Applications

Python 數據分析之道 (Thinking in Pandas: How to Use the Python Data Analysis Library the Right Way)