超越多顯卡多機器:分散式機器學習超速實戰

超越多顯卡多機器:分散式機器學習超速實戰

作者: 陳敬雷
出版社: 深智數位
出版在: 2021-11-20
ISBN-13: 9789860776546
ISBN-10: 9860776547
裝訂格式: 平裝
總頁數: 616 頁





內容描述


在Hadoo/Spark/Mahout/Tensorflow上跑多機器多片GPU的機器學習
機器學習在神經網路和GPU流行起來之後大放異彩,連販夫走足都CNN/RNN朗朗上口,然而許多企業/研究機關/學校在花了大筆預算購買昂貴的硬體時,卻不知如何採購,更不用說如何應用這些硬體來進行研發或產品開發了。本書作者是知名電商的創辦人,其不止在機器學習上有十足的實務經驗,在面對大量資料的場景下,更能利用前人的智慧,用上了Big Data最流行的Hadoop/Spark平台。尤有甚者,在新一代的AI函數庫面世時,也能充分利用這些函數庫的GPU加速,將多機器,多GPU的資源應用在大型專案上。
▌業界獨有
全書以Hadoop/Spark為基礎,加上使用了最流行的TensorFlow on Hadoop,更使用了分散式系統最老牌的Mahout,有別於一般只介紹Python/TensorFlow的坊間書籍,是市場上唯一僅有完整從Hadoop一直延伸到神經網路。
▌內容完整豐富
本書以分散式機器學習為主線,以實戰為主要目的。共分為8章,分別介紹網際網路公司巨量資料和人工智慧、巨量資料演算法系統架構、巨量資料基礎、Docker容器、Mahout分散式機器學習平台、Spark分散式機器學習平台、分散式深度學習實戰、完整工業級系統實戰(推薦演算法系統實戰、人臉辨識實戰、對話機器人實戰)等內容。
適合讀者
適合分散式機器學習的初學者閱讀,對於有一定經驗的分散式巨量資料方向的從業人員及演算法工程師,也可以從書中獲取很多有價值的知識,並透過實戰專案更佳地理解分散式機器學習的核心內容。


目錄大綱


第1 章 網際網路公司巨量資料和人工智慧那些事
1.1 巨量資料和人工智慧在網際網路公司扮演的角色和重要性
1.2 巨量資料部門組織架構和各種職務介紹 
第2 章 巨量資料演算法系統架構
2.1 經典應用場景
2.2 應用系統架構設計
第3 章 巨量資料基礎
3.1 Hadoop 巨量資料平台架設
3.2 Hive 資料倉儲實戰
3.3 HBase 實戰
3.4 Sqoop 資料ETL 工具實戰
3.5 Spark 基礎
第4 章 Docker 容器
4.1 Docker 介紹
4.2 Docker 容器部署
第5 章 Mahout 分散式機器學習平台
5.1 Mahout 採擷平台
5.2 Mahout 機器學習演算法
第6 章 Spark 分散式機器學習平台
6.1 Spark 機器學習函數庫
6.2 各個演算法介紹和程式設計實戰
第7 章 分散式深度學習實戰
7.1 TensorFlow 深度學習框架
7.2 MXNet 深度學習框架
7.3 神經網路演算法
第8 章 完整工業級系統實戰
8.1 推薦演算法系統實戰
8.2 人臉辨識實戰
8.3 對話機器人實戰
參考文獻


作者介紹


陳敬雷
充電了麼創始人。擁有十幾年互聯網從業經驗,在技術領域,尤其在大數據和人工智慧方向有豐富的演算法工程落地實戰經驗。目前專注於大數據和人工智慧驅動的上班族線上教育行業,研發了充電了麼App,用深度學習演算法、NLP、推薦引擎等技術來高效提升線上學習效率。




相關書籍

資料科學的統計實務 : 探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步

作者 江崎貴裕 温政堯 譯;施威銘研究室 監修

2021-11-20

Deep Learning in Computer Vision: Principles and Applications

作者 Hassaballah Mahmoud Awad Ali Ismail

2021-11-20

Python 數據分析之道 (Thinking in Pandas: How to Use the Python Data Analysis Library the Right Way)

作者 Hannah Stepanek 譯者 周書鋒 連曉峰

2021-11-20