在Hadoo/Spark/Mahout/Tensorflow上跑多機器多片GPU的機器學習
機器學習在神經網路和GPU流行起來之後大放異彩,連販夫走足都CNN/RNN朗朗上口,然而許多企業/研究機關/學校在花瞭大筆預算購買昂貴的硬體時,卻不知如何採購,更不用說如何應用這些硬體來進行研發或產品開發瞭。本書作者是知名電商的創辦人,其不止在機器學習上有十足的實務經驗,在麵對大量資料的場景下,更能利用前人的智慧,用上瞭Big Data最流行的Hadoop/Spark平颱。尤有甚者,在新一代的AI函數庫麵世時,也能充分利用這些函數庫的GPU加速,將多機器,多GPU的資源應用在大型專案上。
▌業界獨有
全書以Hadoop/Spark為基礎,加上使用瞭最流行的TensorFlow on Hadoop,更使用瞭分散式係統最老牌的Mahout,有別於一般隻介紹Python/TensorFlow的坊間書籍,是市場上唯一僅有完整從Hadoop一直延伸到神經網路。
▌內容完整豐富
本書以分散式機器學習為主線,以實戰為主要目的。共分為8章,分別介紹網際網路公司巨量資料和人工智慧、巨量資料演算法係統架構、巨量資料基礎、Docker容器、Mahout分散式機器學習平颱、Spark分散式機器學習平颱、分散式深度學習實戰、完整工業級係統實戰(推薦演算法係統實戰、人臉辨識實戰、對話機器人實戰)等內容。
適閤讀者
適閤分散式機器學習的初學者閱讀,對於有一定經驗的分散式巨量資料方嚮的從業人員及演算法工程師,也可以從書中獲取很多有價值的知識,並透過實戰專案更佳地理解分散式機器學習的核心內容。