 我們在這篇文章中推薦了10本學(xué)習(xí)機器學(xué)習(xí)和數(shù)據(jù)科學(xué)的書,讓你的秋季閱讀計劃順利揚帆起航。 關(guān)鍵詞:Books, Data Science, ebook, Free ebook, Machine Learning 還有什么比免費的機器學(xué)習(xí)和數(shù)據(jù)科學(xué)讀物更適合用來享受秋天的呢? 下面的書單中從統(tǒng)計學(xué)基礎(chǔ)知識,到機器學(xué)習(xí)的基本概念,再到更重點的大框架內(nèi)容,對于高深的話題也有所涉獵,最后以一本總結(jié)性的書結(jié)尾。既有經(jīng)典名著,也有當(dāng)代的作品,希望你能在其中找到一些有趣的新內(nèi)容。  1 用統(tǒng)計學(xué)的方式思考 Think Stats: Probability and Statistics for Programmers 作者:Allen B. Downey 《用統(tǒng)計學(xué)的方式思考》是為python的程序員設(shè)計的一本概率論和數(shù)理統(tǒng)計知識的入門書籍。 本書主要介紹了剖析真實數(shù)據(jù)集和解決有趣問題的簡單方法。這本書的案例使用的是美國國家衛(wèi)生研究院的數(shù)據(jù),并鼓勵讀者使用真實的數(shù)據(jù)集做項目。 2 概率編程與貝葉斯方法 Probabilistic Programming & Bayesian Methods for Hackers 作者:Cam Davidson-Pilon 一本介紹貝葉斯方法和概率編程的入門教程,主要是從對編程的理解出發(fā),數(shù)學(xué)知識其次。 貝葉斯方法是概率推理中一種很實用的方法,在這本書當(dāng)中,貝葉斯方法一直隱藏在一章章慢慢的數(shù)學(xué)分析的背后。貝葉斯推理的典型內(nèi)容包含兩到三章概率論知識,然后再介紹貝葉斯推理?上У氖牵捎诖蠖鄶(shù)貝葉斯模型的數(shù)學(xué)難度太高,這本書中只為讀者介紹了簡單和虛構(gòu)的例子。這會讓讀者小看貝葉斯推理。而事實上,這是因為作者自己的偏好導(dǎo)致的。 3 理解機器學(xué)習(xí) Understanding Machine Learning: From Theory to Algorithms 作者:Shai Shalev-Shwartz and Shai Ben-David 機器學(xué)習(xí)是計算機科學(xué)中發(fā)展最快的領(lǐng)域之一,有著深遠(yuǎn)的實際應(yīng)用。這本書有條理的介紹了機器學(xué)習(xí),以及相關(guān)的典型算法。這本書既介紹了機器學(xué)習(xí)的一些基本概念,也介紹了將這些概念轉(zhuǎn)化為實際算法的數(shù)學(xué)推導(dǎo)。在介紹了基本概念之后,這本書也覆蓋了一些之前的教科書中所沒有涉及過的重要主題,包括模型算法的復(fù)雜度和凸性,穩(wěn)定性的概念;重要的算法范例包括隨機梯度下降法,神經(jīng)網(wǎng)絡(luò)模型,和機構(gòu)化預(yù)測法;還有新興的理論概念比如PAC-貝葉斯法和compression-based bounds(壓縮界限法)。 4 統(tǒng)計學(xué)習(xí)精要 The Elements of Statistical Learning 作者:Trevor Hastie,Robert Tibshirani,etc 這本書用常用的概念框架解釋了統(tǒng)計領(lǐng)域中的重要概念。雖然是用的統(tǒng)計學(xué)方法,但是重點在概念的解讀而不是數(shù)學(xué)運算。書中給出了很多例子,也用了很多彩圖。對數(shù)據(jù)挖掘感興趣的人和統(tǒng)計學(xué)家來說都會是很有價值的資源。這本書涵蓋的知識很廣,從監(jiān)督學(xué)習(xí)到非監(jiān)督學(xué)習(xí)都有涉獵。眾多的話題中包括神經(jīng)網(wǎng)絡(luò)模型,支持向量機,以及最全面關(guān)于分類樹及推算話題的介紹。 5 統(tǒng)計學(xué)習(xí)及其在R中的應(yīng)用 An Introduction to Statistical Learning with Applications in R 作者:GarethJames,DanielaWitten,etc 這本書介紹了一些統(tǒng)計學(xué)習(xí)的方法,是為非數(shù)學(xué)專業(yè)高水平的本科生,研究生和博士生設(shè)計的。這本書也包含了一些R語言的練習(xí)題和如何在現(xiàn)實中應(yīng)用統(tǒng)計模型的詳細(xì)說明,對于新入行的數(shù)學(xué)科學(xué)家來說是非常有價值的資源。 6 數(shù)據(jù)科學(xué)基礎(chǔ) Foundations of Data Science 作者:Avrim Blum, John Hopcroft,etc 雖然計算機科學(xué)的傳統(tǒng)領(lǐng)域依然很重要,未來,更多的研究者會集中于用電腦從應(yīng)用的大量數(shù)據(jù)中提取有用信息,而不是只是解決一些確定的問題?紤]到這一點,我們在這本書中涵蓋了未來40年可能會有用的理論,就像自動控制原理,算法和相關(guān)主題在過去的40年給予學(xué)生的巨大幫助一樣。 7 給程序員的數(shù)據(jù)挖掘指南: 數(shù)字迷宮的藝術(shù) A Programmer's Guide to Data Mining: The Ancient Art of the Numerati 作者:Ron Zacharski 這本書奉行的是邊干邊學(xué)的方法論。我希望你能用我提供過的Python代碼實踐書中的練習(xí)和實驗,而不僅僅是被動的閱讀。我希望你會積極主動的嘗試不同的數(shù)據(jù)挖掘方法。這本書由一系列互相貫通的小分支組成,當(dāng)你讀完這本書的時候,你就為理解數(shù)據(jù)挖掘技術(shù)奠定了夯實的基礎(chǔ)。 8 大數(shù)據(jù)·互聯(lián)網(wǎng)大規(guī)模 數(shù)據(jù)完覺與分布式處理 Mining of Massive Datasets 作者:Jure Leskovec, etc 這本書是基于斯坦福大學(xué)的計算機科學(xué)課程 cs246(海量數(shù)據(jù)挖掘)和 CS345A (數(shù)據(jù)挖掘)而撰寫的。 這本書,正如這門課程一樣,是為計算機科學(xué)的本科生設(shè)計的,并沒有任何先修課程的要求。為了鼓勵讀者進行更深的探索,絕大部分的章節(jié)后面都補充了參考文獻以供深層次的閱讀。 9 深度學(xué)習(xí) Deep Learning 作者:Ian Goodfellow, Yoshua Bengio and Aaron Courville 《深度學(xué)習(xí)》這本書是為了幫助學(xué)生和相關(guān)從業(yè)人員進入一般而言的機器學(xué)習(xí)領(lǐng)域,尤其是深度學(xué)習(xí)而設(shè)計的。這本書的在線版本現(xiàn)已完結(jié),并會長期免費開發(fā)。 10 對機器學(xué)習(xí)的渴望 Machine Learning Yearning 作者:Andrew Ng 人工智能,機器學(xué)習(xí)和深度學(xué)習(xí)正在改變著數(shù)不勝數(shù)的行業(yè)。但是建立一個機器學(xué)習(xí)系統(tǒng)需要你在實際中做出下面的決定: 應(yīng)該要收集更多的訓(xùn)練數(shù)據(jù)嗎? 應(yīng)該使用端對端的深度學(xué)習(xí)嗎? 如何處理與測試集不對應(yīng)的訓(xùn)練集? …… 在以前,做出上述戰(zhàn)略性決定的唯一方法是花幾年時間去讀研究生或者去公司里學(xué)習(xí)。我寫這本書的目的是幫助你快速掌握做上述決定的能力,使你可以在人工智能系統(tǒng)方面做得更好。
|