在大學階段,大家都學過機率論、線性代數和微積分的課程,但是為什麼在面對機器學習中的數學問題時,卻有一種天書的既視感?
第一,大學課程中的知識點並沒有完全覆蓋機器學習領域所需。
回想一下大學機率統計課程內容的內容,雖然很重要,但其實遠遠不夠。事實上,我們還需要補充 隨機過程、隨機理論、蒙特卡洛思想、採樣方法、機率圖等一些重要的基礎知識,才能說知識結構相對完整。同樣的,大學本科的線性代數中一般也不會介紹 相似矩陣、矩陣分解、數據降維等重要內容,最優化的思想和應用在高等數學中也鮮有涉及。
第二,大學課程的學習重計算技巧,輕內在邏輯。
大家一定都有這種感覺,學習大學數學的時候,我們是不是一天到晚苦於去計算行列式、特徵值;去求微分、求積分;去羅列很多種分布,然後算期望、算方差、算事件機率。這樣的結果就是數學變成了算術,還是在不停的做程序一秒鐘就能做的事兒。至於說知識背後的內在邏輯和應用方法,基本上是非常欠缺的,因此大家很容易考完就忘。
第三,大學學了數學,卻不知道學了能幹什麼。
幾十年如一日的教學內容沒能深刻挖掘學科與當下前沿技術的交匯點,使得同學們常常有這樣的困惑:這門課學了之後有什麼用?自然學完之後,很快也就還給老師了。同時大學開設的數學基礎課目的是講授基礎理論,本來也不是為了給大家打牢機器學習的數學基礎。
這麼一來,想以此打好機器學習的數學基礎,恐非易事。
01
機器學習里,數學為什麼很重要?
做機器學習數學基礎系列專欄和大家一起共同交流學習,是我們準備了很久的一個計劃。因為在當下,機器學習、人工智慧領域吸引了許多同學投身其中,其中包含了大量非科班出身或者從其他行業切換賽道轉行而來的朋友們,大家在學習的過程中發現學習曲線陡峭、難度較大,普遍的心聲就是: 機器學習難,首要就是數學知識需要的太多了!
比方說吧:
- 面對一個統計樣本,你想估計出你感興趣的參數,極大似然估計以及有偏性無偏性你能不掌握?
- 進行樣本分類、聚類這些常規操作時,邏輯回歸、高斯判別、高斯混合等各種模型都應該如數家珍;
- 想理解神經網絡的訓練過程,想獲取複雜函數的最值,離不開梯度的概念以及多元微分和優化方法;
- ……
因此,可以看出, 數學基礎是機器學習繞不開的一塊陣地。
圍繞 機率統計、線性代數和微積分這三大核心內容,我們推出了《機器學習中的數學》系列專欄。一經推出後,專欄在機器學習和數學學習者中引起了很大的反響,在讀者的強烈要求下,《機器學習中的數學(全集)》終於上線了!
限時福利
如果你想快速掌握機器學習必備數學,請別猶豫
這門專欄非常適合你!
原價146 元,限時立享 65折!
前 50 位購買者再送29元全場付費文章兌換券
96元=4本數學基礎專欄+講師答疑服務+29元文章兌換券
那麼,我們這個專欄和傳統的數學教材有何不同呢?
首先,我們會集中力量緊緊圍繞 機器學習核心算法中所涉及到的數學知識展開介紹,做好精確打擊。我們的講解會結合好數學的本質內涵,用淺顯易懂的語言講透深刻的數學思想,構建起整個專欄理論體系。
然後,我們還會加強 基礎知識與算法、應用案例之間的聯繫。我們在講解數學內容的時候會注重延伸到後續的算法應用場景,將其進行相互關聯,形成學以致用的實踐導向。
同時,我們會 運用好 Python 工具,做好和工程應用的無縫對接。整個專欄內容都以 Python 語言為工具進行教學內容的實踐,利用 numpy、scipy、matplotlib、pandas 等工具強化知識的理解、提升工作的效率。
此外,我們還十分重視專欄本身的寫作技巧。作者深入淺出的講解技巧和邏輯嚴密的寫作文風也將助你在充滿挑戰的學習道路上不斷前進。
02
專欄的設計思路
我們會按照機率統計、線性代數、微積分與最優化以及機率圖與隨機過程的順序來安排專欄內容。
第一篇:機率統計
第 01 部分:機率思想。這一部分里,我們首先從條件機率和貝葉斯方法入手,闡明條件、獨立、相關這些基本概念,掌握聯合、邊緣的計算方法,和大家一起構建起認知世界的機率思維體系。
第 02 部分:隨機變量。這裡,我們將重點介紹隨機變量主幹內容,從單一隨機變量的分布過渡到多元隨機變量的分析,最後重點圍繞大數定理和中心極限定理,並初步接觸蒙特卡洛方法,帶領讀者建立重要的極限思維。
第 03 部分:統計推斷。這一部分我們關注的是如何從部分的樣本集合中去推斷出我們關心的總體特徵,這在現實世界中的意義非常重要。在介紹參數估計的思想方法基礎上,我們重點關注極大似然估計和貝葉斯估計這兩種方法。
第 04 部分:隨機過程。這一部分我們會關注由一組隨機變量構成的集合,即:隨機過程。股票的波動、語音信號、視頻信號、布朗運動等都是隨機過程在現實世界中的實例。我們在隨機過程的基本概念之上,重點分析馬爾科夫鏈,梳理由靜到動的演變,探索變化的過程和不變的穩態。
第 05 部分:採樣理論。這一部分重點關注如何獲取服從目標分布的近似採樣方法,從基本的接受-拒絕採樣入手,逐漸深入到馬爾科夫鏈-蒙特卡洛方法,在動態的過程中進一步深化對隨機過程、隨機理論與極限思想的理解。
第 06 部分:機率模型。這一部分介紹機率圖模型中的一種典型模型:隱馬爾科夫模型,熟悉狀態序列的機率估計和狀態解碼的基本方法,為後續進一步拓展機率圖模型的學習打好基礎。
第二篇:線性代數
第 07 部分:構築空間。這一部分我們將從空間坐標表示與線性變換入手,快速建立線性代數直觀感受,理解向量和矩陣運算的幾何意義;同時探索空間——這個線性代數的概念基石,理解空間中的映射和變換的本質,深入學習矩陣在其中的靈魂作用;
第 08 部分:空間投影。這一部分我們將從空間投影的現象入手,很好的將理論和工程進行緊密的結合,掌握線性代數在近似與擬合中的理論基礎,學習最小二乘法的原理與實際應用,並實踐線性擬合、無解方程組的近似解問題;
第 09 部分:矩陣特徵。這一部分是矩陣分析的核心重點,我們需要深刻領會矩陣相似性的幾何意義以及特徵值、特徵向量的提取方法,用以打好數據降維的理論基礎;
第 10 部分:數據降維。這一部分是整個線性代數知識脈絡的交匯點,可以說是矩陣分析中最為精彩的地方,利用前三部分打下的良好概念基礎,我們應該去深入的學習特徵值分解和奇異值分解的方法,並利用這些工具進行數據的壓縮和降維,實現對樣本數據的主成分分析。
第三篇:微積分與最優化
第 11 部分:微分基礎。這一部分從一元函數的導數和微分入手,迅速理清連續與可微、切線與導數等重要概念,鞏固好核心基礎,同時從切線的幾何意義出發順勢引出微分的數值求法。在此基礎上進一步討論一元函數的泰勒近似,引導讀者利用高階導數基於有限的級數項在指定點對函數進行近似處理;
第 12 部分:多元分析。這一部分由一元過渡到多元函數,導數與微分的概念得以進一步全面和深化,引出了多元函數的極限、連續以及偏導數,並在多元微分的幾何意義的基礎上,討論了多元函數的泰勒近似。同時從偏導數的幾何意義出發,引出了這一部分最為重要的概念:多元函數的梯度向量和黑塞矩陣,探究梯度與函數值變化的重要關係,為優化方法的介紹打好基礎。
第 13 部分:優化基礎。這一部分討論了最優化的概念基礎,首先我們分析最優化問題的由來和背景,然後重點討論函數極值存在的條件以及探索函數極值過程中常用的疊代法。
第 14 部分:多元極值。這一部分面向幾個典型的實際算法,分別舉了多元函數極值求取的一階方法和二階方法的典型例子,對許多材料當中耳熟能詳、反覆出現的梯度法、最速下降法以及牛頓法都進行了深入的介紹和完整的實現,綜合了整個四部分內容,形成了微分與優化的完整知識閉環。
第四篇:機率圖與隨機過程
第 15 部分:模型中的單點——入手高斯分布:勾畫機率模型核心概念:從最基礎的單中心高斯分布入手展開,通過一維及多維高斯分布的形態、性質、由來及應用串聯起隨機變量、分布特徵、參數估計、極大似然等核心概念,並分門別類的梳理典型的判別模型和生成模型。
第 16 部分:模型中的多點——混合模型與隱變量:EM的疊代探索:接著進入到機率模型中的「多點」,即以多中心高斯混合模型為例,由複雜模型中的隱變量所帶來的參數估計困境,牽引出EM算法以及疊代探索的重要思想;
第 17 部分:模型中的線——剖析隨機過程:一組變量觀測:然後由點到線,介紹隨機過程---即一組隨機變量的呈現形式,主要介紹馬爾科夫過程和高斯過程,並基於馬爾科夫鏈的性質重點介紹統計推斷中的隨機近似方法;
第 18 部分:模型中的面——詳解機率圖模型:解構複雜機率關係:最後進入到機率模型中的面:反映隨機變量複雜關聯關係的機率圖模型,深刻剖析機率圖模型背後的機率原理,重點介紹四類典型機率圖模型以及推斷、學習與濾波等問題。
讓我們一起開始這段學習旅程~
萬丈高樓平地起,希望這個專欄能夠陪伴大家走好機器學習實踐與學習的最初時光,幫助大家梳理清紛繁複雜的知識網絡,構築好算法模型的數學基礎,更重要的是能和大家一起逐漸形成一種思維習慣:源於理論,我們條分縷析;面向實踐,我們學以致用。
限時福利
如果你想快速掌握機器學習必備數學,請別猶豫
這門專欄非常適合你!
原價146 元,限時立享 65折!
前 50 位購買者再送29元全場付費文章兌換券
96元=4本數學基礎專欄+講師答疑服務+29元文章兌換券
適合人群
- 數學、計算機等專業大學生
- Python 開發者或愛好者
- 對人工智慧感興趣的開發者
- 想入門機器學習的初學者
- 想加強數學基本功的讀者
- 需要從事機器學習或 數據分析等相關工作
訂閱須知
1. 怎樣獲取福利?
訂閱專欄後可聯繫小助手「 GitChatty6」,發送入群口令即可獲取 額外福利。
2. 如何閱讀專欄?
本專欄可在 GitChat 服務號、App 及網頁端上多端閱讀。
3. 專欄內容有多少?
本專欄為圖文內容,總共 71 篇課時。
4. 專欄有效期多久?
本專欄一經購買,即可享受永久閱讀權限。