<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

經典的機器學習算法匯總

濃縮就是精華。想要把書寫厚很容易，想要寫薄卻非常難?，F在已經有這么多經典的機器學習算法，如果能抓住它們的核心本質，無論是對于理解還是對于記憶都有很大的幫助，還能讓你更可能通過面試。在本文中，SIGAI將用一句話來總結每種典型的機器學習算法，幫你抓住問題的本質，強化理解和記憶。下面我們就開始了。

貝葉斯分類器

核心：將樣本判定為后驗概率最大的類

貝葉斯分類器直接用貝葉斯公式解決分類問題。假設樣本的特征向量為x，類別標簽為y，根據貝葉斯公式，樣本屬于每個類的條件概率（后驗概率）為：

分母p(x)對所有類都是相同的，分類的規則是將樣本歸到后驗概率最大的那個類，不需要計算準確的概率值，只需要知道屬于哪個類的概率最大即可，這樣可以忽略掉分母。分類器的判別函數為：

在實現貝葉斯分類器時，需要知道每個類的條件概率分布p(x|y)即先驗概率。一般假設樣本服從正態分布。訓練時確定先驗概率分布的參數，一般用最大似然估計，即最大化對數似然函數。

貝葉斯分分類器是一種生成模型，可以處理多分類問題，是一種非線性模型。

決策樹

核心：一組嵌套的判定規則

決策樹在本質上是一組嵌套的if-else判定規則，從數學上看是分段常數函數，對應于用平行于坐標軸的平面對空間的劃分。判定規則是人類處理很多問題時的常用方法，這些規則是我們通過經驗總結出來的，而決策樹的這些規則是通過訓練樣本自動學習得到的。下面是一棵簡單的決策樹以及它對空間的劃分結果：

訓練時，通過最大化Gini或者其他指標來尋找最佳分裂。決策樹可以輸特征向量每個分量的重要性。

決策樹是一種判別模型，既支持分類問題，也支持回歸問題，是一種非線性模型（分段線性函數不是線性的）。它天然的支持多分類問題。

kNN算法

核心：模板匹配，將樣本分到離它最相似的樣本所屬的類

kNN算法本質上使用了模板匹配的思想。要確定一個樣本的類別，可以計算它與所有訓練樣本的距離，然后找出和該樣本最接近的k個樣本，統計這些樣本的類別進行投票，票數最多的那個類就是分類結果。下圖是kNN算法的示意圖：

在上圖中有紅色和綠色兩類樣本。對于待分類樣本即圖中的黑色點，尋找離該樣本最近的一部分訓練樣本，在圖中是以這個矩形樣本為圓心的某一圓范圍內的所有樣本。然后統計這些樣本所屬的類別，在這里紅色點有12個，圓形有2個，因此把這個樣本判定為紅色這一類。

kNN算法是一種判別模型，即支持分類問題，也支持回歸問題，是一種非線性模型。它天然的支持多分類問題。kNN算法沒有訓練過程，是一種基于實例的算法。

PCA

核心：向重構誤差最?。ǚ讲钭畲螅┑姆较蜃鼍€性投影

PCA是一種數據降維和去除相關性的方法，它通過線性變換將向量投影到低維空間。對向量進行投影就是讓向量左乘一個矩陣得到結果向量，這是線性代數中講述的線性變換：

y = Wx

降維要確保的是在低維空間中的投影能很好的近似表達原始向量，即重構誤差最小化。下圖是主分量投影示意圖：

在上圖中樣本用紅色的點表示，傾斜的直線是它們的主要變化方向。將數據投影到這條直線上即完成數據的降維，把數據從2維降為1維。計算最佳投影方向時求解的最優化問題為：

最后歸結為求協方差矩陣的特征值和特征向量：

PCA是一種無監督的學習算法，它是線性模型，不能直接用于分類和回歸問題。

LDA

核心：向最大化類間差異、最小化類內差異的方向線性投影

線性鑒別分析的基本思想是通過線性投影來最小化同類樣本間的差異，最大化不同類樣本間的差異。具體做法是尋找一個向低維空間的投影矩陣W，樣本的特征向量x經過投影之后得到的新向量：

y = Wx

同一類樣投影后的結果向量差異盡可能小，不同類的樣本差異盡可能大。直觀來看，就是經過這個投影之后同一類的樣本進來聚集在一起，不同類的樣本盡可能離得遠。下圖是這種投影的示意圖：

上圖中特征向量是二維的，我們向一維空間即直線投影，投影后這些點位于直線上。在上面的圖中有兩類樣本，通過向右上方的直線投影，兩類樣本被有效的分開了。綠色的樣本投影之后位于直線的下半部分，紅色的樣本投影之后位于直線的上半部分。

訓練時的優化目標是類間差異與類內差異的比值：

最后歸結于求解矩陣的特征值與特征向量：

LDA是有監督的機器學習算法，在計算過程中利用了樣本標簽值。這是一種判別模型，也是線性模型。LDA也不能直接用于分類和回歸問題，要對降維后的向量進行分類還需要借助其他算法，如kNN。

LLE（流形學習）

核心：用一個樣本點的鄰居的線性組合近似重構這個樣本，將樣本投影到低維空間中后依然保持這種線性組合關系

局部線性嵌入（簡稱LLE）將高維數據投影到低維空間中，并保持數據點之間的局部線性關系。其核心思想是每個點都可以由與它相近的多個點的線性組合來近似，投影到低維空間之后要保持這種線性重構關系，并且有相同的重構系數。

算法的第一步是求解重構系數，每個樣本點xi可以由它的鄰居線性表示，即如下最優化問題：

這樣可以得到每個樣本點與它鄰居節點之間的線性組合系數。接下來將這個組合系數當做已知量，求解下面的最優化問題完成向量投影：

這樣可以得到向量y，這就是投影之后的向量。

LLE是一種無監督的機器學習算法，它是一種非線性降維算法，不能直接用于分類或者回歸問題。

等距映射（流形學習）

核心：將樣本投影到低維空間之后依然保持相對距離關系

等距映射使用了微分幾何中測地線的思想，它希望數據在向低維空間映射之后能夠保持流形上的測地線距離。所謂測地線，就是在地球表面上兩點之間的最短距離對應的那條弧線。直觀來看，就是投影到低維空間之后，還要保持相對距離關系，即投影之前距離遠的點，投影之后還要遠，投影之前相距近的點，投影之后還要近。

我們可以用將地球儀的三維球面地圖投影為二維的平面地圖來理解：

投影成平面地圖后為：

在投影之前的地球儀上，美國距離中國遠，泰國距離中國近，投影成平面地圖之后，還要保持這種相對遠近關系。

等距映射是一種無監督學習算法，是一種非線性降維算法。

人工神經網絡

核心：一個多層的復合函數

人工神經網絡在本質上是一個多層的復合函數：

它實現了從向量x到向量y的映射。由于使用了非線性的激活函數f，這個函數是一個非線性函數。

神經網絡訓練時求解的問題不是凸優化問題。反向傳播算法由多元復合函數求導的鏈式法則導出。

標準的神經網絡是一種有監督的學習算法，是一種非線性模型，它既可以用于分類問題，也可以用于回歸問題，天然的支持多分類問題。

支持向量機

核心：最大化分類間隔的線性分類器（不考慮核函數）

支持向量機的目標是尋找一個分類超平面，它不僅能正確的分類每一個樣本，并且要使得每一類樣本中距離超平面最近的樣本到超平面的距離盡可能遠。

訓練時求解的原問題為：

對偶問題為：

對于分類問題，預測函數為：

如果不使用非線性核函數，SVM是一個線性模型。使用核函數之后，SVM訓練時求解的對偶問題為：

對于分類問題，預測函數為：

如果使用非線性核，SVM是一個非線性模型。

訓練時求解的問題是凸優化問題，求解采用了SMO算法，這是一種分治法，每次挑選出兩個變量進行優化，其他變量保持不動。選擇優化變量的依據是KKT條件，對這兩個變量的優化是一個二次函數極值問題，可以直接得到公式解。

SVM是一種判別模型。它既可以用于分類問題，也可以用于回歸問題。標準的SVM只能支持二分類問題，使用多個分類器的組合，可以解決多分類問題。

logistic回歸

核心：直接從樣本估計出它屬于正負樣本的概率

通過先將向量進行線性加權，然后計算logistic函數，可以得到[0,1]之間的概率值，它表示樣本x屬于正樣本的概率：

正樣本標簽值為1，負樣本為0。訓練時，求解的的是對數似然函數：

這是一個凸優化問題，求解時可以用梯度下降法，也可以用牛頓法。

logistic回歸是一種判別模型，需要注意的是它是一種線性模型，用于二分類問題。

隨機森林

核心：用有放回采樣的樣本訓練多棵決策樹，訓練決策樹的每個節點是只用了無放回抽樣的部分特征，預測時用這些樹的預測結果進行投票

隨機森林是一種集成學習算法，它由多棵決策樹組成。這些決策樹用對訓練樣本集隨機抽樣構造出樣本集訓練得到。隨機森林不僅對訓練樣本進行抽樣，還對特征向量的分量隨機抽樣，在訓練決策樹時，每次分裂時只使用一部分抽樣的特征分量作為候選特征進行分裂。

對于分類問題，一個測試樣本會送到每一棵決策樹中進行預測，然后投票，得票最多的類為最終分類結果。對于回歸問題隨機森林的預測輸出是所有決策樹輸出的均值。

假設有n個訓練樣本。訓練每一棵樹時，從樣本集中有放回的抽取n個樣本，每個樣本可能會被抽中多次，也可能一次都沒抽中。用這個抽樣的樣本集訓練一棵決策樹，訓練時，每次尋找最佳分裂時，還要對特征向量的分量采樣，即只考慮部分特征分量。

隨機森林是一種判別模型，既支持分類問題，也支持回歸問題，并且支持多分類問題。這是一種非線性模型。

AdaBoost算法

核心：用多個分類器的線性組合來預測，訓練時重點關注錯分的樣本，準確率高的弱分類器權重大

AdaBoost算法的全稱是自適應boosting（Adaptive Boosting），是一種用于二分類問題的算法，它用弱分類器的線性組合來構造強分類器。弱分類器的性能不用太好，僅比隨機猜測強，依靠它們可以構造出一個非常準確的強分類器。強分類器的計算公式為：

其中x是輸入向量，F(x)是強分類器，ft(x)是弱分類器，at是弱分類器的權重，T為弱分類器的數量，弱分類器的輸出值為+1或-1，分別對應正樣本和負樣本。分類時的判定規則為：

sgn(F(x))

強分類器的輸出值也為+1或-1，同樣對應于正樣本和負樣本。

訓練時，依次訓練每一個若分類器，并得到它們的權重值。在這里，訓練樣本帶有權重值，初始時所有樣本的權重相等，在訓練過程中，被前面的弱分類器錯分的樣本會加大權重，反之會減小權重，這樣接下來的弱分類器會更加關注這些難分的樣本。弱分類器的權重值根據它的準確率構造，精度越高的弱分類器權重越大。

AdaBoost算法從廣義加法模型導出，訓練時求解的是指數損失函數的極小值：

L(y, F(x)) = exp(-yF(x))

求解時采用了分階段優化，先得到弱分類器，然后確定弱分類器的權重值。

標準的AdaBoost算法是一種判別模型，只能支持二分類問題。它的改進型可以處理多分類問題。

卷積神經網絡

核心：一個共享權重的多層復合函數

卷積神經網絡在本質上也是一個多層復合函數，但和普通神經網絡不同的是它的某些權重參數是共享的，另外一個特點是它使用了池化層。訓練時依然采用了反向傳播算法，求解的問題不是凸優化問題。

和全連接神經網絡一樣，卷積神經網絡是一個判別模型，它既可以用于分類問題，也可以用用于回歸問題，并且支持多分類問題。

循環神經網絡

核心：綜合了復合函數和遞推數列的一個函數

和普通神經網絡最大的不同在于，循環神經網絡是一個遞推的數列，因此具有了記憶功能?；貞浳覀兏咧袝r所學的等差數列：

一旦數列的首項a0以及公差d已經確定，則后面的各項也確定了，這樣后面各項完全沒有機會改變自己的命運。循環神經網絡也是這樣一個遞推數列，后一項由前一項的值決定，但除此之外還接受了一個次的輸入值，這樣本次的輸出值既和之前的數列值有關，由于當前時刻的輸入值有關，有機會通過當前輸入值改變自己的命運：

和其他類型的神經網絡一樣，循環神經網絡是一個判別模型，既支持分類問題，也支持回歸問題，并且支持多分類問題。

K均值算法

核心：把樣本分配到離它最近的類中心所屬的類，類中心由屬于這個類的所有樣本確定

k均值算法是一種無監督的聚類算法。算法將每個樣本分配到離它最近的那個類中心所代表的類，而類中心的確定又依賴于樣本的分配方案。這是一個先有雞還是先有蛋的問題。

在實現時，先隨機初始化每個類的類中心，然后計算樣本與每個類的中心的距離，將其分配到最近的那個類，然后根據這種分配方案重新計算每個類的中心。這也是一種分階段優化的策略。

k均值算法要求解的問題是一個NPC問題，只能近似求解，有陷入局部極小值的風險。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4474

瀏覽量
91105
機器學習

機器學習

+關注

關注
66

文章
8176

瀏覽量
131009
決策樹

決策樹

+關注

關注
2

文章
96

瀏覽量
13400
貝葉斯分類器

貝葉斯分類器

+關注

關注
0

文章
6

瀏覽量
2251

原文標題：一文總結常用的機器學習算法

文章出處：【微信號：IV_Technology，微信公眾號：智車科技】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

【下載】《機器學習》+《機器學習實戰》

、謀發展的決定性手段，這使得這一過去為分析師和數學家所專屬的研究領域越來越為人們所矚目。本書第一部分主要介紹機器學習基礎，以及如何利用算法進行分類，并逐步介紹了多種經典的監督

發表于 06-01 15:49

經典算法大全（51個C語言算法+單片機常用算法+機器學十大算法）

試題學SPFA算法整體來說，機器學習算法可以分為 3 大類：0.1 監督學習工作原理：該算法由

發表于 10-23 14:31

【專輯精選】機器學習之算法教程與資料

電子發燒友總結了以“算法”為主題的精選干貨，今后每天一個主題為一期，希望對各位有所幫助?。c擊標題即可進入頁面下載相關資料）經典算法大全（51個C語言算法+單片機常用

發表于 05-09 17:06

機器學習算法分享

機器學習算法（1）——Logistic Regression

發表于 06-09 13:30

機器學習簡介與經典機器學習算法人才培養

上課時間安排：2022年05月27日 — 2022年05月30日No.1 第一天一、機器學習簡介與經典機器學習

發表于 04-28 18:56

機器學習經典算法-最優化方法

機器學習算法之最優化方法

發表于 09-04 10:05 ?0次下載

機器學習教程之機器學習10大經典算法的詳細資料講解

本文檔的主要內容詳細介紹的是機器學習教程之機器學習10大經典算法的詳細資料講解主要內容包括了：1

發表于 12-14 15:03 ?25次下載

機器學習算法常用指標匯總

機器學習性能評價標準是模型優化的前提，在設計機器學習算法過程中，不同的問題需要用到不同的評價標準，本文對

發表于 02-13 15:09 ?4008次閱讀

機器學習算法工程師必讀經典暢銷書推薦

【導讀】今天給大家推薦一本機器學習算法工程師必讀經典暢銷書！它就是美團機器學習實踐，該書系統闡述

發表于 12-26 09:38 ?2682次閱讀

關于機器學習的十大經典算法

C4.5算法是機器學習算法中的一種分類決策樹算法，其核心算法是ID3

發表于 06-23 09:45 ?26次下載

機器學習的經典算法與應用

? 一、機器學習基礎概念 ? 關于數據 ? 機器學習就是喂入算法和數據，讓算法從數據中尋找一種相

發表于 05-28 11:29 ?824次閱讀

機器學習算法匯總機器學習算法分類機器學習算法模型

機器學習算法匯總機器學習算法分類

發表于 08-17 16:11 ?780次閱讀

機器學習算法總結機器學習算法是什么機器學習算法優缺點

機器學習算法總結機器學習算法是什么?機器

發表于 08-17 16:11 ?1219次閱讀

機器學習算法入門機器學習算法介紹機器學習算法對比

機器學習算法入門機器學習算法介紹機器

發表于 08-17 16:27 ?679次閱讀

機器學習有哪些算法？機器學習分類算法有哪些？機器學習預判有哪些算法？

機器學習有哪些算法？機器學習分類算法有哪些？機器

發表于 08-17 16:30 ?1518次閱讀

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
12小時前

691 閱讀

如何移植FFmpeg

ElfBoard
2天前

545 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

763 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

788 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

808 閱讀

MAX4950中文資料,pdf datasheet (四通道PCI Express均衡器/轉接

學電超人
322

免費

132下載

雙輸出升壓型DCDC轉換器LT3466

王軍
491

免費

80下載

半導體制冷片（TE）介紹

yangtingbe
52 KB

免費

0下載

TextMate Mac文本編輯器

張麗
2.14 MB

免費

1下載

小型PCB Busdisplay可監控8位總線上的當前數據

張秀蘭
0.11 MB

免費

0下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

689 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

295 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

874 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

933 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1438 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看