<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習算法的基礎介紹

新機器視覺 ? 來源:新機器視覺 ? 作者:新機器視覺 ? 2022-10-24 10:08 ? 次閱讀

現在,機器學習有很多算法。如此多的算法,可能對于初學者來說,是相當不堪重負的。今天,我們將簡要介紹 10 種最流行的機器學習算法,這樣你就可以適應這個激動人心的機器學習世界了!

01 線性回歸

線性回歸Linear Regression)可能是最流行的機器學習算法。線性回歸就是要找一條直線,并且讓這條直線盡可能地擬合散點圖中的數據點。它試圖通過將直線方程與該數據擬合來表示自變量(x 值)和數值結果(y 值)。然后就可以用這條線來預測未來的值!

這種算法最常用的技術是最小二乘法(Least of squares)。這個方法計算出最佳擬合線,以使得與直線上每個數據點的垂直距離最小??偩嚯x是所有數據點的垂直距離(綠線)的平方和。其思想是通過最小化這個平方誤差或距離來擬合模型。

c910945a-52d7-11ed-a3b6-dac502259ad0.jpg

例如,簡單線性回歸,它有一個自變量(x 軸)和一個因變量(y 軸)。

02 邏輯回歸

邏輯回歸(Logistic regression)與線性回歸類似,但它是用于輸出為二進制的情況(即,當結果只能有兩個可能的值)。對最終輸出的預測是一個非線性的 S 型函數,稱為 logistic function, g()。

這個邏輯函數將中間結果值映射到結果變量 Y,其值范圍從 0 到 1。然后,這些值可以解釋為 Y 出現的概率。S 型邏輯函數的性質使得邏輯回歸更適合用于分類任務。

邏輯回歸曲線圖,顯示了通過考試的概率與學習時間的關系。

03 決策樹

決策樹(Decision Trees)可用于回歸和分類任務。

在這一算法中,訓練模型通過學習樹表示(Tree representation)的決策規則來學習預測目標變量的值。樹是由具有相應屬性的節點組成的。

在每個節點上,我們根據可用的特征詢問有關數據的問題。左右分支代表可能的答案。最終節點(即葉節點)對應于一個預測值。

每個特征的重要性是通過自頂向下方法確定的。節點越高,其屬性就越重要。

c92943a6-52d7-11ed-a3b6-dac502259ad0.jpg

決定是否在餐廳等候的決策樹示例。

04 樸素貝葉斯

樸素貝葉斯(Naive Bayes)是基于貝葉斯定理。它測量每個類的概率,每個類的條件概率給出 x 的值。這個算法用于分類問題,得到一個二進制“是 / 非”的結果??纯聪旅娴姆匠淌?。

樸素貝葉斯分類器是一種流行的統計技術,可用于過濾垃圾郵件!

05 支持向量機(SVM)

支持向量機(Support Vector Machine,SVM)是一種用于分類問題的監督算法。支持向量機試圖在數據點之間繪制兩條線,它們之間的邊距最大。為此,我們將數據項繪制為 n 維空間中的點,其中,n 是輸入特征的數量。在此基礎上,支持向量機找到一個最優邊界,稱為超平面(Hyperplane),它通過類標簽將可能的輸出進行最佳分離。

超平面與最近的類點之間的距離稱為邊距。最優超平面具有最大的邊界,可以對點進行分類,從而使最近的數據點與這兩個類之間的距離最大化。

c948c596-52d7-11ed-a3b6-dac502259ad0.jpg

例如,H1 沒有將這兩個類分開。但 H2 有,不過只有很小的邊距。而 H3 以最大的邊距將它們分開了。

06 K- 最近鄰算法(KNN)

K- 最近鄰算法(K-Nearest Neighbors,KNN)非常簡單。KNN 通過在整個訓練集中搜索 K 個最相似的實例,即 K 個鄰居,并為所有這些 K 個實例分配一個公共輸出變量,來對對象進行分類。

K 的選擇很關鍵:較小的值可能會得到大量的噪聲和不準確的結果,而較大的值是不可行的。它最常用于分類,但也適用于回歸問題。

用于評估實例之間相似性的距離可以是歐幾里得距離(Euclidean distance)、曼哈頓距離(Manhattan distance)或明氏距離(Minkowski distance)。歐幾里得距離是兩點之間的普通直線距離。它實際上是點坐標之差平方和的平方根。

c95d3b34-52d7-11ed-a3b6-dac502259ad0.jpg▲KNN 分類示例 07 K- 均值

K- 均值(K-means)是通過對數據集進行分類來聚類的。例如,這個算法可用于根據購買歷史將用戶分組。它在數據集中找到 K 個聚類。K- 均值用于無監督學習,因此,我們只需使用訓練數據 X,以及我們想要識別的聚類數量 K。

該算法根據每個數據點的特征,將每個數據點迭代地分配給 K 個組中的一個組。它為每個 K- 聚類(稱為質心)選擇 K 個點?;谙嗨贫?,將新的數據點添加到具有最近質心的聚類中。這個過程一直持續到質心停止變化為止。


08 隨機森林

隨機森林(Random Forest)是一種非常流行的集成機器學習算法。這個算法的基本思想是,許多人的意見要比個人的意見更準確。在隨機森林中,我們使用決策樹集成(參見決策樹)。

為了對新對象進行分類,我們從每個決策樹中進行投票,并結合結果,然后根據多數投票做出最終決定。

c98c282c-52d7-11ed-a3b6-dac502259ad0.jpg

在訓練過程中,每個決策樹都是基于訓練集的引導樣本來構建的。

在分類過程中,輸入實例的決定是根據多數投票做出的。

09 降維

由于我們今天能夠捕獲的數據量之大,機器學習問題變得更加復雜。這就意味著訓練極其緩慢,而且很難找到一個好的解決方案。這一問題,通常被稱為“維數災難”(Curse of dimensionality)。

降維(Dimensionality reduction)試圖在不丟失最重要信息的情況下,通過將特定的特征組合成更高層次的特征來解決這個問題。主成分分析(Principal Component Analysis,PCA)是最流行的降維技術。

主成分分析通過將數據集壓縮到低維線或超平面 / 子空間來降低數據集的維數。這盡可能地保留了原始數據的顯著特征。

c9c53fa4-52d7-11ed-a3b6-dac502259ad0.jpg

可以通過將所有數據點近似到一條直線來實現降維的示例。

10 人工神經網絡(ANN)

人工神經網絡(Artificial Neural Networks,ANN)可以處理大型復雜的機器學習任務。神經網絡本質上是一組帶有權值的邊和節點組成的相互連接的層,稱為神經元。在輸入層和輸出層之間,我們可以插入多個隱藏層。人工神經網絡使用了兩個隱藏層。除此之外,還需要處理深度學習。

人工神經網絡的工作原理與大腦的結構類似。一組神經元被賦予一個隨機權重,以確定神經元如何處理輸入數據。通過對輸入數據訓練神經網絡來學習輸入和輸出之間的關系。在訓練階段,系統可以訪問正確的答案。

如果網絡不能準確識別輸入,系統就會調整權重。經過充分的訓練后,它將始終如一地識別出正確的模式。

c9d63610-52d7-11ed-a3b6-dac502259ad0.jpg

每個圓形節點表示一個人工神經元,箭頭表示從一個人工神經元的輸出到另一個人工神經元的輸入的連接。

接下來是什么?現在,你已經了解了最流行的機器學習算法的基礎介紹。你已經準備好學習更為復雜的概念,甚至可以通過深入的動手實踐來實現它們。如果你想了解如何實現這些算法,可以參考 Educative 出品的 Grokking Data Science 課程,該課程將這些激動人心的理論應用于清晰、真實的應用程序。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    6520

    瀏覽量

    87716
  • 模型
    +關注

    關注

    1

    文章

    2754

    瀏覽量

    47820
  • 機器學習
    +關注

    關注

    66

    文章

    8164

    瀏覽量

    130821

原文標題:機器學習必知必會 10 大算法!

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    機器學習算法應用

    關于機器學習的相關算法。正版資源,免費看的。
    發表于 08-24 22:14

    機器學習算法分享

    機器學習算法(1)——Logistic Regression
    發表于 06-09 13:30

    遷移學習

    上課時間安排2022年05月27日 — 2022年05月30日No.1 第一天一、機器學習簡介與經典機器學習算法
    發表于 04-21 15:15

    機器學習簡介與經典機器學習算法人才培養

    上課時間安排:2022年05月27日 — 2022年05月30日No.1 第一天一、機器學習簡介與經典機器學習算法
    發表于 04-28 18:56

    機器學習算法介紹算法優缺點的分析

    機器學習算法數不勝數,要想找到一個合適的算法并不是一件簡單的事情。通常在對精度要求較高的情況下,最好的方法便是通過交叉驗證來對各個算法一一嘗
    發表于 09-19 15:17 ?7次下載
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>的<b class='flag-5'>介紹</b>及<b class='flag-5'>算法</b>優缺點的分析

    Spark機器學習庫的各種機器學習算法

    本文將簡要介紹Spark機器學習庫(Spark MLlibs APIs)的各種機器學習算法,主要
    發表于 09-28 16:44 ?1次下載

    樸素貝葉斯等常見機器學習算法介紹及其優缺點比較

    偏差和方差與模型復雜度的關系使用下圖更加明了: 當模型復雜度上升的時候,偏差會逐漸變小,而方差會逐漸變大。 常見算法優缺點 1.樸素貝葉斯 樸素貝葉斯屬于生成式模型(關于生成模型和判別式模型,主要
    發表于 09-29 16:18 ?7次下載
    樸素貝葉斯等常見<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>的<b class='flag-5'>介紹</b>及其優缺點比較

    十大機器學習算法中的線性判別分析的詳細介紹

    先前呢,我們在最受歡迎的十大機器學習算法-part1和最受歡迎的十大機器學習算法-part2兩篇
    的頭像 發表于 02-03 07:28 ?7056次閱讀

    人工智能學習 遷移學習實戰進階

    上課時間安排: 2022年05月27日 — 2022年05月30日 No.1 第一天 一、機器學習簡介與經典機器學習算法
    的頭像 發表于 04-28 17:13 ?1395次閱讀
    人工智能<b class='flag-5'>學習</b> 遷移<b class='flag-5'>學習</b>實戰進階

    機器學習算法介紹

    哲學要回答的基本問題是從哪里來、我是誰、到哪里去,尋找答案的過程或許可以借鑒機器學習的套路:組織數據->挖掘知識->預測未來。組織數據即為設計特征,生成滿足特定格式要求的樣本,挖掘知識即建模,而預測未來就是對模型的應用。
    的頭像 發表于 06-05 14:17 ?779次閱讀

    機器學習算法匯總 機器學習算法分類 機器學習算法模型

    是解決具體問題的一系列步驟,機器學習算法被設計用于從大量的數據中自動學習并不斷改進自身的性能。本文將為大家介紹
    的頭像 發表于 08-17 16:11 ?752次閱讀

    機器學習算法總結 機器學習算法是什么 機器學習算法優缺點

    機器學習算法總結 機器學習算法是什么?機器
    的頭像 發表于 08-17 16:11 ?1150次閱讀

    機器學習算法入門 機器學習算法介紹 機器學習算法對比

    機器學習算法入門 機器學習算法介紹
    的頭像 發表于 08-17 16:27 ?659次閱讀

    機器學習有哪些算法?機器學習分類算法有哪些?機器學習預判有哪些算法?

    有許多不同的類型和應用。根據機器學習的任務類型,可以將其分為幾種不同的算法類型。本文將介紹機器學習
    的頭像 發表于 08-17 16:30 ?1466次閱讀

    常用的十大機器學習算法介紹

    Boosting是一種集成技術,嘗試從多個弱分類器創建強分類器。這是通過從訓練數據構建模型,然后創建第二個模型來嘗試糾正第一個模型中的錯誤來完成的。添加模型,直到完美預測訓練集或添加最大數量的模型為止。
    發表于 11-20 14:49 ?250次閱讀
    常用的十大<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b><b class='flag-5'>介紹</b>
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>