<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算機視覺識別是如何工作的?

柴火創客空間 ? 來源:柴火創客空間 ? 2023-02-09 13:41 ? 次閱讀

計算機視覺識別的定義

計算機視覺識別是一種人工智能技術,旨在使計算機系統從數字圖像、視頻等視覺信息中識別和提取有意義信息的能力。它通過利用圖像處理、機器學習和其他相關技術來實現這一目標,并可以完成多種任務,例如圖像識別、物體檢測、人臉識別等。計算機視覺技術在各種行業中都有著廣泛的應用,如自動駕駛、安全監控、醫學診斷等。

計算機視覺識別是如何工作的?

計算機視覺識別的工作方式主要通過以下幾個步驟:

1. 圖像預處理:對圖像進行預處理,如去噪、校正圖像像素等,以確保圖像質量。

2.特征提取:通過各種圖像處理技術,從圖像中提取有用的特征信息,如邊緣、輪廓、顏色值等。

3. 特征分類:使用機器學習算法對提取的特征進行分類,以便對圖像中的物體進行識別。

4. 識別結果輸出:根據分類結果,輸出識別結果,如圖像中的物體類型、人臉識別等。

每一個步驟都需要使用合適的算法和技術,才能確保視覺識別輸出結果準確性和高效性。

下圖左側是亞伯拉罕·林肯灰度圖像緩沖區的簡單插圖,每個像素由一組 8 位數字表示,范圍從 0(黑色)到 255(白色),右側是識別圖像時軟件識別出的不同的顏色值。

af0da0b8-a834-11ed-bfe3-dac502259ad0.png

計算機視覺識別的主要應用功能

1、圖像分類

顧名思義就是將圖像進行類別篩選,通過深度學習方法識別圖片屬于哪種分類類別,其主要重點在于一張圖像只包含一種分類類別,即使該影像內容可能有多個目標,所以單純圖像分類的應用并不普遍。

不過由于單一目標識別對深度學習算法來說是正確率最高的,所以實際上很多應用會先通過目標檢測方法找到該目標,再縮小擷取影像范圍進行圖像分類。所以只要是目標檢測可應用的范圍,通常也會使用圖像分類方法。

圖像分類,需要先對本地圖像進行邊框標記,這個操作需要手動標記才能完成,這樣就催生出一個職業 - 人工智能標注師,比如下圖左側是原始圖片,右圖是被標記過的圖像,就會把它標注到貓的分類中。

af27b26e-a834-11ed-bfe3-dac502259ad0.png

2、目標監測

一張圖像內可有一或多個目標物,目標物也可以是屬于不同類別。算法主要能達到兩種目的:找到目標坐標及識別目標類別。

簡單來說,就是除了需要知道目標是什么,還需要知道它在哪個位置。

目標檢測應用非常普遍,包含前面提到的人臉識別相關技術結合應用,或是制造業方面的瑕疵檢測,甚至醫院用于X光、超音波進行特定身體部位的病況檢測等。

af4359b0-a834-11ed-bfe3-dac502259ad0.png

3、語義分割

算法會針對一張圖像中的每個像素進行識別,也就是說不同于目標檢測,語義分割可以正確區別各目標的邊界像素,簡單來說,語義分割就是像素級別的圖像分類,針對每個像素進行分類。當然這類應用的模型就會需要較強大的GPU和花較多時間進行訓練。

實例分割是語義分割的升級版本。它不是將相同的像素值分配給同一類中的所有對象,而是分段并顯示同一類的不同實例。如果在圖像中檢測到多個相同的對象,則會相應地對其進行標記,如下圖所示,綿羊 1、綿羊 2 和綿羊 3會被單獨分割識別出來,它通常用于計數。

af99d100-a834-11ed-bfe3-dac502259ad0.png

流行的計算機視覺庫和框架

MMDetection

MMDetection是一個基于PyTorch的開源對象檢測工具箱。它由訓練配方、預訓練模型和數據集組成。它運行在Linux,Windows和macOS上,需要Python 3.6+,CUDA 9.2+和PyTorch 1.5+。他們還發布了用于計算機視覺研究的庫mmcv。通過模塊調用的方法,我們可以用少量的代碼實現新的算法。大大提高代碼復用率。

afb099b2-a834-11ed-bfe3-dac502259ad0.png

邊緣設備部署

MMDeploy是一個開源深度學習模型部署工具集,它是OpenMMLab項目的一部分,如果你想了解如何在 NVIDIA Jetson 系列邊緣平臺(如 Seeed 的 reComputer)上安裝 MMDeploy??梢酝ㄟ^部署指南來學習部署過程。

OpenCV

OpenCV是最受歡迎的開源計算機視覺和ML軟件庫之一。它旨在為計算機視覺應用程序提供通用基礎架構。它可以在Windows,Linux,Android和macOS上運行,可用于Python,Java,C++MATLAB。

邊緣設備部署

我們的合作伙伴 alwaysAI 將 OpenCV 構建為邊緣計算環境的核心部分。這意味著在每個 alwaysAI 應用程序中,您都可以添加導入 cv2 并在您的應用程序中使用 OpenCV。alwaysAI 圍繞 OpenCV 構建了一套工具,以實現端到端流程的無縫銜接,并解決了使用邊緣設備時一些常見痛點。

NVIDIA VPI 邊緣部署

NVIDIA 視覺編程接口 (VPI) 是一個軟件庫,可在 NVIDIA NVIDIA Jetson 系列邊緣平臺設備中,實現計算機視覺和圖像處理算法。VPI 為 CPU 和 NVIDIA CUDA 算法實現提供了統一的 API,以及 VPI 和 OpenCV 以及 CUDA 之間的互操作性。

aff60a10-a834-11ed-bfe3-dac502259ad0.png

TensorFlow

TensorFlow是一個端到端的開源ML平臺,能夠執行無數的任務,包括計算機視覺。TensorFlow Lite允許您在移動和邊緣設備上運行模型,而TensorFlow JS適用于Web。它運行在Windows,macOS和WSL2上,支持Python,C,C++,Java等。

邊緣設備部署

在小型或微型處理設備上部署機器學習,主要是通過TensorFlow Lite 框架來進行部署,TensorFlow Lite 主要對微型機器學習功能進行了優化,重點關注延遲、隱私、連接、大小和功耗。

邊緣計算硬件設備

人工智能AI正在加快速度從“云端”走向“邊緣”,進入到越來越小的小型或微型控制設備中,在終端和邊緣側的微處理器上實現機器學習,下面介紹兩款邊緣計算硬件設備。

SeeedreTerminal

reTerminal是 Raspberry Pi一體機,由 Raspberry Pi計算模塊(CM4)提供支持,集成了一個IPS面板式多點觸摸屏,配備雙頻2.4GHz / 5GHz Wi-Fi藍牙5.0,預裝了基于Raspberry Pi的Linux系統,提供存儲4 GB RAM和32 GB eMMC。通過模塊化設計,該機配備了多個可訪問組件和高速連接器??梢愿玫牟渴餉I開發應用程序,也可以執行適合作為工業設施的工業級功能。

b0296ed2-a834-11ed-bfe3-dac502259ad0.png

使用Seeed reTerminal 設備快速部署TensorFlow Lite 框架,具體方法請看下面的地址:

reComputer for Jetson

Jetson 的 reComputer 系列是采用 NVIDIA Advanced AI 嵌入式系統構建的緊湊型邊緣計算機:J10(Nano 4GB)和 J20(Jetson Xavier NX 8GB 和 Jetson Xavier 16GB)。

憑借豐富的擴展模塊、工業外設和熱管理,reComputer for Jetson 已準備好通過將流行的 DNN 模型和 ML 框架部署到邊緣并以高性能進行推理來幫助您加速和擴展下一代 AI 產品。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    8

    文章

    1611

    瀏覽量

    45703
  • 機器學習
    +關注

    關注

    66

    文章

    8179

    瀏覽量

    131120
  • Raspberry Pi
    +關注

    關注

    1

    文章

    552

    瀏覽量

    22092
  • dnn
    dnn
    +關注

    關注

    0

    文章

    56

    瀏覽量

    8975

原文標題:邊緣計算|什么是視覺識別?如何在邊緣設備部署視覺識別?

文章出處:【微信號:ChaiHuoMakerSpace,微信公眾號:柴火創客空間】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    機器視覺計算機視覺的關系簡述

    。計算機視覺是一門獨立的學科,有著30年左右的歷史,集圖像處理、模式識別、人工智能技術為一體,著重服務于一幅或多幅圖像的計算機分析。機器視覺
    發表于 05-13 14:57

    讓機器“看見”—計算機視覺入門及實戰 第二期基礎技術篇

    過優異成績。其主要的興趣是關注人工智能特別是計算機視覺技術如何從技術、產品和商業角度在真實世界中大規模落地。主題簡介及亮點:本次直播,講者將介紹計算機
    發表于 09-04 17:56

    深度學習與傳統計算機視覺簡介

    文章目錄1 簡介1.1 深度學習與傳統計算機視覺1.2 性能考量1.3 社區支持2 結論3 參考在計算機視覺領域中,不同的場景不同的應用程序需要不同的解決方案。在本文中,我們將快速回顧
    發表于 12-23 06:17

    基于OpenCV的計算機視覺技術實現

    基于OpenCV的計算機視覺技術實現OpencV是用來實現計算機視覺相關技術的開放源碼工作庫,是計算機
    發表于 11-23 21:06 ?0次下載
    基于OpenCV的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術實現

    AI新聞:計算機視覺和模式識別會議

    了解和注冊計算機視覺和模式識別會議(CVPR 2018)!
    的頭像 發表于 11-05 06:14 ?2925次閱讀

    計算機視覺是什么

    計算機視覺是一門研究如何使機器“看”的科學,更進一步的說,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀
    的頭像 發表于 12-08 09:24 ?2w次閱讀

    計算機視覺與機器視覺區別

     “計算機視覺”,是指用計算機實現人的視覺功能,對客觀世界的三維場景的感知、識別和理解。計算機
    的頭像 發表于 12-08 09:27 ?1.2w次閱讀

    計算機視覺中的重要研究方向

    計算機視覺是一門研究如何讓計算機達到人類那樣看的技術。使用攝像頭和電腦來代替人類完成一些復雜的工作,例如對目標進行分類、識別、分割、跟蹤等,
    的頭像 發表于 11-19 14:32 ?1.1w次閱讀

    計算機視覺工作流程

    引言 計算機視覺(Computer Vision)自興起以來就非常迅速且廣泛應用于各個領域,比如我們熟悉的且每天都會使用的基于手機攝像頭的人臉識別,除此之外,它還可以在自動駕駛領域輔助汽車識別
    的頭像 發表于 12-26 11:00 ?6049次閱讀

    計算機視覺工作流程與主要應用

    計算機視覺的主要目的是讓計算機能像人類一樣甚至比人類更好地看見和識別世界。計算機視覺通常使用C+
    的頭像 發表于 01-08 14:06 ?5023次閱讀

    剖析計算機視覺識別簡史

    最近,物體識別已經成為計算機視覺和 AI 最令人激動的領域之一。即時地識別出場景中所有的物體的能力似乎已經不再是秘密。隨著卷積神經網絡架構的發展,以及大型訓練數據集和高級
    的頭像 發表于 04-30 10:14 ?2454次閱讀
    剖析<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b><b class='flag-5'>識別</b>簡史

    基于計算機視覺的客機艙門識別與定位方法

    基于計算機視覺的客機艙門識別與定位方法
    發表于 06-22 16:37 ?42次下載

    模式識別計算機視覺手冊

    模式識別計算機視覺手冊免費下載。
    發表于 06-24 10:02 ?3次下載

    計算機視覺中手語識別研究

    計算機視覺中手語識別研究 手語識別的目的就是通過計算機提供一種有效的、準確的機制將聾啞人常用的手語手勢
    的頭像 發表于 04-14 16:11 ?913次閱讀

    機器視覺計算機視覺的區別

    機器視覺計算機視覺的區別 機器視覺計算機視覺是兩個相關但不同的概念。雖然許多人使用這兩個術語
    的頭像 發表于 08-09 16:51 ?1396次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>