資料介紹
描述
強化學習是人工智能的一個分支,計算機通過與問題直接交互來了解問題。該項目使用強化學習來嘗試學習在舊 iPhone 上玩 Doodle Jump 游戲。相機每秒從 iphone 拍攝 30 張圖像。對這些圖像進行分析,然后一個簡單的機器人通過旋轉 iPhone 并按下屏幕上的按鈕來操縱 iPhone。
硬件
該項目的“智能”部分是運行機器人操作系統 (ROS) 和 TensorFlow 的 Nvidia Jetson。機器人包括:
- 用于旋轉 iPhone 的步進電機。
- 用于按下 iPhone 屏幕上的按鈕的伺服電機和螺線管。
- Ximea 相機用于捕捉 iPhone 屏幕的圖片,并通過 USB3 將它們提供給 Jetson。
- EIBot 板驅動步進器和伺服系統。
- 復古外觀的盒子中還有一個電源,可為 Jetson 提供 12 伏電壓,為 EIBot 板提供 19 伏電壓,為 USB 集線器提供 5 伏電壓。
- 用于運行 Linux 和控制事物的鍵盤、鼠標和顯示器。
軟件
ROS 是構建此類項目的絕佳方式。使用 ROS,我可以將系統構建為一組使用標準消息傳遞系統進行通信的獨立進程。該項目包括 C++ 和 Python 進程。消息編譯器以兩種語言構建存根,因此可以輕松傳遞消息。ROS的主要模塊包括:
- 從相機接收圖像的相機驅動程序。
- 從屏幕上讀取分數的簡單神經網絡。
- 一個更大的、基于 TensorFlow 的神經網絡,用于分析從相機接收到的圖片。這是通過與機器人交互訓練的網絡。
- 一個存檔過程,負責將操作和屏幕圖像保存在 sqlite 數據庫中以供以后訓練使用。
- EIBot 板驅動程序。
- 屏幕驅動程序。
強化學習
人工智能的強化學習分支是最活躍的領域之一。該系統使用一種稱為模仿學習的變體。我使用機器人操縱 iPhone 玩了數百場 Doodle Jump 游戲。系統存檔圖像和我采取的行動。這些圖像和動作被用作神經網絡的訓練集。在系統開始做任何有意義的事情之前,它需要數千張訓練圖像。目前該系統可以玩一個基本的游戲。它不會瘋狂??地按下按鈕或隨機搖動屏幕。作為學習的一部分,我會盡可能及時地糾正錯誤的決定。這些游戲和修正,以及隨機選擇的最后 20K 張圖像,在每次運行后用作訓練。
這個過程比我預期的要慢得多。我希望通過采用更復雜的學習模型來改進事情,我希望讓系統松散以自行學習。
- 使用Matlab進行強化學習電子版資源下載 0次下載
- 基于強化學習的虛擬場景角色乒乓球訓練 62次下載
- 基于深度強化學習的無人機控制律設計方法 46次下載
- 一種新型的多智能體深度強化學習算法 36次下載
- 基于深度強化學習仿真集成的壓邊力控制模型 0次下載
- 基于強化學習的壯語詞標注方法 14次下載
- 基于深度強化學習的路口單交叉信號控制 21次下載
- 強化學習的雙權重最小二乘Sarsa算法 5次下載
- 模型化深度強化學習應用研究綜述 9次下載
- 機器學習中的無模型強化學習算法及研究綜述 11次下載
- 一種基于多智能體協同強化學習的多目標追蹤方法 20次下載
- 人工智能到底是什么?什么工作需要學習人工智能 15次下載
- 人工智能深度學習處理架構的演進GPU功耗和延遲問題如何解決 28次下載
- 人工智能深度學習之TensorFlow的介紹,安裝和基礎的詳細資料概述 25次下載
- 強化學習在RoboCup帶球任務中的應用劉飛 0次下載
- 機器學習是如何工作的? 人工智能與機器學習實例 1829次閱讀
- 懶惰強化學習算法在發電調控REG框架的應用 746次閱讀
- 如何避開人工智能的陷阱 1075次閱讀
- 谷歌發布非政策強化學習算法OPC的最新研究機器學習即將開辟新篇章? 3374次閱讀
- 對NAS任務中強化學習的效率進行深入思考 4706次閱讀
- 量化深度強化學習算法的泛化能力 2124次閱讀
- 基于強化學習的MADDPG算法原理及實現 2.1w次閱讀
- 強化學習環境研究,智能體玩游戲為什么厲害 3363次閱讀
- 什么是強化學習?純強化學習有意義嗎?強化學習有什么的致命缺陷? 1.7w次閱讀
- 淺談人工智能,機器學習,深度學習三者關系 1749次閱讀
- 人工智能強化學習的原理和目標 4332次閱讀
- 5個頂級的人工智能開源工具 5938次閱讀
- 利用強化學習探索多巴胺對學習的作用 4475次閱讀
- 開發者不可錯過的開源項目—人工智能篇 6008次閱讀
- 人工智能、機器學習、深度學習三者關系分析 4250次閱讀
下載排行
本周
- 1采用 CMOS傳感器的監控攝像頭參考設計
- 2.30 MB | 6次下載 | 免費
- 2一線大廠的IC筆試復習題合集免費下載
- 1.23 MB | 4次下載 | 2 積分
- 3用于晶體振蕩器或陶瓷諧振器的振蕩器驅動器SN74LVC1404數據表
- 1017.61KB | 2次下載 | 免費
- 4APFC 反激 PSR 恒壓控制器BP3619APFC數據手冊
- 2.70 MB | 2次下載 | 免費
- 5GD32F103xxArm?Cortex?-M3 32位MCU芯片手冊
- 5.14 MB | 2次下載 | 免費
- 6串行到并行接口SN74LV8153 數據表
- 494.56KB | 1次下載 | 免費
- 7SmartBond? DA14683 低功耗藍牙 5.0 開發套件 Pro數據手冊
- 2.33 MB | 1次下載 | 免費
- 8Epson推出多攝像頭接口芯片S2D13P04
- 229.29 KB | 1次下載 | 免費
本月
- 1RSA306B頻譜分析儀技術資料匯總
- 未知 | 204次下載 | 免費
- 2RSA500A系列便攜式頻譜分析儀技術盤點
- 未知 | 157次下載 | 免費
- 3高幅度波形/ 函數發生器汽車、半導體、科學和工業應用測量剖析
- 未知 | 141次下載 | 免費
- 4直流無刷電機驅動與失速電流限制參考設計
- 10.6 MB | 32次下載 | 1 積分
- 5電動汽車同步快充慢充原理及測試的三種情況介紹
- 未知 | 30次下載 | 免費
- 6NI數據采集(DAQ)函數的應用
- 0.3 MB | 23次下載 | 免費
- 7保護新能源汽車電池使用壽命的六種措施
- 未知 | 18次下載 | 免費
- 8汽車類高電流無刷直流 (BLDC) 電機驅動器原理圖介紹
- 0.13 MB | 12次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935094次下載 | 免費
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420054次下載 | 免費
- 3Altium DXP2002下載入口
- 未知 | 233070次下載 | 免費
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191336次下載 | 免費
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183318次下載 | 免費
- 6labview8.5下載
- 未知 | 81570次下載 | 免費
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73796次下載 | 免費
- 8NI LabVIEW中實現3D視覺的工具和技術
- 未知 | 70088次下載 | 免費
評論
查看更多