電腦知識網: DeepMind推出深度學習與強化學習進階課程

2018年11月25日星期日

DeepMind推出深度學習與強化學習進階課程

機器之心報道

參與：張倩、李澤南

在OpenAI 推出強化學習課程 Spinning Up後不久。昨天，DeepMind 與 UCL 合作推出了一門深度學習與強化學習進階課程，以在線視頻形式呈現。該課程共有 18 節課，每節課都長達 1 小時 40 分鐘，內容從深度學習框架 TensoFlow 的介紹到構建遊戲智能體，可謂全面。

課程地址：https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

該課程最初在倫敦大學學院（UCL）進行，為方便在線觀看進行了錄像。多位 DeepMind 的研究人員、UCL 教師參與了課程的設計。

參與課程製作的 DeepMind/UCL 團隊

課程由兩部分組成，一是包含深度神經網路的機器學習，二是利用強化學習進行預測和控制，兩個部分相互穿插。在探討深度學習的過程中，這兩條線交匯在一起，其中的深度神經網路被訓練為強化學習背景下的函數逼近器。

課程中的深度學習部分首先介紹了神經網路及使用 TensorFlow 的監督學習，接下來探討了卷積神經網路、循環神經網路、端到端及基於能量的學習、優化方法、無監督學習、注意力及記憶。涉及的應用領域包括目標識別和自然語言處理。

第一課視頻截圖

深度強化學習部分介紹了馬爾科夫決策過程、動態規劃、無模型預測與控制、值函數近似、策略梯度方法、學習與規劃整合、探索/利用困境等。涉及的應用領域包括學習玩經典棋盤遊戲或電子遊戲等。

第一課視頻：

從第一課來看，本課程將講解 DeepMind 的 AI 方法，深度強化學習在雅達利、AIphaGo 等遊戲中的應用。

課程目錄

深度學習 1：基於機器學習的人工智慧簡介

深度學習 2：TensorFlow 簡介

深度學習 3：神經網路基礎

強化學習 1：強化學習簡介

強化學習 2：探索和利用

強化學習 3：馬爾科夫決策過程及動態規劃

強化學習 4：無模型預測與控制

深度學習 4：圖像識別之外、端到端學習、嵌入

強化學習 5：函數逼近及深度強化學習

強化學習 6：策略梯度及 Actor Critic 演算法

深度學習 5：用於機器學習的優化

強化學習 7：規劃與模型

深度學習 6：用於自然語言處理的深度學習

強化學習 8：深度強化學習進階主題

深度學習 7：深度學習中的注意力與記憶

強化學習 9：深度強化學習智能體概覽

深度學習 8：無監督學習和生成模型

強化學習 10：經典遊戲案例學習

課程門檻

當然，這樣一門進階課程也是有一定門檻的。授課者提到，去年就有很多人抱怨課程負擔太重。選這門課程的人需要懂 Python，還要有很多其他知識儲備。另外，由於授課者都是活躍在學界的頂級研究者，課程會直接延伸到當前的研究前沿。

教師寄語：做好準備，迎接挑戰！（brace yourselves！）

今天有哪些論文值得一讀？掃碼開啟訂閱，每天15:00及時速遞。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

http://www.kubonews.com/2018112538207.html

心情煩悶需要新鮮事刺激一下嗎？請上：http://www.kubonews.com

電腦知識網

2018年11月25日星期日

DeepMind推出深度學習與強化學習進階課程

沒有留言:

張貼留言

2018年11月25日 星期日

DeepMind推出深度學習與強化學習進階課程

沒有留言:

張貼留言

2018年11月25日星期日