Deep Reinforcement: Policy based and Actor Critic Methods

Name: Deep Reinforcement: Policy based and Actor Critic Methods
Start: 2025-04-23T18:30:00+08:00
End: 2025-04-23T21:30:00+08:00

NTHU Student Activity Center, 101號 Section 2, Guangfu Road, East District, 300

GDG on Campus National Tsing Hua University - Hsinchu City, Taiwan

本活動將探討深度強化學習中的策略梯度方法（Policy-based Methods）與演員-評論家方法（Actor-Critic Methods）。透過理論講解與實作示範，我們將分析策略梯度的優勢與挑戰，並深入理解演員-評論家方法如何結合價值函數與策略更新來提升學習效率。活動適合對強化學習有基本認識的參與者，目標是幫助學員掌握這些核心技術，進而應用於機器人控制、遊戲 AI、金融決策等領域。

Apr 23, 10:30 AM – 1:30 PM (UTC)

0 RSVP'd

Key Themes

About this event

本活動將介紹深度強化學習中的策略梯度方法（Policy-based Methods）與演員-評論家方法（Actor-Critic Methods），並透過實際案例解析其應用場景與優缺點。參與者將學習如何透過策略梯度直接優化行動策略，以及如何利用演員-評論家方法同時提升策略學習的穩定性與效率。此外，活動將涵蓋相關數學推導與程式實作，適合希望深入理解並應用強化學習技術於機器人控制、遊戲 AI 或金融決策的學員。