GDG on Campus National Tsing Hua University - Hsinchu City, Taiwan
本活動將探討深度強化學習中的策略梯度方法(Policy-based Methods)與演員-評論家方法(Actor-Critic Methods)。透過理論講解與實作示範,我們將分析策略梯度的優勢與挑戰,並深入理解演員-評論家方法如何結合價值函數與策略更新來提升學習效率。活動適合對強化學習有基本認識的參與者,目標是幫助學員掌握這些核心技術,進而應用於機器人控制、遊戲 AI、金融決策等領域。
0 RSVP'd
本活動將介紹深度強化學習中的策略梯度方法(Policy-based Methods)與演員-評論家方法(Actor-Critic Methods),並透過實際案例解析其應用場景與優缺點。參與者將學習如何透過策略梯度直接優化行動策略,以及如何利用演員-評論家方法同時提升策略學習的穩定性與效率。此外,活動將涵蓋相關數學推導與程式實作,適合希望深入理解並應用強化學習技術於機器人控制、遊戲 AI 或金融決策的學員。
Wednesday, April 23, 2025
10:30 AM – 1:30 PM (UTC)
Contact Us