Abstract: Traditional performance potential-based learning algorithms can obtain optimal policies in MDP problems.
英
美
释义
文章摘要: 传统基于性能势的学习算法能获得马尔可夫决策问题的最优策略。
把海词放在桌面上,查词最方便
触屏版
|
电脑版
©2003 - 2025 海词词典(Dict.cn)
立即下载