Abstract: Traditional performance potential-based learning algorithms can obtain optimal policies in MDP problems.

英美

释义

- 文章摘要: 传统基于性能势的学习算法能获得马尔可夫决策问题的最优策略。

把海词放在桌面上，查词最方便

触屏版| 电脑版

©2003 - 2025 海词词典(Dict.cn)

立即下载