Reinforcement learning theory and approaches are applied to JLQ model and Q function-based policy iteration algorithm is designed to optimize system performance.

英美

释义

- 将强化学习的理论和方法应用于JLQ模型，设计基于Q函数的策略迭代算法，以优化系统性能。

把海词放在桌面上，查词最方便

触屏版| 电脑版

©2003 - 2025 海词词典(Dict.cn)

立即下载