...研究《协同反向强化学习》(Cooperative Inverse Reinforcement Learning)正式确定和调查了价值对齐问题(value alignment problem)——引出和优化用户的预期目标的问题。
基于2个网页-相关网页
value alignment problem
值对齐问题
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动