...被动式(passive)增强式学习,其主要的差别在于,被动式增强式学习的代 人用固定的策(fixed policy) 去学习其效用值 (utility value) ,效用值所代表的意义为 在该态下达到目标与其他态的相对比较值,通常值越大代表此一态目标越接 近,选择到此一态的机也越大.
基于112个网页-相关网页
我们可用决策论中信息的期待效用值( expected utility value) ( van Rooy 2003: 265) 这个概念来说明使用概率计量梯级命题的信息量的合理性。
基于30个网页-相关网页
... final utility theory of value 最后效用价值理论 value utility 价值效用 value of utility 效用值 ...
基于12个网页-相关网页
健康效用值属于等区间基数刻度。
The health utility value belongs to interval scale of cardinal scales.
定义了图中邻接点的攻击代价,并采用多属性效用理论计算其效用值。
The attack cost of adjacent nodes is defined, and the multi-attribute utility theory is adopted to quantify its value.
采用将偏好信息一致化为效用值的方法,集结出决策群体的主观偏好信息。
Through the method of unifying preference information into the utility value form, the subjective preference information of decision making group is aggregated.
应用推荐