通过推断智能体形态来学习可转移策略

Brandon Trabucco
强化学习的典型方法包括对每种新形态从零开始为特定智能体量身定制的训练策略。近期研究在具有类似任务目标的多个智能体上训练的形态不可知策略是否可以在无需再训练的情况下转移到具有未知形态的新智能体上,从而消除策略再训练。其需要以前的方法使用手工设计的新试剂形态描述。...

用户分享观点: