朱松纯团队最新研究:机器人可以与人“推心置腹”;!我说下次做“AI大白“-量子比特,
机器人能否像《超能陆战队》中的“大白”一样,理解人类的情感和价值观,统一目标合力解决问题。
北京大学人工智能研究院朱松纯团队在最新研究中提出了一种可解释的人工智能(XAI)系统,证明机器人和人类真的可以在“推心置腹”的工作中像人类同伴一样统一OKR。
也就是说,它是团提出的实时双向人机的价值排列。
目前,朱松纯小组的这项研究成果发表在顶级学术期刊Science及其子期刊Science Robotics上,均处于顶级位置。
具体的任务是未知的20×在20目地图中,寻找从基地(地图右下)到目的地(地图左上)的安全路径。
需要注意的是,在这张地图上的不同网格上,设置了不同的装置,如爆炸物、物资等,机器人靠近时会显示出来。
除了寻找安全路径,在游戏开始前,人类指挥官还可以收到四个额外的任务目标。指挥官需要四个选项一。任务包括:。
尽可能快地查找到达目的地的地图上的可疑装置,搜索更大的区域,收集资源。这四个任务目标代表了人类指挥官的价值取向,而机器人需要人类指挥官不断地进行任务反馈,进而了解指挥官的价值取向,自主行动。
具体过程是关于人与机器人价值目标一轮一轮的反馈与解释,最终趋于一致:
将整个游戏分为三组,实验结果表明,当机器人单方面接受人类指令,即单纯作为听话人时,当游戏进度达到25%时,通过对至少60%的目标重要性进行正确排序,可以迅速地与用户价值对齐。
作为表演者,在机器人反馈给人类并对遭遇的情况进行完整描述时,在游戏进行情况为50%时,实现了人类指挥官与机器人价值的统一。
只需简单说明机器人遇到的情况,当游戏进行情况达到75%时两者的价值就必须统一。
以上实验结果说明了人与机器人合作过程中,双向价值对齐的过程:
首先,机器人通过接受人类的反馈,机器人可以使自己的价值函数与人类的价值相匹配。
其次,在与机器人的不断互动中,人类也逐渐形成对机器人能力和意图的感知,两者的价值在游戏前半段并不统一,但从后半段的情况来看,人类对机器人价值评估能力的感知依然可以提高。
最后,机器人的价值选择稳定,用户对机器人的评价也稳定,从机器人的人价值的评价到人价值的真值,以及从人的机器人价值的评价到机器人的现值的收敛对,形成了基于人的真价值取向的双向价值对准。
结果在上,证明人与机器人之间价值的双向配置,需要理论,也是所有研究成果背后的原理:
基于静态机械动态的人的交流方式,人工智能决策背后的逻辑解释人工智能*(XAI)*,学术界迄今为止进行了很多研究。
朱松纯团队实验游戏中的机器人系统也基于XAI,但不同之处在于人与机器人的交流方法发生了变化。
人与机器合作达成目标,需要一种以人的价值为主导的动态机器-动态用户沟通模式。
在此模式下,机器人除了向人类展示自己的决策过程外,还会根据用户的价值目标即时调整行为。
同时,为了即时掌握用户信息,研究团队采用通信学习代替传统的数据驱动的机器学习方法,机器根据估计的用户价值目标进行合理解释。
这种以合作为导向的人机合作要求机器具有理解他人心理状态(包括情绪、信仰、意图、欲望、假装和知识等)的能力。
这一点在多智能体与人的交互环境中尤为重要。因为机器只有在理解了人类的状态和意图之后才能更好地执行任务,其决策行为又会影响人类的判断,从而形成以人为中心的人类兼容的合作进程。
简而言之,运用上述方法进行人与机器人协同作业,可以同时赋予双方两种身份,听话人amp;表演者
这意味着机器人至少在理论上,可以像人类队友一样,理解你的内心和价值观,统一目标并高效合作。
论文作者介绍,朱松纯团队由UCLA袁路遥、高晓丰、北京通用人工智能研究院郑子隆、北京大学人工智能研究院朱毅鑫等人组成。
这个团队长期以来一直在做一些可以解释人工智能的工作。这篇文章是团队在Science Robotics上发表的第二篇关于可解释人工智能的论文。
该研究涵盖认知推理、自然语言处理、机器学习、机器人学等多学科领域,是朱松纯教学团队交叉研究成果的集中体现。
朱松纯教授本人是人工智能领域的世界著名学者,曾任UCLA统计学系和计算机系教授,UCLA计算机视觉、认知、学习和自律机器人中心主任。
目前,他在朱松纯清华大学和北京大学担任讲课席教授,并担任管理职务。他主持的北京通用人工智能研究院(BIGAI)也是清华大学、北京大学等部门合作支持的。
One More Thing最后回到开头的问题。《超能陆战队》中的“大白”真的能存在于现实中吗?
实际上,朱松纯团队已经开始着手研究。
据说现在,朱松纯队伍所属的北京通用人工智能研究院,与北京大学人工智能研究院等联合,对人工智能的统一理论和认知构造进行着研究。
未来的方向是构建一个具有自主感知、认知、决策、学习、执行、社会协作能力、符合人类情感、伦理和道德观念的通用智能体。
怎么样。当你高兴的时候和你一起高兴,当你悲伤的时候可以为你擦干眼泪,这样的机器人,来一个吧。
参考链接:
https://www.science.org/doi/10.1126/scirobotics.abm4183