摘要:针对非结构化的、未知的工作环境要求,提出了一种适用于第四代仿生机器人的仿生式体系结构,阐述了仿生拉 制的思想与原理,实现了代与代之间的反射式行为控制向本能式行为控制的进化和本代内由懊思式行为控制向反射式行为控制的学习升华,弥补了基于懊思式AI和基于反应式AI的两种模型的不足,可使机器人具备良好的主动学习和自适应能力。
关键词:仿生机器人;体系结构;仿生控制;进化;学习
机器人正在由第三代智能机器人向第四代仿生机器人发展和迈进。非结构化的、未知的工作环境,复杂的、精巧的、高难度的工作任务和对于高精确度、高灵活性、高可靠性、高鲁棒性、高智能性的目标需求是仿生机器人产生和发展的客观动力。当前仿生机器人的研究主要集中在运动方式、执行方式、感知方式、控制方式、信息加工处理方式、组织方式等几方面,并且已经取得了初步的成绩。本文将主要从机器人体系结构的角度出发来研究和建立控制逻辑、信息处理两方面的仿生。
1 生物控制逻辑与信息处理
1.1 生命的控制与行为
参照低级到高级的各种生命形态,从控制逻辑和信息处理的角度来看,我们可以把生命实现各种技巧与能力的控制方式分为以下四种:
(1)本能式行为控制,是指生命生来就有的由大脑皮层以下的神经中枢参与即可完成的一种比较低级的神经活动,这种能力在生物学上称为先夭性本能;
(2)反射式行为控制,是指生物出生以后在非条件反射的基础上,在大脑皮层的参与下经过一定的过程积累对直接的物理信号所形成的一种高级的神经活动;
(3)慎思式行为控制,是指具有语言中枢的高级生命体对由具体信号抽象而来的语言、文字所产生的反应,这种反应多发生在具有社会属性的高级生命体和智能体之间;
(4)社会式行为控制方式,是指具有语言中枢的高级生命体对抽象的语言、文字信号所产生的反应,这种反应多发生在具有社会属性的高级生命体之间,这种控制方式以抽象的语言文字为信息载体和传递介质,以多生命体或智能体间的社会机制为协调、制约和竞争的控制策略。
1.2 对生命行为机理的假设
本文提出如下假设:
(1)生命的四类行为本身没有明确的范围,而是具有模糊的界限(如图1所示); (图片)
生命行为类别LBT
A:本能式行为 B:反射式行为;C:慎思式行为;D:社会式行为
图1 生命行为的模糊属性示意图 (2)生命的四类行为之间没有固定的区别,而是处于动态的变化;
(3)本能式行为不是该种生命产生时便己具有,而是由反射式行为经多代的自然选择进化(或退化)而来;
(4)反射式行为以本能式行为为基础,由生物个体经多次慎思式行为的积累才逐渐建立和形成,也可以取消和去除;
(5)社会式行为的产生和执行虽然以生物的本能行为和反射行为为基础,但是却可以在某种程度上超越本能行为和反射行为而具有最高的控制级别。
以上是对生命的基本行为机理的假设和解释,并以此作为人工智能和仿生机器人进一步研究的理论基础。
2 几类机器人体系结构
机器人体系结构,就是指为完成指定目标的一个或几个机器人在信息处理和控制逻辑方面的结构方式。
2.1 基于功能分解的体系结构
基于功能分解的体系结构在人工智能上属于传统的慎思式智能,在结构上体现为串行分布,在执行方式上属于异步执行,即按照“感知一规划一行动”的模式进行信息处理和控制实现。以美国国家航天局和美国国家标准局所提出的NASR人MtI〕为典型代表。这种体系结构的优点是系统的功能明了.层次清晰,实现简单。但是申行的处理方式大大延长了系统对外部事件的响应时间,环境的改变导致必须重新规划,从而降低了执行效率。因此只适合在已知的结构化环境下完成比较复杂的工作。
2.2 基于行为分解的体系结构
基于行为分解的体系结构在人工智能上属于现代的反应式智能,在结构上体现为并行(包容)分布,在执行方式上属于同步执行,即按照“感知一行动”的模式并行进行信息处理和控制。以麻省理工的R.A.Brooks所提出的行为分层的包容式体系结构(SubsumptionArchitecture) 和Arkin提出的基于MotorSc hema的结构为典型代表。其主要优点就是执行时间短、效率高、机动能力强。但是由于缺乏整体的管理,很难适应于各种情况。因此只适用于在沐淘环境下执行比较简单的任务。
2.3 基于智能分布的体系结构
基 于智 能 分布的体系结构在人工智能上属于最新的分布式智能,在结构上体现为分散分布,在执行上属于协同执行,既可以单独完成各自的局部问题求解,又能通过协作求解单个或多个全局问题。以基于多智能体的体系结构为典型代表。这种体系结构的优点是既具有“智能分布”的特点,又有统一的协调机制。但是如何在各个智能体之间合理的划分和协调仍然需要大量的研究和实践。该体系结构在许多大型的智能信息处理系统上有着广泛的应用。
除以 上 三 类主要的体系结构之外,还有一些改进的混合式体系结构,如带反馈环节的行为分解模式、基于分布式智能的分层体系结构、基于功能分解的多智能体结构等等。但是从整体上来看,它们或是在功能模块的灵活性和扩展性上不足,或是没能很好的协调慎思式智能与反应式智能,或是各层次间的交流机制不够完善。
3 仿生式控制体系结构
3.1 仿生式体系结构的思想原理
从本质上来讲,慎思式智能、反应式智能以及分布式智能,都是对生物控制逻辑和推理方式的一种借鉴和仿生,但由于客观条件的限制和需求目的的局限,它们都只是从某一个角度和方向对生物智能的一种片面的、局部的模仿。本文的仿生式体系结构就是以前述的生物控制逻辑和行为推理为基础,充分借鉴基于慎思式智能、反应式智能和分布式智能等三种体系结构思想的优点与不足之处,针对目前机器人特别是未知环境下工作的移动机器人在控制体系结构方面所存在的缺点和问题,提出一种具有适应行为与进化能力的新的控制思想与理念。
其主要思想和原理如下:
(1)借 鉴 基于反应式智能的行为分解思想,依据行为级别的高低将控制体系结构化分为多个行为层;
各行为层间(即行为划分标准)应该是:
.由被动的行为到主动的行为;
.由基本的行为到复合的行为;
.由低级的行为到高级的行为;
.由反射式行为到目标式行为;
.由基于安全的行为到面向任务的行为;
.由硬件直接实现的行为到需要复杂计算甚至是分布式协同计算的行为。
(2)借鉴反应式智能的思想,在控制体系结构中引人本能式行为控制层;
(3)借鉴生物的条件反射思想,在控制体系结构中引人反射式行为控制层;
(4)借鉴慎思式智能的思想,在控制体系结构中引人慎思式行为控制层;
(5)借鉴分布式智能的思想,在控制体系结构中引人社会式行为控制层;
(6)借鉴生物的自适应性思想,在控制体系结构中实现本代内的由慎思式行为层到反射式行为层的学习;
(7)借鉴生物的自进化性思想,在控制体系结构中实现多代间的由反射式行为层向本能式行为层的进化(或退化)。
所以,仿生式体系结构共有四个行为控制层组成,即本能式行为控制层、反射式行为控制层、慎思式行为控制层和社会式行为控制层,它们并行接收来自感知层的外部和内部信息,各自作出逻辑判断和反应,发出控制信息到末端执行层,通过竞争和协调来调节自身并适应外部环境,从而按照目标完成工作任务。
3.2 仿生式体系结构的整体设计
仿生式体系结构的整体组成如图2所示。其工作流程为:(图片)
图2 机骼人仿生式体系结构图 (1)感知层感知机器人内部和外界的敏感信息,分类传至数据库;
(2)本能类的信息直接传至本能式行为控制层,如不为零则直接传至执行层,触发对应的行为,同时触发行为保存至决策库;
(3)反射类的信息传至反射式行为控制层,归类后经模糊逻辑判断触发相应的行为,同时将模糊决策结果保存至决策库;
(4)慎思类的信息传至慎思式行为控制层,归类后经神经网络推理得出模糊决策,存至决策库并触发相应的行为;
(5)社会式行为控制层感知和接收来自其他仿生机器人或人类的决策信息,同时提取本身的底层决策结构,综合衡量比较处理后得出决策,存至决策库并触发相应的行为。
在具体的执行过程中,四个行为控制层在优先级别和响应时间上存在着如下关系:
(1)各行为控制层具体执行的优先级别:社会式行为控制层>本能式行为控制层>反射式行为控制层>慎思式行为控制层
(2)各行为控制层响应时间的长短顺序:社会式行为控制层>慎思式行为控制层>反射式行为控制层>本能式行为控制层
3.3 各行为控制层的具体实现
3.3.1本能式行为控制层的设计实现
本能式行为控制对机器人而言就是指参照生命的本能反应的在逻辑上无需判断推理,在硬件上直接触发实现的行为控制方式。
本能式行为控制层所包含的行为一般为基于安全的最基本、最低级的行为,如电源启动、自身基本状态检测、避碰等等。
规则I:
if data_instinet_class<>0 then//非零触发
exec(instinct-class)// 执行对应行为
report (decision_bank)//存人数据库
对本能类信息作二值化处理,超过所设的阂值则触发对应的本能反应。
3.3.2 反射式行为层控制的设计实现
反射式行为控制对机器人而言就是指参照生命的第一条件反射的在逻辑上采用模糊推理和条件触发的行为控制方式。
反射式行为控制层所包含的行为一般为机器人在具体的环境条件下长期积累形成的一些比较低级的基本的控制行为,如响铃避碰,遇光报警等。
规则2: 对于已经建立了条件反射的先后发生的两个事件Ea,Eb,设对应的响应为Ra,Rb,两者间的联接强度为Rab,初试联接强度为R0,则可以按照如下模糊规则响应:
If Ea is ture then//如果事件Ea发生
exec(Ra)//执行Ea的响应Ra
find Eb on condition (Rab>3R0/2) then //查找满足条件反射的事件Eb
exec(Rb)//执行Eb的响应Rb
while(t<△T)//如果Eb如期发生
if Eb is true //则强化联接强度
Rab=Rab-R0/2i
else Rab=Rab-R0/2i //否则弱化
End if
End if
其隶属度图如图3所示。(图片)
图3 反射式行为控制层的响应规则 3.3.3 慎思式行为控制层的设计实现
慎思式行为控制指的就是全面的考虑多方面的因素与信息,由模糊逻辑和神经网络进行推理和计算得出决策的一种高级的行为控制方式。
规则3 :慎 思式行为控制规则采用的是规则联接的模糊神经网络,处理过程如图4所示。对应的模糊神经网络结构如图5所To(图片)
图5 悄思式行为的推理规则 3.3.4 社会式行为控制层的设计实现
社会式行为控制是指机器人与其他协同完成同一工作任务的机器人或人等类似智能体间的协同控制和共同处理的工作方式。其前提为共同的工作任务,统一的信息格式。
规则4:阿西莫夫的机器人三定律,即
机器人不得伤害人,或任人受到伤害而无所作为;
机器人应服从人的一切命令,但命令与第一定律相抵触时例外;
机器人必须保护自身的安全,但不得与第一、第二定律相抵触。
3.4 各行为层间的学习与进化
3.4.1本代内的学习
本代的学习指的就是一代机器人内将慎思式行为层的控制决策升华到反射式行为层的学习过程,即条件反射的形成和消除过程。
假设:生物自适应性的本质使其具有在先后发生时间较短的两个事件之间产生关联,并进一步强化或弱化这种关联的本能。
规则5:设先后发生的事件Ea、Eb,其时间间隔为△τ,事件间的联接强度为R,则条件反射的建立和消除可以按如下规则来实现:
假设两事件间的初始联接强度为
Ro= Rand'(0,1) ( 1)
条件反射的上限、下限分别为
Rlowlimit=R0-R0/2=R0/2 (2)
Ruplimit=R0+R0/2=3R0/2 (3)
则两事件间的联接强度为(图片) 设i=0,△τi=△τo=0,则(图片) 联接强度R的大小反映的就是事件间的条件反射关系。
3.4.2 多代间的进化
目前的仿生机器人时代,机器人已经初步具备了自我进化的能力,但是这种进化主要发生在虚拟世界中,通过移植到机器人本体而发生作用。
多代间的进化就是指机器人通过计算机仿真计算而获得的由反射式行为到本能式行为的建立和由本能式行为到反射式行为的消除过程。
本文所研究的机器人的进化在性质上指的是虚拟的进化(或退化),在内容上指的是本能式行为的进化(或退化)
假设:生物的自进化性使其具有把某种反射式行为,变异为相应的本能式行为并传递给下一代的能力,这种变异经过环境的选择和积累便体现为多代间的进化或退化。
规则6 :对于在同一环境下工作的多个机器人,如果都对应的形成了某类条件反射B,那么在下一代机器人中将考虑把其对应的控制规则由反射式控制Cr进化为本能式控制Ci,即在事件Ea发生时直接执行Ra和Rb;对于某类行为的本能性控制直接消除,通过机器人在后天的与环境的交互中建立条件反射来控制执行。
4 结论
本文所设计的仿生式控制体系结构全面吸收和借鉴了慎思式智能、反应式智能和分布式智能的优点与长处,生命的本质特征为基础设计适用于第四代仿生机器人的仿生式体系结构,实现了仿生机器人单代间的学习和多代间的进化,对机器人的发展有着重要的意义和影响。
作者简介:许宏岩(1976-),男,博士研究生,主要研究方向为仿生机器人,移动机器人导航/定位、加工工况监测等。
王树国,男,哈尔滨工业大学校长、教授,博士生导师
12/24/2005
|