第47卷第2期
2
020年3月
四川师范大学学报(社会科学版)
JournalofSichuanNormalUniversity(SocialSciencesEdition)
Vol.47,No.2
March,2020
人工智能视野下的溯因模型研究
李帅
(南开大学哲学院,天津300350)
摘要:溯因推理的过程就是问题求解的动态认知过程,这与人工智能在推理方面的目标是一致的。溯因推理
作为问题求解的推理形式和方法,受到科学哲学家和逻辑学家们的青睐。近些年来,科学模型研究兴起,一些学者
开始了将溯因推理模型化的尝试,其中最值得关注的是AKM模型和GW模型。溯因认知模型力求解决IP(Igno-
rancePreserving)问题,即缓解无知状态,达到更稳定的认知状态。目前溯因推理的认知模型研究还处于起步阶
段,有着广阔的前景,同时存在着一定的问题,有待进一步深化。
关键词:溯因推理;人工智能;IP问题;溯因模型
中图分类号:B819 文献标识码:A 文章编号:1000-5315(2020)02-0013-08
收稿日期:2019-01-21
基金项目:本文系国家社会科学基金重大项目“现代归纳逻辑的新发展、理论前沿与应用研究”(15ZDB018)的阶段
成果。
作者简介:李帅(1991—),男,湖北荆州人,南开大学哲学院逻辑学博士研究生,研究方向为归纳逻辑、科学哲学。
作为问题求解的溯因推理在近些年来尤为受到逻辑学家们的青睐。对于科学探究来说,皮尔士(C.S.
Peirce)的溯因推理是一种极佳的推理方法。皮尔士的溯因推理形式是:;如果
q p q p。这种推理
,那么;所以
形式更加注重对前提的考察,虽然它不具备演绎必然性,但是作为一种广义归纳的扩展性推理,在人们由果
溯因,由已知结果探求未知理由的过程中,发挥着重要作用。皮尔士认为科学中所有的思想都来自溯因推
理,溯因推理就是研究事实,提出解释它们的理论。 皮尔士起初将这种推理称之为假说,假说在溯因推理
中有着极其重要的作用。溯因推理作为由果溯因的推理,就是从结论出发,提出一系列可能导致此结果的假
说,排除不相关的假说之后,剩下的假说就最接近我们找寻的原因。人工智能需要一套机制来排除干扰假说
以探求原因,模型化研究便为人工智能提供了一套可操作方案。在玛格纳尼(L.Magnani)看来,溯因推理就
是阐明问题求解的过程,这与人工智能在推理方面的目标是一致的。 伴随着科学模型的研究浪潮,也激发
了逻辑学家对溯因推理模型化的研究热情。③
①
②
一
人工智能与作为发现语境的溯因推理
广义的人工智能研究人造物的智能行为,智能行为包括知觉、推理、学习、交流和复杂系统中的行为。推
理是人工智能研究的关键一环。 人工智能不太关心无法推出新知的演绎推理,而将重心放在了扩展性推
④
①
CharlesPeirce,TheCollectedPapersofCharlesSandersPeirce,Vol.5(Massachusetts:HarvardUniversityPress1935),145.
②
洛伦佐·玛格纳尼《发现和解释的过程:溯因、理由与科学》,李大超、任远译,广东人民出版社2006年版,第21页。
③
洛伦佐·玛格纳尼等《科学发现中的模型化推理》,于祺明、王天思译,中国科学技术出版社2001年版,第26页。
④
尼尔斯·尼尔森《人工智能》,郑扣根、庄越挺译,机械工业出版社2000年版,第1页。
13
四川师范大学学报(社会科学版)
理上,比如类比推理、溯因推理和最佳说明推理等。在人工智能领域中,溯因推理的研究可以追溯到1973
年,鲍普尔(H.Pople)的《论溯因逻辑的机制》一文收录在第三届国际人工智能大会论文集中,标志着溯因推
理和人工智能的第一次融合。但直到20世纪90年代,人工智能领域的溯因推理研究才逐渐引起人们的广
泛兴趣。溯因推理开始应用于逻辑编程、知识同化与诊断,以及出现在数据库和知识基础的语境中,即出现
在计算机科学的主流中。 随后,溯因推理和人工智能的融合程度越来越高,总的说来,溯因推理与人工智
能在三个方面有着紧密联系:一是溯因推理可以作为服务于人工智能的逻辑推理类型;二是溯因推理在逻辑
编程中的应用;三是溯因推理和认知变化理论的互动,即用溯因推理处理信念修正问题。 其中,第三个方
面是最具前景的发展方向。
①
②
首先,我们来看溯因作为逻辑推理。在人工智能领域中,机会逻辑的溯因研究进路的总趋势是将溯因作
为“反向演绎附加条件”,其关注点在于给出溯因逻辑的语义学。 其次就是逻辑编程中的溯因推理。逻辑
编程由科瓦尔斯基(B.kowalski)和科尔黙劳尔(A.Colmerauer)在1974年提出,就是我们现在所熟知的程
序语言Prolog。该语言由一阶逻辑激发,并由逻辑程序、问题和一个称之为解决方案的基本推理机制构成。
后来逻辑学家将溯因推理应用在作为一个“修理机制”(repairmechanism)的逻辑编程中,与探寻成功所需
要的事实一起执行程序。 最后是溯因推理和认知变化理论。我们可以初略地将以上两个方面分别看成是
基于逻辑和基于计算的溯因研究进路。我们认为,在溯因推理的过程中,知识背景和信念也随之更新。当溯
因推理引入信念修正之后,这样就出现了一个明显相关的领域,即人工智能中的信念变化理论。人工智能同
样处理这种动态的信念更新过程,二者在这个目标上高度契合。 我们把这种趋向视为基于认知的溯因研
究进路,这是溯因推理目前最具前景的发展方向。信念修正过程发生在许多实际场景中,比如诊断推理、数
据库中的信念修正和机器学习中的理论精细化。
③
④
⑤
我们用溯因推理寻求最佳解释的时候,会根据新的事实和证据不断调整、修正我们的信念库或知识集。
这就要求我们将推理过程视作一个不断探索、发现与更新的过程,而不是一味追求找到唯一的精确答案。在
这个层面上说,溯因推理非常符合逻辑的发现功能。这种曾经被逻辑学家归入另类的溯因推理,在科学发
现、归纳认知和刑事侦查领域却大行其道,大显身手。它被广泛应用于当代科学研究的诸多领域,如自然语
言处理、知识习得、科学发现、逻辑编程、人工智能研究、医疗诊断、心理治疗、教育心理学、认知心理学和认知
科学。 当代科学哲学家辛提卡(J.Hintikka)给予溯因发现功能极高的评价:“可以说最重要的哲学天赋是
发现哲学问题。如果确实如此,皮尔士就是哲学天空中的一颗巨星。他将溯因概念推向哲学家意识的前沿,
它处于当代认识论的核心。”⑦然而,逻辑的发现功能在很长一段时间里被严重贬低。逻辑学自诞生之初,就
肩负着两个使命:“发现”和“推理”。粗略地看,发现处理前提搜索,而推理则解决前提预测。 纵观整个逻
辑发展史,一般把推理定义为从前提的集合推出结论子集,推理的过程可以很好地表征出来。发现过程由于
带有猜想的成分而受到忽视。亚里士多德在《论题篇》和《辩谬篇》中对发现略有提及,在随后的一千多年里,
发现主题一直排除在逻辑研究范围之外,这种情况到了培根(F.Bacon)时代才有所好转。
⑥
⑧
完善溯因推理的动力源于科学哲学的几次思潮,维也纳学派和柏林小组首次提出了科学逻辑的说法,将
科学探索与逻辑研究这两个主题紧密地勾连起来,科学逻辑的目标就是给出所有科学语言的逻辑语法。赖
欣巴哈(H.Reichenbach)曾指出科学哲学研究的两条进路,一条偏心理学的立场,他称其为发现的语境,另
①
JohnWoods,DovGabbay,etal,A PracticalLogicofCognitiveSystems:Volume2(Amsterdam:NorthHollandPublishingCompany,
003),30-31.
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,30-33.
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,31.
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,32.
2
②
③
④
⑤
⑥
尼尔斯·尼尔森《人工智能》,第33页。
任晓明、熊立文等《归纳逻辑教程》,南开大学出版社2012年版,第72页。
⑦
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,1.
⑧
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,46.
14
李
帅
人工智能视野下的溯因模型研究
一条则是辩护的语境。 赖欣巴哈的这种区分存在较大争议。布莱克威尔(R.Blackwell)考察了赖欣巴哈
这种区分背后的隐含假设,指出这种区分将发现的主题从科学哲学的研究中排除出去,与科学实践不符,他
认为不蕴涵科学发现的哲学描述是不可能的。 如果说布莱克威尔只是点到了问题,没有表明立场,那么阿
丽色达(A.Aiseda)就明确地表达了对发现语境的重视。阿丽色达在考察了这两种语境之后,主张我们要将
注意力集中在科学探索的过程,而非聚焦在探索的成果上。③
①
②
在近几十年的发展流变中,科学哲学从原初的立场转变为目前的反基础主义或者新古典主义,把精力从
科学的逻辑语法中抽离出来,更加关注自然科学理论的数理模型结构。逻辑实证主义提出了一个综合的科
学解释和科学检验理论,把科学发现排除在外。虽然逻辑实证主义并不看好科学发现,但却在人工智能和认
知科学领域兴起了一股科学发现程序化的研究浪潮,有力地驳斥了无法对“发现的语境”形式化的武断论调。
我们知道,实证主义科学家们追求客观精确的体系化知识,将演绎逻辑系统作为科学解释和确证的首要形式
框架,并将不具备此种特性的归纳逻辑也加以改造,使之变成形式简洁,易于计算且更为直观的公理化系统,
卡尔纳普在这方面做了许多基础性工作。后面的伍兹(J.Woods)、加贝(D.Gabbay)、阿丽色达、玛格纳尼等
人研究的创新之处就在于整合多种逻辑工具,而非使用单一的逻辑来构建溯因模型。隐式知识不再神秘和
不可分析,我们能给这些知识建模,为问题求解提供一个明确的框架,使之可应用于诸如生成式计算系统
上。④
皮尔士在提出“第三种推理形式”之后,也曾探讨过溯因的基本形式,起初他的思路是参考三段论逻辑。
在此后相对漫长的几十年时间里,溯因推理的模型化进程并没有取得实质性进展。20世纪90年代以来,人
工智能领域开始越来越多地讨论溯因推理,将其作为问题求解的工具。这个时期的溯因形式化往前迈进了
一步,但并非完全的形式化,还没有构造出溯因推理的一般模型。溯因推理的模型化尝试始于21世纪初,第
一个完整的溯因模型AKM由阿丽色达、科瓦尔斯基、库珀斯(T.Kuipers)、卡卡(A.Kakas)和玛格纳尼等
人提出,是目前主流的溯因模型。紧接着,伍兹和加贝在AKM的基础上提出了一个新的溯因模型GW。之
后又有逻辑学家提出新的模型,溯因模型研究开始蓬勃发展起来。
二
溯因模型的认知目标:缓解无知状态
人工智能和溯因推理主要存在三方面的联系和互动,其中人们最为关注的是认知信念的动态变化问题,
即我们如何逐渐修正我们的认知信念。在伍兹和加贝看来,溯因推理就是IP(IgnorancePreserving)推理,
致力于缓解无知状态。溯因模型始终围绕着一个核心主题:解决IP问题。对于一般的推理来说,不确定性
是可以消除的,但溯因推理是个例外,即便完成推理过程,推理者仍旧可能处于无知状态。经过一系列的排
除后,剩下的假说不一定就是事情发生的真正原因,溯因推理并没有假定事件背后存在确定性的、真理性的
理论。粗略地说,溯因是对特定认知刺激的反应,这种刺激发生的时候,由于目前认知资源的限制而无法达
成认知目标。我们可以用溯因激发器(abductivetrigger)⑤简要地刻画这种刺激ꢀ反应过程,将偶然事态记
作S,把目前的认知资源或者知识集定义为K,S要达成的目标记作T,溯因激发器的基本形式为⑥:
1
.获得S
.S碰巧发现T
.K并没有达成T
2
3
①
②
③
④
⑤
HansReichenbach,ExperienceandPrediction (Chicago:TheUniversityofChicagoPress,1938),382.
RichardJ.Blackwell,“InDefenseoftheContextofDiscovery,”RevueInternationaleDePhilosophie34,no.131/132(1980):90-108.
阿托卡·阿丽色达《溯因推理:从逻辑探究发现及解释》,魏屹东、宋禄华译,科学出版社2016年版,第17页。
尼尔斯·尼尔森《人工智能》,第15页。
溯因激发器最早由阿丽色达在其博士论文“SeekingexplanationsAbductioninlogic,philosophyofscienceandartificialintelligence”中提出,
这里以更为简洁的方式刻画。 参见:AtochaAliseda-Llera,Seeking Explanation:Abductionin Logic,Philosophy
of Scienceand
ArtificialIntelligence(Michigan:UMI,1997)。
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,40-41.
⑥
15
四川师范大学学报(社会科学版)
也就是说,我们表面上完成了问题的求解过程,但事实上并非如此,因为T并没有纳入到我们的知识库
中,因而我们并没有彻底地达成目标。
我们一般把IP问题定义为:存在一个认知主体X当且仅当X有一个认知目标T,从目前的知识库K中
不能达成T。面对IP问题,认知主体有两个选择。
一个是获得新的信息,X会达成T。因此就有①:
*
*
,
IP Option1:X克服了他的无知,X扩展知识库K至K K 能达成T。
另一个选择就是有序对{K,T}对X不可解。此时,我们就会处于第二种情形:
IP Option2:X的无知压制住了他, 失败, 就处于这种无知状态。
Option1 X
值得注意的是,这两个选项是动态的,也就是说在t1时刻,X可能尝试着解决问题,但是失败了,因此就
是Option2的情形。在t2时刻他可能处于Option1的情形,然后在t3,他可能又处于Option2的情形。
普遍的观点认为当主体遇到IP问题时,只存在以上两种情况。事实上,还存在着第三种情形:
IP Option3:假定达成了目标。X找到了一个假说H,假说H会和K一道解决他的IP问题。
H是一个猜测,Option3加入了猜想的要素,但是这并没有彻底解决原初的问题。X只有在他现在知
*
道K或他将要知道K 的基础上才能达成T,他目前并不身处其中任意一种状态。如果他挑选了假说H,通
*
过H来更新K达成T,猜想H也不能产生K 。即使附带着假说的的知识库[即K(H)]也不能作为X的知
识集,所以我们并没有解决主体的IP问题。
虽然K(H)不能直接达成T,但我们可以说假定地达成了。因此,Option3没有解决X的IP问题,介
于达成和非达成之间的一种中间状态。也就是说,设定了一个比原先目标稍低一点的目标,然后达成这个目
标。倘若第一种认知上的达成无法实现,我们就可以采取第二种假定的达成。
显然,Option3不是IP问题的彻底解决方案,但将IP问题转换成了猜想能够解决的问题。这也算是对
IP问题的一个回应,降低解决T目标的标准。此时主体不是倾向于追求效益最大化,而是适当牺牲,退而求
其次。
当我们加入了Option3之后,IP问题的动态特征也会相应地调整。一个认知主体可能尝试失败,因此
陷入Option2,然后他可能会转向Option3,如果同样失败了,他又会处于Option2的状态。但是他如果成
功了,达成了Option3设定的稍低标准的目标T,那么他目前的认知状态就会比以前更好,或许逐渐转向
Option1。
我们举一个例子来说明IP问题及其动态认知特征。如果杨伶香想要知道李楚云是否住院,她打电话给
李楚云的室友,但是没有接通。她又打给李楚云的朋友高丝雨,高丝雨也不知道。那么我们可以说,杨伶香
*
目前没有解决这个问题的K 。她一筹莫展,只能明早亲自去医院走一遭。如果她明天去医院发现李楚云
不在,那么她今天处于Option2的状态,到了明天才处于Option1的状态,这样就解决了他的IP问题。生
活中的具体案例往往不具备这样的单调性,我们现在设想另外一种情形。杨伶香感冒发烧,在家休息,不能
去医院一探究竟,假定她并不知道李楚云在那一天的出行情况。直到半个月后,李楚云来她家做客,与她闲
聊时说到:“生病可真是遭罪啊,我已经大半年都没有踏进诊所了。”那么杨伶香现在知道李楚云那天没有住
院。但是她并没有解决她的IP问题,因为新知识已经超出了框架。IP问题也有“保质期”,过期就会失效。②
如果说演绎推理主要是获取确定性的真理,归纳推理用于增强预测的可能性,那么溯因推理的显著特征
就是缓解无知了。溯因的本质是问题求解,采用的方法是引入假说。这种方法无法确保得到完美的解决方
案,而是一个折衷策略,但这个方案最能展现科学发现和科学探究的实际情况。我们往往无法立刻知晓答
案,当我们既无法直接获得确证性的结果,也无法提高结果的可信度的时候,那么我们能够做的就是消除我
们对问题的疑惑,或者说缓和我们的无知状态。正如雷切尔(N.Rescher)所言:“对无知的不适应是人类感
①
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,42.
②
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,44.
16
李
帅
人工智能视野下的溯因模型研究
受性的一个天然组成部分。”①溯因模型致力于消除IP问题,同时力求形式刻画溯因推理的实际情形。加贝
和伍兹把溯因逻辑作为一种认知系统,而且也是一种实践逻辑(practicallogic)。② 溯因作为一种逻辑分析,
是从观察数据到可能原因的推理模式。它不可避免地使科学哲学中的经验进步与理论说明相结合,促进了
人工智能中信念变化的计算理论的产生。 而模型为处理信念提供了很好的框架,我们接下来分别考察两
种溯因模型。
③
三
主流溯因模型:AKM架构
AKM架构④由阿丽色达、科瓦尔斯基、库珀斯、卡卡和玛格纳尼等人提出。我们用E表示一个主体的
认知目标,K表示认知主体的知识库,H是一个假说,K(H)表示带有假说H的知识库。有了这几个参数,
我们便可以刻画AKM溯因模型⑤:
AKM1:E
AKM2:~(K E)
AKM3:~(H E)
AKM4:KH
( )是一致的
AKM5:KH
( )是极小的
AKM6:K(H) E
因此,
AKM7: H
AKM1表示设定一个认知目标;AKM2意味着E并不是来自知识库K;AKM3表示E并不是来自我们
提出的假说H;AKM4表示添加H至K,得到K(H),并给出了一个一致性结果;AKM5表明K(H)无法添
加新的东西进去;AKM6表示新的理论K(H)会产生E;最后得出结论,暂时假定H是值得辩护的。
构造溯因模型是为了更好地解决IP问题,IP问题的核心是引入假说H,我们假设H和知识库K一道
能消解IP问题。溯因模型要想解决IP问题,就需要高效快捷地找出假说H,并且确保H可以经受检验。
给出模型的基本形式只完成了一部分工作,这属于语法的部分,还要给出有语义,并说明构造模型的思
路和技术细节。
首先,我们需要迭代溯因(iteratedabduction)的理论。假设我们有一个目标E1,我们就增加一个假说
H1。假定这个过程是连续的,我们考虑E, ,……,然后加入H,H3,……因此我们得到了一系列的知识
2
2
E
3
库K(H1),K(H1)(H2)。我们需要迭代溯因理论来处理这些序列。如果议程(Agenda)在我们的知识库K
中终止,那么我们就从K(H)中溯因出H。如果随后偶然增加了一个知识k1,与K一道终止了议程,那么我
们就舍弃H,转向K∪{k1}。⑥ 这一点最能反映溯因模型的IP靶向,假说并不是一成不变的,而是实时更新
的。
在我们日常生活中,多重溯因极为常见。事实上,迭代溯因比起一步溯因,更适合将人类行为模型化。
实际的认知情境错综复杂,溯因的复杂性超过了迭代的事实。在一个更为全面的模型中,应该将一些额外的
复杂性纳入讨论之中,比如需要考虑这些溯因形式:多重目标溯因(multipletargetabduction),复合溯因
(compoundabduction)和可递封闭溯因(transitiveclosureabduction)。⑦ 随着我们考虑的情形的增多,就愈
发需要加标演绎系统,这样更利于数据的结构化和标签化,并且不同的嵌入原则能更容易以公式的形式表达
①
NicholasRescher,PricelessKnowledge? NaturalScienceinEconomicPerspective(Lanham:Rowman&Littlefield,1996),6.
②
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,xvii.
③
④
阿托卡·阿丽色达《溯因推理:从逻辑探究发现及解释》,第xvii-ix页。
AKM是集体智慧的结晶,由约翰· 伍兹和多夫· 加贝命名。其中,A代表阿丽色达(Aliseda),K代表科瓦斯基(Kowalski)、库珀斯
(
Kuipers)和卡卡(Kakas)等人,M代表玛格纳尼(Magnani)。
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,48-49.
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,337.
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,337.
⑤
⑥
⑦
17
四川师范大学学报(社会科学版)
出来。
另外,溯因模型要更有效率地找到假说H。AKM架构缺少关于的理论算法的证明,用以检验K E
是否对于任意K和E都成立。没有这样的算法,我们很难发现H的候选项。而AKM4ꢀAKM6概括性太
强,概括性越强,也就意味着所表征的具体内容越少。因此我们需要假定算法A可用于检验K E是否成
立,并且用这种算法可以验证AKM2:~(K E)和AKM3:~(H E)是否成立。
我们在建构AKM溯因模型时所采用的策略是假定这种算法的一般性质,将溯因算法定义为元层级的
溯因机制U(A),在A上运行,试着找到候选项H。
A在数据K和目标E上运行,因此它决定了K ? E。我们需要将这个算法的历史也考虑进来,称其
为H。因此算法决定了结构是[K ? E;H],表示我们目前的数据结构是K,我们当前的目标是要证明E,
计算历史到达了H这一点。算法必须告诉我们在这一点上是如何继续的,A必须有一些规则可以应用,A
规则如下①:
计算规则R的一般形式:[K ? E,H],如果∧[Ki ? Ei;Hi]
换句话说,为了使[K ? E;H]计算成功,我们必须让所有的[Ki ? Ei;Hi]都计算成功。算法A的规则并
非是唯一的,可能存在多个。
如果不能执行K E,我们就用同样的过程去溯因一个E',E'是比E要求稍低的目标,也可以算作是一
个子目标。这样的话,就能够成功执行K E'。也就是说,我们改变了目标,把目标难度设得稍低一些,我
们在现实生活中也经常会这么操作。当我们处理日常生活中的溯因推理时,为了成功执行任务,会改变K
和E。因此,如果某人承接了一个项目,但是不能达到目标,他可能会有意识或无意识地歪解K,为一个稍微
不同的E作辩护,希望侥幸完成任务。
以上是大致的思路,我们以K ? E不满足开始,也就是说,溯因一般不会在一步之内完成。为了更高
效地找出H,我们有一个元算法U(A),能产生H,使得K(H) E成立。我们把U作为第一序,μ作为第二
序。当第一序的溯因不能得到答案的时候,我们就用第二序溯因。例如,以K ? E不满足开始,我们应用
U(A)解决问题,得到H。我们发现K(H)是不可接受的,因此溯因失败。我们就设定一个第二序的目标,把
溯因U修改成U=μ(U),那么我们就可以得到可接受的H'。② 这样的话,就能保证溯因成功。
伍兹和加贝认为AKM架构在某些方面做了颇有价值的探索,指明了溯因逻辑学家要解决的三个子任
务:当运用的时候,必须予其描述;必须对假说H作出说明;必须说明“因此”这个推论算子。 但伍兹和
③
加贝指出,AKM架构不能很好地刻画溯因的内在结构。此外,AKM参数太少,所以解释面较为狭窄。
伍兹和加贝的溯因模型:GW架构④
四
伍兹和加贝结合AKM架构,给出了一个新的溯因模型GW,GW保留了AKM的实用主义优点,并在
此基础上走的更远。
伍兹和加贝首先给出了溯因模型的基本架构,我们用T! 表示一个主体的目标,让R表示为在T上的
pres
一个达成关系,R
表示在在T上的一个假说关系,H是一个假说,K(H)是在H基础上修改过的知识库,
c
C(H)是在H上的一个猜想,H 表示排除假说H。溯因基本架构如下,我们将其简称为BS(BasicSche-
)
⑤:
ma
①
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,339.
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,342.
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,43.
其中G代表加贝(Gabbay),W代表伍兹(Woods)。
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,47.
②
③
④
⑤
18
李
帅
人工智能视野下的溯因模型研究
BS1:T!
[T为一个认知目标]
:
﹁ ( , )
[事实]
[事实]
[事实]
[事实]
BS2 RKT
*
:
﹁ ( , )
BS3 RK T
pres
BS4:R KH T
( ( ), )
BS5:H碰到了更进一步的条件S1,…,Sn
:
因此, ( )
c
[子结论,BS1ꢀ5]
[结论,BS1ꢀ6]
BS6 CH
:
因此,
BS7 H
我们不难发现,伍兹和加贝的溯因基本架构在一定程度上借鉴了AKM架构,比如AKM2:~(K E)
和BS2:﹁R(K,T)都表达了同样的意思:目标不是来自知识库,否则溯因就没有意义了。二者在逻辑上是等
价的表达式,只是在形式表达方面存在一定差异。同时,我们也发现,GW的基本架构要达成的目标不同于
AKM架构。AKM架构是为了更快捷地找到假说H,而BS的结论是排除假说H,排除假说是为了找到更
加合适的假说或者猜想,这样IPOption3才有可能过渡到IPOption1,才有可能彻底地消除IP问题。在
宏观设置上,GW的目标比AKM的目标设定的更高。
伍兹和加贝对AKM架构中的算法A进行了深入探讨,并对其作了小幅度调整。如果有一个目标V,
实现这个目标需要借助K,那么我们就将其表达为K ? V。① 我们需要一系列步骤来实现目标。如果我
们执行其中的任意一步,目标可能被其他的辅助目标或者子目标取代,实现这些子目标的相关K也会发生
变化。
总的来说,AKM架构强调如何高效地选取假说,因为找到假说就可能找到了问题的解,因而就可以消
解IP问题,但是这种消解可能达不到预期的效果。IP问题的解决方案强调的是渐进消解策略,一方面我们
需要快捷高效地找到假说,另一方面我们也必须要有排除假说的机制,即从一个假说跳跃到另一个假说。这
样会为IPOption3过渡到IPOption1提供契机。AKM架构在寻找假说方面做了很多工作,但是并没有
体现出不断寻求最优解的趋势。
伍兹和加贝在基本架构BS的基础上,提出了一个整合的溯因模型:GW架构。其形式如下:
GW1:T! α
[T是带有命题α的认知目标]
:
﹁ ( , )
[事实]
[事实]
[事实]
[事实]
[事实]
[事实]
[事实]
[事实]
GW2 RKT
*
:
﹁ ( , )
GW3 RK T
GW4:H∉K
*
GW5:H∉K
:
﹁ ( , )
GW6 RHT
:
﹁ ( ( ), )
GW7 RKH T
GW8:H R(K(H),T)
GW9:H碰到了更进一步的条件S1,…,Sn
:
因此, ( )
c
[子结论,GW1ꢀ9]
[结论,GW1ꢀ10]
GW10 CH
:
因此,
GW11 H
GW架构在一定程度上借鉴了AKM的框架,但二者的目标不一样。AKM架构的结论假定H是值得
辩护的,而GW则是排除假说H。伍兹和加贝指出,GW架构并非取代AKM架构,而是思路的转换。
伍兹和加贝认为他们的溯因架构充分体现了溯因逻辑独特的认知特征。H不在认知主体的知识库K
*
*
中,也不在扩充的知识库K 中。因为H不在K中,那么经H修改过的K也不在K 中,因此,H⇒R(K
H),T)。伍兹和加贝认为这样就解决了IP问题。②
(
①
JohnWoods,DovGabbay,etal,APracticalLogicofCognitiveSystems:Volume2,48.
②
NicholasRescher,PricelessKnowledge? NaturalScienceinEconomicPerspective ,370.
19
四川师范大学学报(社会科学版)
五
溯因模型化进路的挑战与出路
虽然伍兹和加贝声称GW模型解决了IP问题,但玛格纳尼认为GW模型根本不能算作是一种溯因模
型。马格纳尼强调假说的产生和检验过程,严格意义上属于归纳逻辑的任务,而不是溯因逻辑的内容。于是
玛格纳尼又提出了一种所谓溯因的生态认知模型(Eco-CognitiveModel,简称CT)。① 他们不同的处理方式
在一定程度上折射出溯因概念的含混和溯因模型进路的诸多分歧。
*
构造模型的方法有很多,在AKM和GW模型中,主要涉及如何描述和解释这些参数:T!,T,K,K ,
c
H,KH S
( ), ,……,Sn, ( ), 。将一个概念或者一套概念集模型化是逻辑学家通常采用的方法,由于诸
CH H
1
多的限制,通常不能充分表征一个模型。而主流的逻辑进路,即用集合论、模型论、递归论和证明论来构造溯
因模型的路子似乎行不通。伍兹和加贝在完成GW的主要框架之后,也不得不承认即便是处理一部分参
数,都极其艰难。现有的模型也只是一些零散的、尝试性的工作。伍兹和加贝表示,要想解决所有的问题,至
少需要一代人的努力,因为对每一个参数的解释都牵扯到诸多的逻辑分支。构造溯因模型的难度主要体现
*
在以下几个方面。K是溯因者目前的知识库,当遇到问题之后,知识库就会随之改变,变成K 。我们跟皮
尔士一样,都是可错论者,认为可以更新知识库。只有这样,我们才会逐渐提高认知水平。而可错论是一个
动态认知因素。因此,溯因模型需要引入动态逻辑的一般结构。既然涉及到知识集的扩展、信念修正和信念
c
更新,必然会牵涉认知逻辑。C(H)是一个模态语句,C是允许猜想的道义算子,H 用来表示排除假说,故而
)在道义逻辑中也有一席之地,而Hc则与加标推理有着密切的联系。② 还有一个几乎所有的逻辑系统
C(H
都会遇到的推理后承问题,对后承的不同解读,会产生不同的逻辑。推论关系在构造溯因框架中仍然起着关
键作用,所以必须解释在何种意义上使用
或
。
溯因模型化是一项棘手课题,首先是溯因概念的模糊性,溯因推理与归纳推理和最佳说明推理等有着千
丝万缕的联系,溯因模型的研究范围还存在一定的争议。其次,溯因模型牵涉逻辑学领域的诸多分支,研究
者要想打通这么领域,一己之力难以为之,只有广泛的合作,才有实现的可能。很显然,GW模型并非是溯因
模型化的最后形态,从AKM架构到GW架构,甚至到CT模型,都是逻辑学家们的有益探索。
在溯因模型化的研究中,溯因模型的目标是缓解无知状态,就是将追溯原因的过程作为一个动态的认知
过程,其中包含着信念修正和知识集的更新,这也是人工智能的重要议题。溯因推理的研究进路有三条:基
于逻辑的、基于计算的和基于认知的。这三个方面是溯因推理和人工智能联系最为紧密的部分。我们认为,
溯因推理的研究趋势之一是越来越多地呈现出三方面的融合。其实逻辑理论在某些层面上也类似于科学理
论,完备的理论就失去了发展动力。如果拥有一个“完备的科学理论”,就意味着在这个理论中,能给出否定
或肯定的解释,这要么是一个没有解释效力的理论,要么就意味着理论的终结。溯因模型化的困境也是其发
展的动力,正是由于这种不完备,激发着后继学者对理论的完善和推陈出新。
[责任编辑:帅巍]
①
LorenzoMagnani,PingLi,etal,PhilosophyandCognitiveScienceII:Western& EasternStudies(Berlin:SpringerInternationalPublish-
ing,2015),135-136.
JohnWoods,ErrorsofReasoning:NaturalizingtheLogicofInference,71-72.
②
20