Cyc项目始于1984年,由当时的微电子与计算机技术公司开发。该项目最开始的目标是将上百万条知识编码成机器可用的形式,用以表示人类常识。CycL是Cyc项目专有的知识表示语言,这种知识表示语言是基于一阶关系的[1]。 1986年Douglas Lenat预测如果想要完成Cyc这样庞大的常识知识系统,这将涉及25万条规则,并将要花费350个人年才能完成[2]。1994年,Cyc项目从该公司独立出去,并以此为基础成立了Cycorp(页面存档备份,存于互联网档案馆)公司。
"Cyc"名字的来源是"encyclopedia",发音很像syke,是美国德克萨斯州奥斯丁的Cycorp(页面存档备份,存于互联网档案馆)公司的有效注册商标,Cycorp是一家由Douglas Lenat领导的致力于实现人工智能的公司。虽然Cyc知识库本身为Cycorp公司所有,但是该公司在开源Apache许可证的保证下提供了一个用于自动推理的公共词汇集,即OpenCyc。最近,Cyc还在一个以研究为目的的许可证保证下向人工智能研究者开放,并以ResearchCyc命名。
- 个体,即individuals:例如#$BillClinton又如#$France。
- 集合,即Collections:例如#$Tree-ThePlant(包含所有的树),又如#$EquivalenceRelation(包含所有的等价关系)。集合中的个体被称为该集合的实例(instance)。
- 真值函数,即Truth Functions:该函数可被应用于一个或多个概念,并返回“真”或“假”。例如#$siblings表示兄弟姐妹关系,若两个参数对应的内容为兄弟姐妹关系,则该概念返回真值。约定真值函数以小写字母开头,并且可以被拆分为若干个逻辑连接词(例如#$and、#$or、#$not、#$implies)、量词(#$forAll, #$thereExists等等)以及谓词。
- 函数,即Functions:用于以现有术语为基础产生新的术语。例如#$FruitFn具有以下作用:若接收到用于描述一种(或一个集合)植物的声明,则会返回其果实。约定函数常量以大写字母开头,并以“Fn”作为结尾。
Cyc中的谓词最重要的是#$isa以及#$genls。#$isa表示某个对象是某个集合的个体(instance),#$genls表示某个集合是另外一个集合的子集合。由概念构成的事实采用CycL语言描述的“句子”表示。谓词则写在与其相关的对象之前,并以括号括起来: (#$isa #$BillClinton #$UnitedStatesPresident) 表示“Bill Clinton属于美国总统集合”; (#$genls #$Tree-ThePlant #$Plant) 表示“所有的树都是植物”; (#$capitalCity #$France #$Paris) 表示“巴黎是法国的首都”。
(#$implies (#$and (#$isa ?OBJ ?SUBSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))
上面的规则可解释为:"若OBJ为集合SUBSET中的一个实例,并且SUBSET是SUPERSET的子集,则OBJ是集合SUPERSET的一个实例。下面再给出另外一个典型的示例: (#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal) 上面的规则可解释为:对于脊索动物(chordate)集合#$ChordataPhylum中的所有实例,都存在一个母性动物(为#$FemaleAnimal的实例)作为其母亲(通过谓词#$biologicalMother描述)。
- 肯定前件假言推理(Modus ponens)
- 否定后件假言推理(Modus tollens)
- 全称量化(universal quantification)
- 存在量化(existential quantification)。
OpenCyc的最近一个版本是于2009年7月发布的OpenCyc 2.0版。OpenCyc 1.0版涵盖了完整的Cyc本体,其中包含了47000个概念、306000个事实,主要是分类断言,并不包含Cyc中的复杂规则。
2006年,Cycorp发布了二进制版本的ResearchCyc 1.0,这是向科研社群发布的免费版本的Cyc(ResearchCyc在2004年经过了一整年的测试开发,并于2005年2月发布了测试版)。ResearchCyc中除了包含OpenCyc中的分类信息外,还在知识库中显著增加了许多语义知识(及附加的事实),并加入了一个庞大的词汇表、英文解析与生成工具、及用于编辑、查询知识的Java接口。
- 系统的复杂度 - 该系统具有创建百科全书式知识库的野心,却手动添加所有的知识到系统中;
- 知识表示广泛的具体化引发的可扩展性问题,特别是以常量的形式进行;
- 对物质概念的解释难以令人满意,对内在属性和外在属性区分不清晰;
- 缺乏对Cyc推理引擎效率测试的有意义的标准测试及与其他类似系统的比较;
- 目前该系统在深度和广度上都有待完善,然而测度该系统的完备性本身就是很困难的;
- 缺乏文档;
- 缺乏最新的在线培训材料,不便于初学者学习使用该系统;
- 缺乏对普通对象构成的本体描述的断言。
- 语义网
- Cycorp主页* (页面存档备份,存于互联网档案馆)
- Cyc基金会
- 支持浏览OpenCyc知识库的服务器
- SourceForge.net上的Cyc,开源发布的顶层Cyc本体(版本1.0发布于2006年7月14日)
- OpenCyc C API(页面存档备份,存于互联网档案馆)
- David Whitten写的非官方Cyc常见问题解答
- 能够思考的机器进展到什么程度了? 2005年4月23日, New Scientist(页面存档备份,存于互联网档案馆)
- 常识2006年4月15日, New Scientist(页面存档备份,存于互联网档案馆)
- Cyc官方博客
- "Confessions of a Cyclist" - 另一个关于Cyc的博客(页面存档备份,存于互联网档案馆)
- Cyc视频培训材料(页面存档备份,存于互联网档案馆)
- 采用OpenCyc实现的常识知识获取系统