【ZiDongHua 之自动化学院派收录关键词: 智能驾驶 人工智能 认知物理学】
  
  学术前沿丨CAAI 名誉理事长李德毅院士:《认知物理学基础:认知自然和人类自身的奠基石》
  
  转自 《学术前沿》杂志
  
  作者简介
  
  李德毅,清华大学特聘教授,中国工程院院士,国际欧亚科学院院士,中国人工智能学会名誉理事长,中国指挥与控制学会名誉理事长,“吴文俊人工智能最高成就奖”获得者,认知物理学和不确定性人工智能主要开拓者。研究方向为计算机工程、不确定性人工智能、认知的形式化、机器认知、云模型、云变换、数据场、拓扑势、数据挖掘、知识发现和智能驾驶
  
  摘要
  
  物质、能量、结构和时间是人类认知和机器认知的最基本要素,是人类智能和人工智能共同的奠基石。信息不是物质,不是能量,是在结构、时间上形成的衍生物。位于四要素之上的是思维软构体和物质硬构体,其上分别对应基于想象与推理的数学和基于观察与实证的物理,而基于数学和物理之上的是认知物理学。认知物理学的使命是用物理学的理论和方法解释人类认知及其形成过程,人工智能浓缩重演人类智能,用机器来模仿、拓展人的认知。未来,要突破图灵机局限,发展难以计算的记忆智能和具身交互智能;用云模型、数据场、拓扑势、云变换等认知物理学理论和方法,形式化人类的不确定性认知,形成认知螺旋,实现认知的自成长;研发可交互、会学习、自成长的认知机器,开辟各智其智、智人之智、智智与共的人工智能新方向。
  
  引言
  
  霍金在《时间简史》的开篇讲了一个故事。罗素曾经在一次天文学的科普讲座上被一位老太太教训:“世界哪儿有那么复杂,就是一个放在乌龟背上的平板。”罗素反问:“那乌龟站在什么上面呢?”老太太答:“小伙子,你挺聪明,乌龟下面是更大的乌龟,乌龟叠乌龟啊!”
  
  这个“乌龟塔”看似荒谬,却蕴含着深刻的哲学思辨,揭示了人类认知自然和认知自身的逻辑。人类认知的整个活动,就是解释和解决人类在生存和繁衍过程中所遇到的各种各样的现实问题。认知自成体系,包括认知客观存在的宇宙,还包括更为深远广阔的人类自身主观的精神世界。和地球上其他物种相比,人类创造了灿烂的文化和文明,发明了千姿百态的认知工具和机器,将人类肉身的体能智能延伸到体外,工具和机器成为真实世界里的物理存在,成为人类文明的生态,而人工智能正在加速改变人类自身。人类曾经一步步从“觅食者”跃升为“种植者”、“生产者”和“建设者”,而今正在跃升为“创造者”。和其他高等物种相比,是认知成就了人类。
  
  然而,认知机器不是生命,只是机械的、物理的、电子的装置,如何用物理学的理论和方法,解释机器的感知、思维、决策和行动?解释机器认知如何像人又不像人?认知物理学的朴素和温暖,就在于其中不仅有人类认知之“道”,还指出一条实现人工智能之“路”。2000年以来,笔者在“不确定性人工智能”思想的基础上,力图用自然科学来探索人的主观认知的奥秘,用物理学的理论和方法解释人类认知及其形成过程,用机器来模仿、拓展人的认知。本文将从人类智能和人工智能诸要素的逻辑关系谈起,探寻人类认知自然和自身的奠基石,开辟各智其智、智人之智、智智与共的人工智能多元认知的新方向。
  
  寻找奠基石
  
  “乌龟叠乌龟”的说法,是想把人类认知自然和自身的演化,在逻辑上排个序。基于这一思路,笔者对人类智能和人工智能中诸要素的逻辑关系进行了认真梳理,得到如图1所示的结果。 
 
  
  来源:作者自制
  
  图1  认知要素叠层的示意图
  
  无论是人类认知还是机器认知,最底层的“乌龟”都站在一块由物质、能量、结构和时间四要素构成的奠基石上。其中,物质和能量是物理层面的真实存在,结构和时间是认知层面的抽象思维,是人类认知物质、能量的存在和变化的状态参量。在人的精神世界里,用结构表达物质在空间的拓扑与形变,用时间表达物质的运动与变化,反映能量的传递与转换。
  
  位于四要素之上的是思维软构体和物质硬构体,其中精神和物质相互纠缠。结构和时间寄生在物质和能量上的诸多硬构体,组成机器具身;而机器思维过程中的数字、符号、信息是大量的软构体,如同人在认知空间里表现出来的思想,它们寄生在硬构体或者已有的其他软构体之上,能自我引导,即自举;能自我复用,即递归;能递推使用,即迭代;更能自我复制或者修改,构成想象。人类认知空间里的软构体是思维的要素,支撑形象思维、逻辑思维和直觉思维,体现人的丰富想象力和创造力,体现精神世界。
  
  思维软构体和物质硬构体二者之上分别对应基于想象和推理的数学,以及基于观察和实证的物理,位于数学和物理之上的是认知物理学。认知物理学的使命是用物理学的理论和方法解释人类认知及其形成过程,用机器来模仿、拓展人的认知。自然选择的进化生动地描述了生命的复杂性是如何一步一步发展起来的。但它可以用物理学来解释吗?作为自然界的最高级物种,在适者生存的法则下,人类在迭代过程中,细胞、组织和器官经历了千万年的缓慢自然进化过程,于是有了以“碳基”为主体的人的认知,形成人类智能。认知的发展推动人类智能的发展。位于认知物理学之上的,依次是化学、生命科学、认知神经生物学。其中,化学是生命科学的支撑,数学和物理又是化学的支撑。再来看另外一侧,对应的是机器认知的发展,位于认知物理学之上的依次是微电子和芯片、计算机智能、机器具身智能。一般来说,下层为上层设置了边界并提供理论支撑,上层为下层提供实现路径并提出新的使命。机器模拟人类的认知,像人又不像人。
  
  和机器认知相比,人类认知的自然进化非常非常的缓慢。让我们认真地回顾一下人类认知的重要节点:100多万年前人类走出非洲,25万年前人类以狩猎和采集为生,1万年前人类开始定居农耕,5000年前才有了语言文字、进入文明社会;公元前384年古希腊哲学的奠基人亚里士多德诞生,1643年现代物理学奠基人牛顿诞生,1687年牛顿发表《自然哲学的数学原理》,才隐隐约约地为人类后来认识和区分自然科学、哲学和数学奠定了基础,人类认知才开始走上科学的道路;200多年前纺纱机、蒸汽机等动力机器的发明,推动了工业革命的进程,人类进入“蒸汽时代”;1879年科学革命的先驱、理论物理学家爱因斯坦诞生,并于1915年提出广义相对论;1912年计算机科学和人工智能之父图灵诞生,图灵的一生极大地推动了计算机科学的形成和发展。纵观历史长河,人类普遍使用电子计算机还不到百年,而今机器和人类的对话已经无处不在、无时不在。人工智能通过暴力浓缩重演人类思维,完成以“硅基”为主体的机器认知,还不到百年。把千万年的人类认知的自然进化过程浓缩到今天的机器里面,这是多么了不起、多么飞快的进步啊!
  
  物理和数学之间的纠缠
  
  认知物理学脚踩两只“乌龟”:数学和物理。二者的关系,不能简单地置于“谁是谁的基础”的逻辑下予以探讨。数学不属于物质科学,它排除物质的具体内容而运用抽象将之形式化,通过逻辑和符号进行数量、结构、变化和空间拓扑等方面的思维活动和表达。例如,负数、无理数、虚数乃至所有的数,都不是物理实在。物理学公理化和数学化曾经是一个时期大学问家普遍追求的目标。数学研究抽象的数形关系,是思维软构体,是发明,追求美;物理学寻找物理世界里的物质硬构体,是发现、是实证,追求真;它们相互纠缠,互相借鉴。智能时代基于想象和推理的数学,成为人类和机器思维最重要的基础,数学归属于自然科学板块还是认知科学板块,是可以商榷的。杨振宁教授认为数学和物理有点像“对生”的两片树叶,它们在多数部分是分离的,都沿着自身的脉络发展,但基础部分却令人吃惊地纠缠着。以图灵和他的导师丘奇命名的丘奇-图灵论题(Church-Turing Thesis)具有深刻的哲学含义,其原本想为数学和物理学划出边界,可是这个边界是纠缠不清的,一直可以延伸到“心智与具身”(mind vs body)。数学家凭借自己在物质世界的感受及对其进行的抽象,不断提出数学猜想,不断被证明或者修正,由此数学便发展起来了。如哥德巴赫猜想、黎曼猜想、NP完全问题等,数学撇开各种物理含义的量纲,在高度抽象的层面赋予不同事物相同的符号和规律,使得看似不相关的事物或现象,能够得到一定程度的统一和解释。可惜,数学对时间的贡献不如对结构的贡献大。受宇宙中物质、能量的启发,数学世界包含了诸多宇宙中不存在的东西,其依靠人脑认知抽象出的结构,成为“想象的现实”,如编码、数据、符号、文字、概念、信息、知识等,这些软构体并不是真实的物理存在。思维软构体和物质硬构体也存在着纠缠。有的时候,解决一个数学问题可以推动解决一类物理问题;也有的时候,解决一个物理问题可以推动解决一类数学问题。
  
  牛顿为经典物理找到了数学的精确性,但化学和生物学在彼时尚缺乏坚实的基础,需要研究不确定性,需要概率论和统计学,需要研究涌现或顿悟的机理。生命科学最近几年越来越兴盛,如结构生物学、认知神经生物学、基因编辑等。随着计算机的广泛使用,以及微电子技术和芯片、计算机智能和认知物理学的迅速发展,人们不停发出追问:究竟生命是机器,还是机器是生命?人的认知和机器的认知,如何相同又如何不同?这些正是认知物理学要研究的问题。认知物理学的使命是阐释和填补人类智能和人工智能之间的鸿沟(见图2)。现在看来,除了物质和能量,结构和时间在认知自然和人类自身中也发挥着不可思议的作用。
  
  来源:作者自制
  
  图2  认知物理学填补人类智能和人工智能之间的鸿沟
  
  客观的自然和主观的认知之间的纠缠
  
  从远古开始,人类作为地球上的物种之一,面临的最大问题是生存和繁衍过程中的物质满足。沿着这一主线,人类不断强化自身在物质世界的获取能力和行为能力,不断征服与改造物质世界,以确保自身的生存与繁衍。现代科学的诞生,也发端于对物质世界的认知,进而发展为“物质性、能量性的科学、技术和工程”,作用于物质之上,以满足人类的物质需求,改变物质的存在状态或者性质。现代科学涵盖物理学、化学等基础学科,后来发展到有机化学、医学和生命科学,用以解释物理空间和宇宙中的自然规律,阐释人的生命历程,甚至试图制造出人工生命,其研究对象是实实在在的物质硬构体。
  
  与这条主线相比,人的精神活动和智能活动只是人主观世界里的认知,是一个人的感觉、知觉和记忆的共同产物。我们可以把它看作独立的精神存在,即思维软构体。其实,通过主观认知说明物理世界的客观存在是很困难的,只能说明物质世界在人的大脑里留下了什么。与精神和认知活动直接相关的发明与发现,如人类语言文字的出现,教育的诞生,神学、宗教、哲学、文学、艺术、音乐、美术的诞生,是惊天动地的;生命科学中遗传学的发展、DNA双螺旋结构的发现以及基因编辑的成功,尤其是数学和存储程序的通用推动了可编程电子计算机的发明,更是石破天惊。可惜,天地宇宙不为人类所动,是自在的、不言的。
  
  人类认知宇宙的过程是基于观察和实证的,通常我们只相信“实”,看到“在”;而在人脑中有许多基于想象和抽象的思维软构体,自己也会冒出“虚”和“软”。人类一切的思维活动都离不开抽象,认知源于感知过程中的抽象,并将其压缩成不同尺度的软构体。自然进化形成的具有抽象、联想和记忆能力的脑神经系统,是人类抽象出结构和时间的生物学基础。人类长期进化形成的感知器官和大脑皮层组织,特别是大量神经细胞的相互作用,是形成时间感知的思维器官。倘若没有包括视觉残留在内的各类不同时长的记忆,如瞬时记忆、工作记忆和长期记忆,我们就只能活在当下,就不会有物质运动和变化的时间概念。记忆为我们过去和现在的认知提供连续性。正如一句心理学名言所述,生活就是记忆。有记忆就会有遗忘,否则大脑就会不堪重负。图灵也有句名言:遗忘是人类智能的显著表现。人类要用有限的记忆能力去认知无限的宇宙,于是抽象出结构和时间,从而有利于展开联想,形成想象力和创造力,这是人类在长期的自然进化、物竞天择、适者生存的发展中,为了实现生存和繁衍而“被动”形成的。宇宙中原本不存在离开物质和能量的孤立结构,也沒有离开物质和能量的孤立时间。一个重要的例证就是1967年物理学界一致同意改用场论解释的原子结构来定义“秒”。一秒的间隔时间是铯133原子基态两个超精细能级之间跃迁所对应的电磁辐射9192631770周期的持续时间。从物理常数定义的量纲可以看出,是时间T定义了长度L和质量M,也是时间描述了熵增和负熵。有了时间的概念,物质和能量便可以映射为认知空间里不同时刻表现出的拓扑结构和关系。由此,在两虚两实交互的四要素中,结构体现在物质物体上,时间体现在能量或运动变化上。
  
  信息不是物质,不是能量,信息是什么?
  
  信息是在结构、时间上形成的衍生物,是思维软构体的指代,仅此而已。构成人类文字的最小元素是符号或笔划,数学中最基本的抽象是0和1,代数中最基本的抽象是常量和变量,几何中最基本的抽象是点线面。在抽象的基础上,认知产生联想和交互,从线性到非线性,从确定性到不确定性,从可逆可还原到不可逆不可还原,从简单到复杂。在人的认知空间里,倘若没有抽象和联想,就没有数字、符号和编码,数学、语言和文字,更不用说信息、知识和模型,方程、算法和程序。而符号、文字、模型、算法、程序都是软构体,是非物质的、非客观存在的,只是人的智能活动。例如,人能够识别纸上、墙上印刷的千差万别的图形“A”这些硬构体,并将其合并、归类、抽象成认知空间的软构体“A”。软构体并不存储于某个孤立的记忆单元里,而是体现在人脑神经元网络拓扑之中。各类抽象概念,如“山”“水”“树”“房子”“人”“宠物”等,都是思维软构体,根据不同的场合和任务可以变化性地指代物理世界的同一个或多个特定实体(如女孩、女性、大姐);同一个硬构体也可以在不同的情境和环境下变化地被赋予认知空间里的各种各样的软构体,甚至可以是千差万别的软构体。人们常说的信息,只是软构体的冰山一角。人脑借助软构体思维、想象和创造,解释人的精神世界,解释人类的认知,也解释生命的价值,开辟了“结构性、时间性的科学、技术和工程”。
  
  包括信息在内的思维软构体,不是构成物理世界的真实存在,不具有客观性或物质性。同时,结构和时间也深深地、精细地寄生在物质性和能量性的科学、工程和技术之中,解释人类所处的物质世界,润物细无声地渗透到各种各样的人造物之中,成为物理空间越来越多的真实存在,如人造建筑、人造卫星、互联网、智能机器,乃至人工生命。为方便理解,我们来看下面这个关于音乐的例子。
  
  人脑创造的乐谱是软构体,表达的是信息、情感、艺术和人文,是形而上的。同一首乐谱可以在不同硬构体(乐器)上表现出来,无论用小提琴、二胡、钢琴、架子鼓等哪种硬构体来演奏,表现的都是同一首乐谱。乐谱是形而上的、精神的、非物质的;而人们听到的音乐是物理世界客观存在的、缓急变幻的、或强或弱的、含有丰富频谱的声波信号,蕴含了物质、能量、结构和时间,是形而下的,体现美,也体现知行合一。交响乐呈现的壮丽景象,往往是“涌现”的外在表现。
  
  结语
  
  认知物理学提出物质、能量、结构和时间是人类和机器认知的最基本要素。地球依靠日月更替、四季轮回保持秩序,人类社会群体依靠结构和社会秩序保持运转,与生命一样,都赖负熵为生。同样,认知机器用能量产生时钟,时钟产生时序,支撑递归,维持机器负熵。时钟不停,与外界交互不息,则思维和认知不息。人的一生以80年计,大约是25亿秒的时间长度,人的思维周期通常是亚秒到毫秒级,而认知机器的思维周期可以是皮秒(10秒~12秒)级。倘若机器以飞秒计算,人以秒计算,1飞秒与1秒的比例,接近于1秒和3200万年的比例。让机器去浓缩重演一个百岁人生的思维总量,只需不到几秒钟就可以完成,这就是机器的暴力思维。同时,机器还有注意力集中、不会疲劳的优势。未来,我们要突破图灵机的局限,发展难以计算的记忆智能和具身交互智能;用云模型、数据场、拓扑势、云变换等认知物理学理论和方法,来形式化人类的不确定性认知,通过抽象得到结构、联想引发类比、交互形成反馈,进而集符号主义、连接主义和行为主义之大成,形成认知螺旋,实现认知的自成长;研发可交互、会学习、自成长的认知机器,探究机器认知如何像人、又如何不像人,开辟各智其智、智人之智、智智与共的人工智能新方向。
  
  回看本文开头“乌龟叠乌龟”的说法,物质、能量、结构和时间成为人类认知自然和自身共同的奠基石,成为人类智能和人工智能共同的奠基石。人工智能浓缩重演人类智能,同时也回答了“信息不是物质,不是能量,信息是什么”的根本问题。
  
  文章来源:《学术前沿》杂志2024年第14期(注释从略)