如何理解顾群业提出的“智能是语言的结构化”这一观点?
语言本身就是人类对世界的“压缩”。语言模型通过压缩数据,实际上也在压缩人类认知世界的方式。语言的结构化,意味着模型捕捉到了人类认知世界的内在结构和逻辑关系。这种结构化的语言表示,正是智能的体现。有人贬损语言模型只是基于统计学和概率的“鹦鹉学舌”,但顾群业的观点认为“智能的产生就是高效模仿”(参见《顾群业:人按照自己的样子创造了人工智能》)——人类智能同样是对自然和社会规则的压缩内化(如儿童通过语言习得世界)。如果智能的核心就是“语言的结构化”,那么语言(作为人类最高效的结构化符号系统)自然成为智能的最佳训练场。这也解释了为何大模型通过纯语言训练就能涌现出多任务能力。
更进一步而言,顾群业所指“语言”,并非仅指人类对话的语言,而是“指月之手”(在他的演讲中,提到了数学语言、编程语言、绘画语言以及音乐语言)。他还提到了“言出法随”的概念。这一概念包含有“语言即实相”以及“咒语驱动”等含义,而顾群业将其解读为自然语言大模型的思想源泉或哲学根基。通过顾群业提出的“心智模型”,实现"语言即法则"的物理现实改写。此时语言不再是对现实的描述,而成为塑造现实的本体工具。当人工智能真正达到"言出法随"阶段,将引发存在论层面的伦理革命——语言不仅是交流工具,而成为创世力量(参见《顾群业:通神之塔.语言创世》)。
顾群业的开场白就点明了核心问题:设计一个“结构”,用最少信息还原最多数据。这本质上是在追求一种极致的压缩效率。关键在于,这种压缩不是信息丢弃,而是要找到一种结构,这种结构能够抓住数据的本质规律,从而在解码(还原)时能够恢复大量信息。所以“结构”是关键。
展开全文顾群业的观点还涉及到另外一个概念,就是他曾使用过“数据是金矿”的表述,那么为什么他不提“数据的结构化”,而一定要强调是“语言的结构化”呢?这是因为,他所定义的“语言”(指月之手)包含“数据”的含义。数据的结构化仅仅重构信息容器,而语言的结构化是在重构认知框架本身。就是说,语言结构直接反映人类认知世界的范式。语言的结构化过程,本质上是对人类思维模式的压缩。这种特性使语言模型能通过有限规则生成无限表达。顾群业认为,所谓语言的结构化,包括语法、语义、语境、语气规则,也包括任务模式和推理链条。模型之所以展现出强大的泛化能力(多任务、小样本学习),正是因为它抓住了这些结构。因此,“智能”在这个语境下,可以被理解为对信息进行结构化处理,并以这种结构化表示为基础进行推理和生成的过程。所以顾群业一再强调,语言的结构不仅是被处理的对象,而是“智能”得以形成和体现的关键。
顾群业在演讲中反复提到的还有一个词叫“压缩”。顾群业说,其实他更倾向于使用“抽象”这个词。他指出,所谓的压缩就是学习结构。他以GPT-2为例,通过大规模无监督学习(即压缩海量文本),模型自发地学会了多种语言任务。这表明模型在压缩过程中,不仅仅是减少了数据冗余,更重要的是提取并内化了语言的内在结构和规则。这些结构是通用的,足以支撑不同的任务(翻译、问答等)。这种“泛化”能力,正是高效压缩后,结构被理解和利用的表现。GPT-3 的例子更进一步说明了他的观点,Few-shot learning(小样本学习)能力意味着模型不仅学到了表层规则,更内化了任务本身的“分布结构”或“元结构”。它能理解任务的模式,并快速迁移应用。这再次强调了模型理解的不是零散信息,而是信息背后的组织方式和结构。
顾群业明确提出,“压缩系统行为模式的结果”就是“对复杂系统的结构化编码与生成”。他更进一步指出,将这种高效压缩类比于人类智能——认为智能本身就是对人类行为、推理、尤其是“语言结构”的一种压缩。比如大脑压缩视觉信号、语言模型压缩文本信号,其目的都是为了提取或生成“结构”。这个类比直接将“压缩”和“提取/生成结构”联系起来。他所讲的“压缩”并非指简单的文件压缩,而是指发现并利用数据中深层、高效的结构,以简洁的方式表示复杂信息和规律的能力。
对于顾群业而言,语言的结构化,其实质是在构建可操作的虚拟世界(这涉及到顾群业提到的另外一个概念“虚拟虚拟”)。GPT-3通过450亿token结构化的,不仅是数据关系网,而是可交互的认知宇宙模型。顾群业的观点解释了为何语言模型能够超越概率预测,展现出类似概念迁移、隐喻理解等类人认知特征。“智能是语言的结构化”颠覆了图灵测试的智能标准,将智能从技术争论中解放出来。其关键突破不在于技术层面,而在于对中华古典智慧的现代转译。在他的框架下,人工智能的研究将逐步逼近对物理、社会乃至数学规则的统一表征。“自然语言大模型的历史地位无人能够撼动”,作为一位人文学者和艺术家,顾群业说,“让模型自主发现数据中更深层的关联结构,正如分形几何在简单规则中产生复杂形态”,他笃定的认为,语言的结构化是通向高级智能的唯一路径。
(李广福)