第237章 真正地做数学推导(2 / 2)
请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。
刘浩然显然早有准备,他打开一个新的窗口,输入了一行字。
“‘证明:如果一个数能被3整除,那么它的各位数字之和也能被3整除。’这是一个初中级别的数学命题,表述很简单,但涉及到自然语言和形式化逻辑之间的转换。”
他先在一个开源的通用大模型上运行。
模型很快给出了答案,文字流畅,步骤清晰,甚至还贴心地加上了“由此可知”这样的过渡词。
“看起来没问题,对吧?”刘浩然笑了笑,手指点在屏幕上,“但您看这里。”
他放大了其中一行。
模型在推导过程中写了一句“设该数为abc,其中a、b、c分别为百位、十位、个位数字”。
“它把‘各位数字之和’理解成了‘三位数的各位数字’,所以它的证明只对三位数成立。它没有真的理解‘任意正整数’这个概念,只是从语料库里匹配到了一个最常见的教学案例。”
林正宏皱起了眉头。
这个问题他太熟悉了。
市面上的大模型,写文章、做总结、回答常见问题都很流畅,可一旦涉及需要严密逻辑推理的内容,就会暴露出“不懂装懂”的本质。
刘浩然关掉开源模型的窗口,打开了小智的测试界面,输入了同样的问题。
小智的回应出现在屏幕上。
“命题:对于任意正整数n,若3|n,则3|S(n),其中S(n)表示n的各位数字之和。
证明:设n的十进制表示为n=a_k·10^k+a_{k-1}·10^{k-1}+…+a_1·10+a_0,其中0≤a_i≤9。
注意到10≡1(od3),故10^≡1(od3)对任意非负整数成立。
因此n≡a_k+a_{k-1}+…+a_0=S(n)(od3)。
若3|n,则n≡0(od3),从而S(n)≡0(od3),即3|S(n)。证毕。”
刘浩然转过头看着林正宏。
“林总,看到这里,或许您已经发现了不同吧。”
林正宏是做技术出身,虽然不是数学专业,但基础的逻辑素养还在。
他盯着屏幕上的证明,眼睛越来越亮。
“它……它用的是模运算,适用于任意正整数。”
“对。”刘浩然点头,“它没有套用任何现成的教学案例,而是从十进制表示的一般形式出发,抓住了‘10模3余1’这个本质属性。这说明它是真的理解了问题的结构,而不是在做模式匹配。”
“目前市面上所有的大模型,本质上都是‘超高级的完形填空’。它们根据前文预测下一个词,预测得多了,看起来就像是在思考。
但它们没有真正的理解能力。”
“而小智不一样。”
他切到小智的系统架构图。
“这套框架,核心思路是把自然语言、符号逻辑、数学结构这三层完全解耦。
普通的模型处理一句话,是把所有信息搅在一起,像一锅粥。
小智处理一句话,会先把语义层剥开,搞清楚‘这句话在说什么’。
然后把逻辑层分离出来,分析‘这句话的逻辑结构是什么’。
最后把符号层提取出来,确定‘这句话对应哪些数学对象和运算规则’。”
“三层分别处理完之后,再通过辛几何映射模块,把这些信息嵌入到一个加权度量空间里。
在这个空间里,语义相近的概念距离近,逻辑相关的结构有特定的几何对应关系。
然后弗洛尔同调模块在这个空间里做轨道分类,本质上就是在寻找从前提通往结论的最优路径。”
“所以它不是在做文字游戏,它是在真正地做数学推导。”