luyuanhong 发表于 2024-4-1 13:39

数学教育革命势在必行

数学教育革命势在必行

原创 熊墨淼 人工智能研究学会 2024-01-27 08:43 北京

数学是一切科学的基础。科学发展到今日,不论是物理,化学,生物,还是心理学,社会科学都要用数学来归纳,总结和发各领域的规律。以前大多数人认为数学是数学家大师的事情,需要长时间的专门训练。但是通用人工智能的出现,几乎从根本上改变了我们关于数学的想法。

出于好奇,近来我用 GPT4 ,也就是自然语言,解决小学算术,初等数学,微积分,常常微分方程,复变函数,动态系统,最优化,离散微分流形,概率、统计和因果推断领域的问题。小学的算术题,也就是我们读小学时曾难倒过我们的诸如鸡兔共笼,相对运动等的四则应用题,只要我们用英语描述问题输入给 GPT4 ,答案连带公式,解题步骤,解释都用和我们教科书一样的自然语言输出来了。中学代数的方程,初等函数,因式分解等也都一一正确地给出答案。平面几何,三角函数,我也测了少数题目,大多结果令人满意。但求三角级数的和,有的结果不正确。

我记得,刚进大学时,许多求极限的题目常都困扰我。这次我选了几个较难的求极限的题目,GPT4 几乎不假思索,极快地给出了步骤和答案。我测试了较为繁琐的求导问题,也没有难倒它。在导数的应用中,我记得复旦大学陈传璋教授编的《数学分析》一书中包括了用拉格朗日乘子求解等式约束的问题,但沒有包括求解不等式约束的最优化问题。这次,我选了不等式约束的最优化问题去测试,GPT4 也迅速地给出了正确的答案。求无穷定积分有时需要一定的技巧。令我惊奇的是,在我沒有任何提示的情况下,GPT4 利用复变函数的残数定理算出了一道非常难的无穷定积分问题。我也测试了无穷级数的收敛判断和求和问题,GPT4 对许多历史上有名的如贝塞尔函数在没有给出任何提示的情况下给出收敛性证明和求和的结果。曲面积分由于涉及到许多较难直观想象的复杂的图象,有时我们往往算错。但 GPT4 在我的测试中都能给出正确的答案。付里叶变换以及动态控制系统的拉普拉斯变换无一例外都给出了正确的答案。

我在大学读《常微分方程》一课中选用了复旦大学金福临,李训经教授在 1961 年出版的《常微分方程》一书。我在该书中选用了两道题。一道题是求高阶微分方程的解,一道是判别一动态系统的稳定性。高阶微分方程的求解,没有任何题示,GPT4 很快给出了正确的答案。但判断一非线性动态系统的稳定性,GPT4 开始时用线性系统的近似方法求解,但结果是系统需提供进一步的信息才能判断系统是否稳定。在我提示用李雅普洛夫方法后,GPT4 给出了系统不稳定的正确答案。

复变函数测试,我从教科书选用了两道题。一道题是复变函数的罗朗级数展开。GPT4 很快给出了答案,但和正确的答案相差一个符号。我仔细审查了 GPT4 的解题过程,发现在他的推导过程中从上一步到下一步的时候缺少一个符号。

我也测试了两道概率题:一道是求具有复杂密度函数的随机变量的数学期望,一道是求两个指数分布的最小值的分布函数。GPT4 都快速地给出了正确答案。

我也研究了动态系统的问题。我也选了三道题。一道是二阶机械阻尼系统的阶跃函数的响应。GPT4 画出了漂亮的响应曲线。一道是三维动态系统的可控性和可观察性。GPT4 判定该系统是可控的和可观察的。第三道题是求解最优控制。GPT4 利用庞特里雅金极值原理求解了最优控制。

我长期在统计遗传领域工作,自然我要测试统计遗传的问题。我从我的 2018 年出版的《Big data in omits and imaging》一书中的连续不平衡,关联性分析,QTL 分折,单个表象,多个表象分别选了一些题目和一些实际数据进行测试。所有的概念性问题都能迅速给出答案。对于数值分析的题目,常用的算法甚至在有缺失值的时候,GPT4 都能自动补齐,然后给出准确的答案。但对于 SKAT ,GPT4 推荐了 SKAT 的 R 和 Python 的专门软件。因手头没有 SNP 的基因组的位置信息,泛函分析方法没有测试。

因果分析测试了基于结构方程的网络方程和单个变量的因果分析。结构方程分析一般要假定有向图的结构,然后可用多种方法估计结构方程的参数。因结构方程研究许多年,GPT4 有现成的算法估计结构方程的参数。但考虑两个变量之间的因果关系是近十几年才兴起的事情。Additive noise model(ANM)是因个变量之间的主要因果分析模型。ANM 与回归分析的主要不同之处是 ANM 用于判断因果关系除了与回归分析一样,要判断其拟合数据是否好外,同时要检测其因与残差变量是否独立。拟合非线性函数我们是釆用平滑样条函数。而检测独立性是釆用残差的依赖性度量。但这种度量没有分布,甚至是渐近分布的公式也很复杂,以至于在实际应用中依赖于模拟的排列分佈。这就有一系列过程。这一系列过程要用自然语言把它描述出来。我测试了 GPT4 能准确无误地理解我用微软的词软件所撰写的算法,从而不用编码而只用自然语言所描述的算法,GPT4 执行了自然语言所描述的算法。这种能力不只是记忆,而表现出理解算法的能力,以接近我们人类思维的方式,而不是那种死板的,与我们日常使用的自然语言,数学语言很大不同的,我们称之为编码语言的如 Python 等算法语言。

回忆计算机的发展史。尽管计算机的操作系统最原始的是用如汇编语言等代码写同的,但绝大多数使用者根本不需要懂这些代码,甚至也不用懂操作系统,而只用懂和记住和我们日常思维和行动相似的东西。

自然语言会成为所有科学家无代码数据分析的平台会推动科学研究的革命性变化,会催生数学教育的革命。这几天的测试告诉我,从小学,中学到大学,几乎所有的数学问题,或可被自然语言直接解答,或被自然语言用日常司空见惯的数学语言描述的算法所解决。自然语言是数据分析,各类数学研究的平台。这会大大推动数学教育的普及,推广和发展。总结来说,它会引起如下的深刻变化。

(1)GPT4 给出了计算所依据的原理,步骤,结果和解释。使我们能复习学过的东西,进一步启迪我们的思维和独立思考。

(2)GPT4 和 Gemini 等自然语言正在不懈地努力弥合人类交流和机器理解之间的差距,使机器象人一样与人类交流、对话。人们可以用类似人的自然语言,数学公式,图象,音频和机器交流,命令机器执行人的思维。这大大地方便科学家使用数学进行研究,降低地科学研究的门槛,大大提高了科学家研究的效率。以前,我们要进行数据分析,我们要寻找和安装合适的软件,读懂和理解分析的步骤,有时还要进行人工干预。要花费不少时间。不同的软件,安装还不一样。我们还要在一定程度上熟悉编程语言,如 Python 等。十分费时。一般科学家要雇用专门的统计学家,或生物信息学家,数据分析人员来分析数据。科学家和这些数据分析人员又增加了一层交流的隔阂。科学家用科学家能理解的自然语言直接分析数据可以节省时间,费用,增加数据分析的深度,质量,增加科学家对所研究问题的理解和知识。产生数据分析的虚拟助理,逐步实现数据分析的自动化。可以预见今后专门的数据分析人员会减少,数据分析会走向自动化,全民化。

(3)GPT4 有团队合作模式。团队里的科学家可以共同分析数据,共同讨论计算的结果,从结果中总结数据中所蕴含的科学规律。

(4)GPT4 等是我们的第二大脑。以前数据分析的范式是程序员严格按照既定的算法和规则编写程序执行,程序运行中不会产生任何新的思想。GPT4 等不仅从规则中,从知识库中,而且从大量的数据中进行学习。它是生成式人工智能,可以碰撞出思想的火花,产生新的思想,发现新的科学定律。

(5)数学学习中的一困难之处往往是空间想象能力。GPT4 可以输入图象,视频和音频中扩大我们的空间想象能力,帮助我们更直观地学习数学概念,理解数学思想,生成新的数学想法。

(6)GPT4 等自然语言使我们能随时、随地在没有老师的情况下,结合自身的特点,独立地自学。提高我们的学习能力。

(7)这些自然语言自动地把我们从小到大所学的东西都记录在这些语言中,可以遗传和继承我们所学的学习知识,也可以搜索网上的文献,利用别人所积累的知识。学过的知识,数据分析过的问题把它们象一本书一本书一样组织在 GPT 中。这会大大提高我们解决实际问题的努力。

一个全民学数学,懂数学的时代即将会到来,如何促进数学教育的改革,促进这个伟大时代的到来,我初步有如下的建议。

(1)创办一份数学教育改革的杂志和论坛。讨论数学教育改革的目的、方法和步骤,报道数学教育改革的典型经验。

(2)编写新的从小学,中学到大学各专业的数学教材。

(3)开办新型学校,在线教育和短训班培养新的师资。

(4)吐故纳新,培养新一代的数学教育老师。

Appendix: Solutions of GPT4





14.



GPT: The calculated Hilbert-Schmidt Independence Criterion (HSIC) for the model is approximately 1.049×10e-7 .

15:



GPT:





16.







17.



GPT:





18. A contingency table with disease status and two alleles.




页: [1]
查看完整版本: 数学教育革命势在必行