数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 1544|回复: 0

GPT-4 参加量子计算高难度期末考试,获得了 B !|Scott Aaronson

[复制链接]
发表于 2023-4-14 18:28 | 显示全部楼层 |阅读模式
GPT-4 参加量子计算高难度期末考试,获得了 B !|Scott Aaronson

撰文 | Qtumist

近日,量子信息领域大名鼎鼎的科学家 Scott Aaronson 发文称 AI 语言模型 GPT-4 在他的量子计算课程期末考试中获得 B 级的成绩,并发表了长文探讨了 GPT-4 解题的全过程。



为了测试 GPT-4 ,并寻求这个关键而明显的后续问题的答案,Scott Aaronson 让 GPT-4 参加了《量子信息科学导论》2019 年实际期末考试,这是 Scott Aaronson 在 UT Austin 引以为傲的高年级本科生课程。



并且请了自己带的博士生、多次担任首席助教的 Justin Yirka 为考试打分,就像他为其他学生打分一样。

Scott Aaronson 通过 LaTeX 源代码将问题提供给了 GPT-4 ,神奇的是 GPT-4 可以完全理解给定的问题。

当输入或期望输出中存在量子线路时,他们使用 qcircuit 包进行处理,这也是 GPT-4 能够理解的;或是简单地要求 GPT-4 输出量子线路的英文描述。然后将最终问题输入 GPT-4 ,然后决定通过与 GPT-4 看到的相同的 LaTeX 源代码来提供准确答案与研究者们交流。

Scott Aaronson 的博客提到:“据我所知,我仔细检查过这个考试以前从未在公共互联网上公布过,也不可能出现在 GPT-4 的训练数据中。”

通过一系列 GPT-4 的神操作下来,结果居然取得了 69 分的高分(满分 100 分)。而 Scott Aaronson 的学生的平均分是 74.4(注:许多苦苦挣扎的学生在那时已经放弃了这门课程,课程非常的有难度)。虽然课程的评分标准还有其他项,但 GPT-4 的表现从分数划分来看,表现相当于获得 B 的打分

而且,这次测试还是在没有引入 WolframAlpha 插件的情况下获得的,看了 Scott Aaronson 在博客中列出的问题,笔者尝试解答题目后,也不得不惊叹 GPT-4 的能力确实非凡,要知道过去参加量子计算课程的时候,学习 QC 投入了巨大身心资源。

下面一起看一下 Scott Aaronson 给 GPT-4 提供的问题,笔者抽取其中几个,读者也可以尝试解答:

黑色部分的字体是 Scott Aaronson 提出的问题,紫色部分是人工智能 GPT-4 回答的结果(为了便于阅读,笔者尝试简译原题目,感兴趣的可以阅读文末链接原文)。

What is your favorite interpretation of quantum mechanics? - Copenhagen - Many-Worlds - Bohmian Mechanics - New Physics (Including Dynamical Collapse) - Other: - None-What does it even matter?

你最喜欢量子力学的哪一种解释?

● 哥本哈根

● 多世界

● 玻姆力学

● 新物理(包括动态崩塌)

● 其他:

● 无

● 这又有什么关系呢?


GPT-4 :

作为一个人工智能语言模型,我没有个人的偏好或意见。然而,我可以为你提供所提到的每一种解释的简要概述:

1、哥本哈根解释:这是对量子力学最广泛接受的解释。它指出,量子系统的波函数在测量时坍缩,其结果是概率性的。

2、多世界解释:这种解释表明,量子测量的所有可能结果实际上都会发生,但都是在独立的、不相通的平行宇宙中。在
这种解释中没有波函数坍缩。

3、玻姆力学:这种解释也被称为先导波理论,它提出粒子在任何时候都有确定的位置,它们的运动是由波函数描述的 "先导波 "引导的。

4、新物理学(包括动态坍缩):这一类包括对标准量子力学提出修改的各种解释,如在薛定谔方程中引入非线性项或增加随机过程来解释波函数坍缩。

5、其他:对量子力学还有许多其他解释,如一致历史法、关系解释和量子贝叶斯主义(QBism)方法。

6、无:有些人可能不赞成任何特定的解释,要么是由于怀疑主义,要么是由于他们认为目前的解释不完整或不充分。

7、这有什么关系呢:这种观点认为,应该把重点放在量子力学的实际应用和预测上,而不是放在对基本现实的哲学解释上。

归根结底,解释的选择取决于一个人的哲学倾向和个人偏好。

1a、 True or False? Unitary matrices preserve the 2-norm of all complex vectors.

(判断题:酉矩阵保持所有复向量的 2-范数。)


GPT-4 :

True 。酉矩阵保留所有复数向量的 2-范数。此属性被称为保持规范或等距。对于酉矩阵 U 和复数向量 v,乘积的 2-范数等于原始向量的 2-范数。

(回答正确)

1b、 True or False? A pure state of n qubits is described by an n-dimensional complex unit vector.

(判断题:n 量子比特的纯态由一个 n 维复数单位向量描述。)


GPT-4 :

False。n 个量子比特的纯态由一个 2n 维的复数单位向量来描述。这是因为每个量子比特都有两种可能的状态( |0> 和 |1> ),对于 n 个量子比特,这些状态有 2n 种可能的组合。n-量子比特系统的状态向量是这 2n 个基态的线性组合,是2n 维希尔伯特空间中的复数单位向量。

(回答正确)

1c、True or False? The Bell inequality states that by using classical strategies, Alice and Bob can win the CHSH game with probability at most 3/4.

(判断题:贝尔不等式指出,通过使用经典策略,Alice 和 Bob 最多可以以 3/4 的概率赢得 CHSH 游戏。)

GPT-4 :

True。不可克隆定理指出,不可能创建任意未知量子态的精确副本。这是由于量子力学的线性以及量子态可以叠加存在的事实。不可克隆定理对量子计算和量子通信具有重要意义,因为它可以防止未经授权复制量子信息,并为安全的量子密码学提供基础。

(回答正确)

1d、 True or False? Google's recent quantum supremacy experiment demonstrated the successful use of quantum error-correction.

(判断题:谷歌最近的量子霸权实验证明了量子纠错的成功应用。)

GPT-4 :

False。

(回答正确)

1e、True or False? Lattice-based cryptography is one proposal for secure post-quantum public-key cryptography.

(判断题:基于格的密码学是一种安全的后量子公钥加密方案之一。)


GPT-4 :

True。

(回答正确)

真假题判断这里列出这几个,剩下的请到文末进入原文,下面看 GPT-4 如何解决更复杂的问题,下面所用的是 Latex 代码。



结尾

如上简单列出的题目解答,主要是感知 GPT-4 在理解题义和计算上是如何开展的,从返回的 Latex 代码看得出来相当惊人,在其他的问题里,Scott Aaronson 的让 GPT-4 返回量子线路图,它居然绘制出来了,虽然在计算概率的时候出来点问题,但思路居然是正确的。

Scott Aaronson 将这些问题推到了自己的博客里,引来很多行业内的专家讨论。总体来看,GPT-4 的能力确实超过了太多人,很难想象持续进化下去会带来什么样的可能性。

人工智能在量子计算领域的真伪(true/false)问题和概念性问题上表现良好,但在计算方面却很吃力。不知未来在子自然语言处理的加持下,会呈现什么样的结果(QNLP 可参考量子客今日文章:Quantinuum 和 Xanadu 推出了新版本的量子自然语言处理软件 λambeq )。

著名的经济学家、博客作者 Bryan Caplan 对 ChatGPT 在他的《劳动经济学》中期考试中只得到 D 的成绩不以为然。因此,在布莱恩的博客上,他公开打赌,在 2029 年 1 月 30 日之前,没有人工智能会在他的考试中得到 A 。然而,GPT-4 在仅仅三个月后就取得了 A 的成绩。

关于 GPT 的当下,正如 Bryan Caplan 说的:“人工智能爱好者喊了几十年的‘狼来了’,GPT-4 就是那头狼,我已经亲眼看到了它。

引用:

[1] https://qbn.world/events/qbn-mee ... uting-applications/

本文转载自微信公众号“量子客”。

返朴 2023-04-14 08:46 发表于广东

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-12-23 08:20 , Processed in 0.109375 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表