数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 1639|回复: 0

GPT-4 很强大但仍有诸多谜团,OpenAI 选择只透露这么多

[复制链接]
发表于 2023-3-23 22:35 | 显示全部楼层 |阅读模式
GPT-4  很强大但仍有诸多谜团,OpenAI  选择只透露这么多

作者:方晓 来源:澎湃新闻 发布时间:2023/3/16 11:40:20

人工智能研究机构 OpenAI 3 月 14 日发布了备受期待的大模型 GPT-4 。GPT-4 在关键方面对其前代 GPT-3 进行了改进,例如提供更符合事实的陈述,并允许开发人员更轻松地规定其风格和行为。它是多模态的模型,可以理解图像内容。但是,GPT-4 也有严重的缺陷,与 GPT-3 一样,该模型会产生“幻觉”并犯下基本的推理错误。

GPT-4 发布后,多家媒体关注的焦点是,OpenAI 并没有透露很多细节,包括该模型有多大的参数,性能为什么更好。“ GPT-4 是该公司发布过的最机密的版本,标志着其从非营利性研究实验室全面转变为营利性科技公司。”《麻省理工科技评论》的文章称。

OpenAI 的首席科学家伊利亚·苏茨克沃(Ilya Sutskever)在公告发布一个小时后通过视频通话与 GPT-4 团队成员交谈时说:“你知道,我们目前无法对此发表评论。”“竞争非常激烈。”

为了更好地了解 GPT-4 的开发周期及其功能和局限性,科技媒体 TechCrunch 14 日采访了 OpenAI 的联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)。当被要求比较 GPT-4 和 GPT-3 时,布罗克曼说:“就是不同。”“(该模型) 仍然存在很多问题和错误……但你确实可以看到微积分或法律等技能的飞跃,从某些领域的非常糟糕到相对于人类来说实际上相当好。 ”

到底有多大的训练参数?

测试结果显示,在美国大学先修课程微积分 BC 考试中,GPT-4 获得 4 分(满分 5 分),而 GPT-3 获得 1 分。GPT-3.5 是 GPT-3 和 GPT-4 的中间模型,也获得 4 分。模拟律师考试方面,GPT-4 以排名前 10% 的成绩通过,GPT-3.5 的分数徘徊在后 10% 左右。(详见澎湃科技报道《 OpenAI 发布多模态大模型 GPT-4 :直接开放 API ,ChatGPT 升级》)

GPT-4 更有趣的方面之一是多模态。与 GPT-3 和 GPT-3.5 只能接受文本提示不同,GPT-4 可以接受图像和文本提示来执行某些操作。这是因为 GPT-4 接受了图像和文本数据的训练,而其前代仅接受了文本训练。

GPT 是 Generative Pre-training Transformer(生成式预训练 Transformer)的缩写。OpenAI 于 2018 年推出具有 1.17 亿个参数的 GPT-1 模型,2019 年推出具有 15 亿个参数的 GPT-2 ,2020 年推出有 1750 亿个参数的 GPT-3 。ChatGPT 是 OpenAI 对 GPT-3 模型微调后开发出来的对话机器人。

但是,OpenAI 这次选择不透露 GPT-4 训练数据的具体规模。在新闻公告里,OpenAI 只表示,它使用与 ChatGPT 相同的方法取得了这些结果——通过人类反馈强化学习。这要求人类评分者对来自模型的不同响应进行评分,并使用这些分数来改进未来的输出。

OpenAI 表示,训练数据来自“各种被许可、被创建和公开可用的数据源,其中可能包括公开可用的个人信息”,但当被询问具体细节时,布罗克曼拒绝回答 TechCrunch 。据悉,训练数据之前曾让 OpenAI 陷入关于版权的法律纠纷。

在接受《纽约时报》的采访时,布罗克曼则表示,OpenAI 的数据集是“互联网规模的”,这意味着它涵盖了足够多的网站,可以提供互联网上所有说英语的人的代表性样本。

“缓慢而有目的”地推广图像功能

GPT-4 的图像理解能力令人印象深刻。例如,输入提示“这张图片有什么好笑的?一个图一个图地描述它”,加上一张拼图,显示一条假 VGA 电缆被插入 iPhone ,GPT-4 给出了每个图的详细描述并正确解释了这个笑话:这个图像中的幽默来自于荒谬地将过时的大的 VGA 连接器插入小的现代智能手机充电口。

“在过去几年里,一个好的多模态模型一直是许多大型技术实验室的圣杯。”开源大型语言模型 BLOOM 背后的人工智能初创公司 Hugging Face 的联合创始人托马斯·沃尔夫(Thomas Wolf)说, “但它仍然难以捉摸。”

从理论上讲,结合文本和图像可以让多模态模型更好地理解世界。“它可能能够解决语言模型的传统弱点,比如空间推理。”沃尔夫说。尚不清楚 GPT-4 是否如此。

目前只有一个 OpenAI 的合作伙伴可以使用 GPT-4 的图像分析功能——一款名为 Be My Eyes 的视障人士辅助应用程序(详见澎湃科技报道《第一批公司已采用 GPT-4 ,都用它来做些什么?》。布罗克曼表示,随着 OpenAI 评估风险和收益,无论何时进行更广泛的推广,都将是“缓慢而有目的”的。

布罗克曼说,面部识别以及如何处理人物图像等方面存在政策问题。“我们需要弄清楚危险区域在哪里,红线在哪里,然后随着时间的推移弄清楚这一点。”

此前,OpenAI 围绕其文本到图像系统 DALL-E 2 面临了类似的道德困境。在最初禁用该功能后,OpenAI 又允许用户上传人脸以使用人工智能图像生成系统对其进行编辑。当时,OpenAI 称其安全系统的升级使面部编辑功能成为可能,因为最大限度地减少了深度造假,以及试图创造性、政治和暴力内容的潜在危害。

从每 3 个月发布一个新模型转向不断改进”

另一个老问题是防止 GPT-4 以可能造成伤害的方式被使用,包括心理、金钱等方面。该模型发布数小时后,以色列网络安全初创公司 Adversa AI 发布了一篇博文,展示了绕过 OpenAI 内容过滤器并让 GPT-4 生成网络钓鱼电子邮件、对同性恋者的攻击性描述和其他令人反感的文本的方法。

这在语言模型领域并不是一个新现象。Meta 的 BlenderBot 和 ChatGPT 也被提示说出非常冒犯的话,甚至透露有关其内部运作的敏感细节。但许多人曾希望,GPT-4 可能会在这方面带来重大改进。

当被问及 GPT-4 的稳健性时,布罗克曼强调该模型已经接受了 5 个月的安全训练,并且在内部测试中,它响应 OpenAI 政策不允许的内容请求的可能性降低了 82% 。

“我们花了很多时间试图了解 GPT-4 的能力。”布罗克曼说,“把它带到外面的世界是我们学习的方式。我们不断进行更新,包括一堆改进,这样模型就更能扩展到你希望它处于的任何个性或某种模式。”

布罗克曼并不否认 GPT-4 的不足,但他强调了该模型新的缓解性控制工具,包括一种称为“系统”消息的 API(应用程序编程接口)级能力。系统消息本质上是为 GPT-4 的互动设定基调并建立界限的指令。例如,一条系统信息可能是这样的:“你是一个总是以苏格拉底方式回答问题的辅导员。你从不给学生答案,而总是试图提出正确的问题,帮助他们学会自己思考。”系统信息作为护栏,可以防止 GPT-4 偏离方向。

“真正弄清楚 GPT-4 的语气、风格和内容一直是我们的一个重要关注点。”布鲁克曼说,“我认为我们开始有点了解如何做工程,如何有一个可重复的过程,让你得到可预测的结果,对人们真正有用。”

布罗克曼还提到了 Evals ,这是 OpenAI 刚刚开源的软件框架,用于评估其人工智能模型的性能,是 OpenAI 致力于“健全”其模型的一个标志。Evals 让用户开发和运行评估 GPT-4 等模型的基准,同时检查其性能,这是一种模型测试的众包方法。

“通过 Evals ,我们可以以一种系统的形式看到用户关心的(用例),能够进行测试。”布罗克曼说,“我们(开源)的部分原因是,我们正在从每3个月发布一个新模型转向不断改进。做东西应该要衡量,对吗?当我们制作新的版本时,我们至少可以知道这些变化是什么。”

新的上下文窗口

布罗克曼还谈到了 GPT-4 的上下文窗口(context window),它指的是模型在生成其他文本之前可以考虑的文本。 OpenAI 正在测试 GPT-4 的一个版本,它可以“记住”大约50页的内容,是普通版 GPT-4 在其“记忆”中所能容纳的内容的五倍,是 GPT-3 的八倍。

布罗克曼认为,扩大的上下文窗口会带来新的、以前没有探索过的应用,特别是在企业中。他设想了一个为公司建造的人工智能聊天机器人,利用来自包括各部门员工的不同来源的背景和知识,以一种非常明智但对话性的方式回答问题。

这不是一个新概念。但布罗克曼提出的理由是,GPT-4 的答案将比今天的聊天机器人和搜索引擎的答案有用得多。

“以前,该模型对你是谁、你对什么感兴趣等没有任何了解。”布洛克曼说,有了这种历史(更大的上下文窗口),肯定会让它更有能力......它会使人们能做的事更多。”

科学交流类似于产品新闻稿

即使看过了布罗克曼的采访,但 GPT-4 还有很多谜团没有解开。“ OpenAI 现在是一家完全封闭的公司,其科学交流类似于产品新闻稿。”沃尔夫说。

《麻省理工科技评论》认为,当下,GPT-4 与其他多模态模型并驾齐驱,包括来自人工智能研究机构 DeepMind 的 Flamingo 。Hugging Face 也正在开发一种开源多模态模型,其他人可以免费使用和改编该模型。面对这样的竞争,OpenAI 将 GPT-4 更多地视为产品挑逗,而不是研究更新。

目前,构建和服务聊天机器人非常昂贵,因为它是在更大数量的数据上训练的,所以 GPT-4 会增加 OpenAI 的成本。OpenAI 的首席技术官米拉·穆拉蒂(Mira Murati)告诉《纽约时报》,如果该服务产生过多流量,该公司可能会限制对该服务的访问。

但从长远来看,OpenAI 计划构建和部署可以处理多种媒体的系统,包括声音和视频。“我们可以采用所有这些通用知识技能,并将它们传播到各种不同领域。”布罗克曼说,“这将技术带入了一个全新的领域。”

许多其他公司正在排队等候。“对于大多数公司来说,启动这种规模的模型的成本是无法承受的,但是 OpenAI 所采用的方法使大型语言模型对于初创公司来说非常容易获得。” Tola Capital 的联合创始人谢拉·古拉提(Sheila Gulati)说, “这将在 GPT-4 之上催化巨大的创新。”
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-12-23 09:42 , Processed in 0.136719 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表