OpenAI 将 GPT-4.1 和 GPT-4.1 Mini 引入 ChatGPT,性能全面提升
OpenAI 近日宣布将其旗舰模型 GPT-4.1 引入 ChatGPT。所有付费账户和团队用户均可通过模型选择器下拉菜单使用该模型。不过,免费用户无法访问此功能,但企业版和教育版用户可以正常使用。
与此同时,所有用户(包括免费账户)的 GPT-4.0 Mini 将被升级为 GPT-4.1 Mini。付费用户也可以在下拉选择器中找到 GPT-4.1 Mini 模型。
OpenAI 表示,GPT-4.1 及其 Mini 版本针对编码任务进行了优化,并增强了指令响应能力,整体性能优于 GPT-4.0。
OpenAI 的 GPT-4.1 全面超越 GPT-4.0
据 OpenAI 介绍,GPT-4.1 提供了更大的上下文窗口,支持多达一百万个上下文标记,能够更好地处理长篇内容的理解任务。这种改进将使软件工程师开发 Web 应用程序时受益匪浅。
根据 OpenAI 的发行说明,工程师可以利用该模型完成日常查询、后续问题、编码以及其他复杂任务。
与 GPT-4.0 的 128,000 个 token 限制相比,GPT-4.1 能够处理海量文本、图像和视频。数据显示,GPT-4.1 在 SWE-bench Verified 测试中的得分为 54.6%,比 GPT-4.0 提高了 21.4%,比 GPT-4.5 提高了 26.6%,成为当前编码任务的最佳模型。
此外,在 Scale 的 MultiChallenge 基准测试中,GPT-4.1 的得分为 38.3%,比 GPT-4.0 提高了 10.5%。在多模态长上下文理解基准测试 Video MME 中,GPT-4.1 在长篇无字幕视频类别中取得了 72.0% 的高分,比 GPT-4.0 提高了 6.7%。
OpenAI 表示,这些基准测试为模型优化提供了宝贵的见解,并感谢开发者社区对复杂任务的支持。
GPT-4.1 缺乏安全报告引发争议
然而,人工智能研究界对 OpenAI 在发布 GPT-4.1 时未附带安全报告提出了批评,认为这降低了透明度标准。
OpenAI 辩称,尽管 GPT-4.1 性能和速度均优于 GPT-4.0,但由于其并非前沿模型,因此不需要详细的安全报告。
GPT-4.1 并未引入新的模式或交互方式,智能水平也未超越此前的标准。这意味着,这里的安全考虑虽然重要,但与前沿模型有所不同。
–约翰内斯·海德克,OpenAI 安全主管
为回应相关质疑,OpenAI 承诺将在未来公布内部模型安全评估结果,以提高透明度。
此外,OpenAI 正在努力通过收购扩展其技术生态。据报道,该公司即将以 30 亿美元收购知名 AI 编码工具 Windsurf。Windsurf 的竞争对手包括 Cursor,以及微软和 Anthropic 等公司现有的 AI 编码工具。
前 OpenAI 创始人 Andrej Karpathy 表示,Windsurf 是近几个月备受开发者青睐的一款工具,用于快速编写新软件代码。该初创公司的投资者包括 Founders Fund、General Catalyst、Greenoaks 和 Kleiner Perkins。
另一方面,谷歌更新了其 Gemini 聊天机器人,使其更轻松地连接到 GitHub 项目。此前,OpenAI 推出了一个 GitHub 连接器,用于ChatGPT深入研究。GitHub 连接器工具会搜索网络和其他来源,以生成详尽的研究报告。
本周二,OpenAI 宣布 SharePoint 和 Microsoft OneDrive 连接器正式加入 ChatGPT 深入研究功能。
Cryptopolitan 学院:厌倦了市场波动?了解 DeFi 如何助你建立稳定的被动收入。立即注册
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场