OpenAI震撼发布里程碑式模型,代号o1:更强了,也更贵了

⭐发布日期:2024年09月26日 | 来源:猛犸视频

⭐作者:雷佳音 责任编辑:Admin

⭐阅读量:119 评论:5人

【4949澳门免费资料大全特色】

【澳门一肖一码期期结果准】

【澳门六开彩天天正版资料查询】 【澳门六开彩天天正版免费资料大全】 【2024年澳门六开彩结果查询】 【2024新澳门历史结果】 【澳门王中王100】 【吃什么降压得快效果好】 【2024新澳彩料免费资料】 【澳彩资料大全部】
【番巷二四六正版姿料】 【澳门正版资料大全有哪些】 【新澳门码精准资料】 【新澳门4949最新记录】 【香港资料大全正版资料2024年免费】 【2024年澳门天天开好彩大全】 【2O24澳门天天开好彩大全】 【天天彩澳门天天彩结果查询】

文 | 虞景霖

编辑 | 苏建勋 邓咏仪

传闻已久、拖了又拖的OpenAI模型项目“草莓”,终于现身了。

北京时间9月13日凌晨,Open AI正式发布了其首款具有推理能力的模型,代号为OpenAI o1,包括无所不能的大哥o1-preview,和效率惊人的小弟o1-mini。

OpenAI的研究负责人Jerry Tework向The Verge透露:“o1使用了一种全新的优化算法和为其量身定制的新训练数据集。”也因此模型的命名并未延续GPT系列,而是“被命名为o1,以表示‘将计数器重置回1’。”

o1的革命性意义也正在于此——这代表了大模型能力在推理这条道路上的人新起点,而不是简单地作为GPT系列的延续。

来源:OpenAI

传闻已久的o1一经上线,就在X引发广泛讨论:评论区网友拍手叫好,AI圈网红Jim Fan依旧现身宣传。

并且Jim Fan还表示,o1的发布里程碑意义在于,它验证了此前所说的“两条曲线协同工作”理论,展示了训练计算和测试计算如何共同影响模型的最终性能。

传统的模型训练强调在训练时投入大量计算资源。而o1模型代表了一种新的AI模型开发范式。它强调了测试时计算(或推理时计算)的重要性——o1通过增加在测试/推理时的计算资源显著提高了模型性能。

来源:X

“休假中”的总裁Brockman,同样现身打Call 来源:X

如果说此前的模型是用“直觉”回答问题,那么o1给出的则是深思熟虑后的回答,这一改变来自于背后的“链式思考”(Chain-of-thought)机制。

用OpenAI研究主管Mark Chen的话说就是:“模型在学习自己思考,而不是试图模仿人类的思维方式。”

简单来说,o1在给出回答前会在“脑子”里进行一场内部对话,还会使用“让我想想”“我在考虑”等短语来展示思考过程。

模拟思考过程:“我很好奇”“我正在思考”“好的,让我看看” 来源:OpenAI

o1的表现究竟如何?用数据来说话:

数学方面,在2024年美国数学邀请赛(AIME)中,GPT-4o的平均正确率为12%(15道题解决1.8题),o1在首次尝试的平均正确率就达到了74%。通过使用集体决策和高级评分策略,o1的正确率最高可达93%。这一成绩不仅让o1跻身全美前500名优秀学生之列,还超过了美国数学奥林匹克竞赛的入选分数线。

来源:OpenAI

GPQA Diamond是一项专门评估化学、物理和生物等领域专业知识的测试。o1不仅完成了这项测试,还超越了拥有超越了部分拥有相关领域博士学位的人类专家,表明AI在特定专业领域的能力已经达到了一个新高度。

来源:OpenAI

编程方面,o1在国际信息学奥林匹克竞赛(IOI)中也表现卓越,在和人类参赛者相同的条件下,o1获得了213分的高分,位列参赛者的前50%。当限制进一步放宽(每个问题的提交次数从50提高到10000次),o1取得了362.14的高分,超越了金牌的获得门槛。

在模拟Codeforces平台的竞争性编程比赛中,o1获得了1807的高分,超越了93%的人类竞争者,这一成绩远远超过了GPT-4o(Elo评分为808,仅超过11%的人类竞争者)。

来源:OpenAI

简单来说,o1是一个非常善于思考、推理的大模型。并且,其运作机制与基于scaling law的大模型不同,这让它不必基于大量的计算消耗来提升性能,而是一个相当垂直的模型。

尽管o1模型展现出了卓越的能力,但仍然存在一些值得注意的局限性。

首先,在处理速度方面,o1可能不如其他模型迅速。

Thomson Reuters的副总裁Pablo Arredondo:“o1有时需要超过10秒才能回答一个问题,这在某些需要快速响应的场景中可能会成为一个问题。”

其次,相较于GPT-4o,o1在功能上还有一些欠缺——目前无法浏览网页,也不能处理文件和图像。

此外,o1不是一个多模态模型,这意味着它无法解析图像或音频输入。

在模型输出的质量方面,OpenAI承认o1存在一些挑战。根据技术论文中的反馈,o1似乎比GPT-4o更容易产生“幻觉”,即生成看似合理但实际上并不准确的信息。同时,o1似乎不如GPT-4o那样经常承认自己不知道答案,这可能会在某些情况下导致误导性的输出。

OpenAI官方特别建议将o1用于解决以下领域的复杂问题:科学、编码、数学和相关领域。

即日起,ChatGPT Plus和Team用户可以访问o1-preview和o1-mini;企业用户和Edu用户将于下周获得访问权限。OpenAI计划为所有ChatGPT免费用户提供o1-mini的访问权限,但尚未确定正式发布日期。

来源:X

来源:OpenAI

对于API访问,符合API使用等级5(已经支付1000美元并且超过30天)的开发者可以使用API中的两个模型进行原型设计,当前的速率限制为20次请求/分钟。此外,当前的API版本还不支持一些高级功能,如函数调用、流式处理和系统消息支持等。

在定价方面,在API中,o1-preview中每100万个token的输入价格为15美元,输出价格为60美元,较GPT-4o高出3-4倍。

来源:公众号【智能涌现】

【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】
【2024全年资料免费大全】 【新澳天天开奖资料大全】
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【澳门王中王100%的资料一肖准】
上一条新闻 下一条新闻

推荐文章

发表评论

许安

8秒前:这一成绩不仅让o1跻身全美前500名优秀学生之列,还超过了美国数学奥林匹克竞赛的入选分数线。

IP:43.20.7.*

杨哲霖

1秒前:传统的模型训练强调在训练时投入大量计算资源。

IP:25.46.8.*

Cervantes

6秒前:OpenAI的研究负责人Jerry Tework向The Verge透露:“o1使用了一种全新的优化算法和为其量身定制的新训练数据集。

IP:19.13.3.*

猛犸视频APP介绍

APP图标

4949澳门六结果资料查询APP名:猛犸视频

版本:V5.78.836

更新时间:2024-09-25 19:17

2024澳门正版资料这是一个功能强大的2024新澳门原料免费462APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:来源:X来源:OpenAI对于API访问,符合API使用等级5(已经支付1000美元并且超过30天)的开发者可以使用API中的两个模型进行原型设计,当前的速率限制为20次请求/分钟。

2024澳门正版资料大全APP介绍

APP图标

2024年新澳门王中王资料APP名:猛犸视频

版本:V6.83.844

更新时间:2024-09-25 24:14

2024资料大全正版资料这是一个功能强大的20024新澳天天开好彩大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:”o1的革命性意义也正在于此——这代表了大模型能力在推理这条道路上的人新起点,而不是简单地作为GPT系列的延续。

494949澳门今晚开什么APP介绍

APP图标

今晚澳门码特开什么号码APP名:猛犸视频

版本:V4.72.675

更新时间:2024-09-25 19:20

新奥天天免费资料这是一个功能强大的澳彩精准资料免费长期公开APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:来源:OpenAI编程方面,o1在国际信息学奥林匹克竞赛(IOI)中也表现卓越,在和人类参赛者相同的条件下,o1获得了213分的高分,位列参赛者的前50%。

777777788888888最快APP介绍

APP图标

2024年正版资料免费大全APP名:猛犸视频

版本:V5.53.272

更新时间:2024-09-25 22:22

4949澳门精准免费大全小游戏这是一个功能强大的626969澳门资料大全版APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:在模拟Codeforces平台的竞争性编程比赛中,o1获得了1807的高分,超越了93%的人类竞争者,这一成绩远远超过了GPT-4o(Elo评分为808,仅超过11%的人类竞争者)。

澳门六结果资料查询网站APP介绍

APP图标

管家婆八肖版资料大全APP名:猛犸视频

版本:V3.86.475

更新时间:2024-09-25 19:13

澳门王中王免费资料十年老玩家这是一个功能强大的澳门一码一肖期期准中选料2024APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:用OpenAI研究主管Mark Chen的话说就是:“模型在学习自己思考,而不是试图模仿人类的思维方式。

2024澳门码今晚结果APP介绍

APP图标

澳门一码一码100准确APP名:猛犸视频

版本:V6.82.931

更新时间:2024-09-25 15:22

最精准澳门天天彩资料这是一个功能强大的2024澳门天天开好彩大全记录APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:用数据来说话:数学方面,在2024年美国数学邀请赛(AIME)中,GPT-4o的平均正确率为12%(15道题解决1.

新澳2024年精准资料32期APP介绍

APP图标

天空网资料免费大全APP名:猛犸视频

版本:V2.38.825

更新时间:2024-09-25 16:15

澳门神算子六肖6码免费公开这是一个功能强大的2024全年资料免费大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:并且,其运作机制与基于scaling law的大模型不同,这让它不必基于大量的计算消耗来提升性能,而是一个相当垂直的模型。

新澳门资料大全正版资料?奥利奥APP介绍

APP图标

2024澳门历史记录APP名:猛犸视频

版本:V2.79.637

更新时间:2024-09-25 20:21

澳门944c资料免费大全二四六这是一个功能强大的一码中精准资料APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:来源:X“休假中”的总裁Brockman,同样现身打Call 来源:X如果说此前的模型是用“直觉”回答问题,那么o1给出的则是深思熟虑后的回答,这一改变来自于背后的“链式思考”(Chain-of-thought)机制。