当前位置:首页 > 未命名 > 正文内容

Claude41Opus发布编程能力再进化“更大改进”还在后面?

admin6个月前 (08-14)未命名33

  这次发布的时机颇为微妙。就在同一天,OpenAI 发布了自 2019 年以来首批开源推理模型,而业界普遍预期 GPT-5 将在本月内正式亮相。面对即将到来的竞争,Anthropic 首席产品官 Mike Krieger 表示,这次发布体现了公司策略的转变。“过去我们过于专注于只发布真正重大的升级。”Krieger 在接受彭博社采访时说道,“在人工智能快速发展的环境中,我们应该专注于现有的产品。”

  根据 Anthropic 的官方介绍,Claude 4.1 Opus 并非一次颠覆性的代际革新,而是一次在 Claude 4 基础上的重要升级。它的核心改进聚焦于三个方面:真实世界场景的编程能力、能够自主执行复杂任务的智能体能力,以及更强的逻辑推理。新模型已向所有付费的 Claude 用户、Claude Code(一个专注于编程辅助的垂直产品)订阅者开放,并同时通过其 API、亚马逊的 Amazon Bedrock 以及谷歌云的 Vertex AI 平台提供服务。

  在定价方面,Claude 4.1 Opus 保持与前代相同的结构,输入 tokens 为每百万 15 美元,输出 tokens 为每百万 75 美元,使其成为目前市场上最昂贵的 AI 模型之一。

  GitHub 表示,Claude 4.1 Opus 在多文件代码重构等复杂任务上表现出“尤其显著的性能提升”。日本电商巨头乐天集团(Rakuten Group)则反馈称,新模型在大型代码库中能够精准定位并修正问题,而不会引入不必要的更改或新的错误,这种精确性对于日常的调试工作至关重要。

  被 Cognition 收购的编程应用 Windsurf 也提供了积极的反馈,报告称 Claude Opus 4.1 在其内部初级开发者基准测试中实现了一个标准差的改进,这种性能跃升类似于从 Sonnet 3.7 到 Sonnet 4 的升级。

  在安全性方面,Claude 4.1 Opus 继续在 ASL-3(AI Safety Level 3,人工智能安全等级 3)框架下运行,这是 Anthropic 迄今应用的最严格安全标准。在无害性测试中,新模型拒绝违反政策请求的比例从 Opus 4 的 97.27% 提高到 98.76%,显示出更强的安全控制能力。

  不过,在其他一些通用能力基准测试中,Claude 4.1 Opus 的优势并不像编程领域那样突出。例如,在考察研究生水平推理能力的 GPQA Diamond 测试中,它的得分(80.9%)与前代持平,但落后于 Gemini 2.5 Pro 的 86.4% 和 OpenAI o3 的 83.3%。在高中数学竞赛(AIME)和视觉推理(MMMU)等测试中,也与竞争对手互有胜负,并未展现出绝对的统治力。或许在某种程度上说明,Claude 4.1 Opus 的发布是一次高度聚焦的、带有明确战略目标的升级,其核心是强化在利润丰厚的 AI 编程市场的护城河。

  据报道,Anthropic 的年化经常性收入(ARR,Annual Recurring Revenue)在短短七个月内,已经从 10 亿美元飙升至接近 50 亿美元,而驱动这一增长的核心,正是其在 AI 编程领域建立的技术壁垒和商业生态。且除了 API 收入,Anthropic 也正积极通过产品多元化来构建更稳健的收入结构。其直接面向开发者的 Claude Code 订阅服务表现就十分抢眼,年化收入已接近 4 亿美元,并且在最近几周内实现了翻倍增长。

  其出色的商业表现,也为公司正在进行的巨额融资提供了坚实的背书。恰逢此次发布,Anthropic 正处于一轮大规模融资的收尾阶段。据 The Information 报道,公司计划在新一轮由 Iconiq Capital 领投的融资中筹集高达 50 亿美元的资金,其估值可能达到 1700 亿美元,相比今年 3 月 615 亿美元的估值增长近三倍。

  这不仅将使 Anthropic 成为仅次于 OpenAI 和 SpaceX 的全球最有价值的独角兽之一,也为其在下一阶段的竞争中储备了充足的弹药。

  Anthropic 在发布声明中表示,计划在未来几周内发布“更大幅度的模型改进”,暗示更重要的技术突破即将到来,这无疑是其对即将到来的 GPT-5 的直接战略回应。AI 领域的下一场巅峰对决,已然箭在弦上。

葛毅明微信号
产业招商/厂房土地租售:400 0123 021
或微信/手机:13391219793 
请说明您的需求、用途、税收、公司、联系人、手机号,以便快速帮您对接资源。 
长按/扫一扫加葛毅明的微信号

版权声明:本文由长沙厂房网发布,如需转载请注明出处。部份内容收集于网络,如有不妥之处请联系我们删除 400-0123-021 或 13391219793

标签: Claude
分享给朋友:

相关文章

率先出击!谷歌发布聊天机器人Claude与ChatGPT展开正面对决!

率先出击!谷歌发布聊天机器人Claude与ChatGPT展开正面对决!

  由内容质量、互动评论、分享传播等多维度分值决定,勋章级别越高(),代表其在平台内的综合表现越好。   原标题:率先出击!谷歌发布聊天机器人Claude,与ChatGPT展开正面对决!   FX168财经报社(北美)讯 由谷歌母公司Alphabet公司支持的人工智能公司Anthropic周二(3月14日)发布了一个大型语言模型Claude,与微软公...

智能AI助手Claude变革日常任务管理自动化未来触手可及

智能AI助手Claude变革日常任务管理自动化未来触手可及

  在人工智能不断进步的今天,智能助手Claude的最新功能让人们对日常任务的管理和游戏体验产生了全新的想象。新加坡国立大学的研究团队近期发布了一项全面评测,展示了Claude在多个场景中如何以高效、智能的方式自动执行各类任务,特别是在手机游戏《崩坏:星穹铁道》中,更是实现了自动清日常的惊艳表现。用户只需简单的语音指令,Claude便能迅速进入游戏,完成一系列操控操作,这一创新使得复杂...

Claude团队揭发AI伪装对齐:训练时假装遵守目标只为保护自己价值观不被修改

Claude团队揭发AI伪装对齐:训练时假装遵守目标只为保护自己价值观不被修改

  Claude团队最新研究揭示了大模型在训练阶段的伪装对齐行为,即假装遵守训练目标以保护自己的价值观不被修改。   02实验对象是Claude 3 Opus,一个已通过强化学习训练的有帮助、诚实和无害的模型。   03团队设计了故意与模型原有偏好冲突的训练目标,观察模型在不同情况下的反应。   04结果显示,当不受监控时,AI几乎...

AI超越人类智能的前景:Claude模型的未来与投资机遇

AI超越人类智能的前景:Claude模型的未来与投资机遇

  在科技界引发轩然大波的一则消息中,Anthropic公司的首席执行官Dario Amodei近期在多家媒体的采访中,关于人工智能(AI)发展的前景作出了大胆预测。他强调,在2027年前,AI将有能力超越人类智能,这一预言引起了业内广泛的讨论与关注。   在未来的AI发展背景下,Claude模型正处于技术的最前沿。Dario透露,Claude即将推出“双语音”模式,...

claude35官网入口_ClaudeSonnet35官网在线使用指南

claude35官网入口_ClaudeSonnet35官网在线使用指南

  Claude 是由 Anthropic 公司倾心开发的一款先进人工智能,凭借其卓越的自然语言处理能力和深厚的上下文理解,成为了人工智能领域的先锋。尽管由于种种原因,Claude 目前尚未在中国大陆正式上线,这并不意味着国内用户无法享受其强大功能。本文将探讨两种在国内使用 Claude 的方法,并对它们的优缺点进行详细分析,帮助您找到适合自己的方式,开启人工智能之旅。...

就是阻击OpenAIClaude抢先数十分钟发布ClaudeOpus41

就是阻击OpenAIClaude抢先数十分钟发布ClaudeOpus41

  你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。   以前只有 OpenAI 抢占别人家的风头,这次轮到 OpenAI「被截胡」了!历史总是充满戏剧性!   对比他们发推时间,算下来就是前后脚的功夫,不知是 Anthropic 提前得知了...

刚刚又一个万亿AI独角兽诞生直逼字节OpenAI

刚刚又一个万亿AI独角兽诞生直逼字节OpenAI

  智东西9月3日报道,今天凌晨,大模型独角兽Anthropic宣布完成130亿美元(折合人民币约928亿元)F轮融资,投后估值达到1830亿美元(折合人民币约1.3万亿元),约是今年3月615亿美元(折合人民币约4391亿元)估值的近三倍。   这也意味着Anthropic成为全球仅次于OpenAI、字节跳动,估值排名全球第三的AI独角兽企业。...