本文作者:许超
来源:硬AI
仅仅一个月,GPT 4o就过时了?
更快、更强、还更便宜,由Anthropic最新发布的Claude 3.5 Sonnet在多个关键指标中吊打GPT-4o。投资者不禁要问,AI大模型提升的天花板到底在哪?
更快、更强
自发布几个小时以来,网友纷纷在网上分享他们对Claude 3.5 Sonnet的新印象,展示目前“最智能”的AI模型能够取得什么成就。
正如网友所展示的,Claude 3.5 Sonnet能够在不到半分钟的时间内仅根据一张截图为她创建一整款可玩的游戏,同时快速修复bug:
构建的真实、有效的Web表单的代码似乎也不是问题。
3分钟做出马里奥克隆版,并且为角色提供了动画效果。
重现1995年经典电影《黑客》中的3D场景模型也是小菜一碟。
编码“神器”
正如网友展示的那样,本次Anthropic更新的亮点之一,就是Claude 3.5引入的超强实时交互功能Artifacts了。
Artifacts可以说是一个简化版的代码解释器,标志着Claude从对话式AI向协作工作环境的转变。
考虑到目前Claude 3.5 Sonnet编码效率比GPT-4o或任何其他LLMs都高10倍。Artifacts边聊天边生成代码的功能则给用户提供了无与伦比的体验。
Anthropic开发者关系团队负责人Alex Albert对于Claude 3.5 Sonnet超强的编码能力也并不讳言,其在网上表示:
Claude 3.5开始真正擅长编码和自动修复Pull Request,很明显,一年后,很大一部分代码将由LLM 编写。
Anthropic 技术人员Maggie则发帖称,
Claude 3.5 Sonnet 现在可以完成我一半的工作……
尽管获得了极高的赞誉,但也有人指出,Claude 3.5 Sonnett在一些人类可以相对轻松地完成的基本的认知任务上仍然举步维艰,比如玩“井字游戏”。
基本的数学应用题也不稳定:有网友提问:100 美分硬币还是 3/4 美分更值钱?模型最初的的回答是3/4。