GPT 4o意味着什么?OpenAI加苹果,AI手机势不可挡!

硬AI
英伟达高级研究科学家Jim Fan:这可能会成为从一开始就拥有10亿用户的AI产品,OpenAI之于苹果类似于“用于智能手机的FSD”。

本文作者:李笑寅

来源:硬AI

ChatGPT带飞Siri?

当地时间5月13日上午10点,OpenAI在春季发布会上发布了GPT-4的迭代版本——GPT-4o。据悉,GPT-4o的速度是上一代的两倍,并且对用户更友好:语音唤起、实时对话、无需注册、免费使用。

OpenAI表示,GPT-4o及其文本和图像能力即日起将开始向API和用户推出,语音和视频能力即将推出。

从定位来看,全新的旗舰版本GPT-4o似乎正在挑战Siri。

实则不然。就在此前,有媒体报道透露,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术,以升级Siri的对话体验。

这不由令人猜想,GPT-4o和Siri将如何结合?ChatGPT和苹果又将如何定义新一代AI手机?

GPT-4o升级在哪?

1)融媒能力:GPT-4o同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答。

2)速度更快:GPT-4o的速度是上一代的5倍,语音延迟大幅改善,可以在232毫秒内回应音频输入,平均为320毫秒,接近人类对话的反应时间。这意味用户可以和GPT-4o实时对话、甚至直接打视频让Ta在线解答各种问题。

3)免费开放:尽管“价格战”的风还是吹到了AI界,但OpenAI显然不买账——发布会即日起,GPT-4o将面向ChatGPT的所有付费和免费用户发布,取消其他所有限制,API价格降价50%。

正如发布会所说,GPT-4o中的“o”代表“omni”,意为全能,从目前的功能更新来看,得到全栈优化的全新GPT-4o真正成为了一款AI实时语音助手,性能远超Siri。

演示中,GPT-4o还展现出宣传点之外的小功能,但惊喜程度不亚于前者:能够实时翻译、识别表情,可以通过摄像头识别画面写代码分析图表。

“苹果+OpenAI”将如何定义AI手机?

因下一代iPhone操作系统计划发布基于LLM(大型语言模型)的新功能,苹果正就此寻找第三方合作伙伴,谈判对象包括谷歌、OpenAI。

就目前看来,苹果和OpenAI的适配度似乎更高。

有分析指出,苹果和OpenAI的合作能够解决彼此在发展边缘AI方面的痛点,真正做到各取所需——

OpenAI最需要什么?端侧应用权限、系统级权限,只有苹果能提供。

苹果最需要什么?最好的AI技术,最适配的大语言模型,GPT-4o无疑是最佳人选。

况且,苹果在自研芯片、封闭生态系统上还具有独特优势。正如英伟达高级研究科学家Jim Fan在X平台的评论:谁先赢得苹果,谁就赢得了胜利。

我认为与iOS的集成将出现3个层级:

1)放弃Siri。OpenAI为iOS提炼出更小型、纯设备上的GPT-4o,并可选择付费升级以使用云。

2) 将相机或屏幕传输到模型中的本机功能。对神经音频/视频编解码器的芯片级支持。

3) 集成iOS系统操作API和智能家居API。Siri快捷方式是时候复活了。

这可能会成为从一开始就拥有10亿用户的AI产品,OpenAI之于苹果类似于“用于智能手机的FSD”。

进一步展望,ChatGPT引入iPhone能创造怎样的新增长故事?

Wedbush分析师Dan Ives在周一的一份报告表示:

在iPhone 16中嵌入OpenAI聊天框也将开辟新的增长途径,这将让重要的开发者以及微软开发者生态系统一起涌入苹果生态系统。”

“从本质上讲,与OpenAI建立紧密的合作关系将改变游戏规则,而对于微软/OpenAI来说,与全球最大的电子消费品牌捆绑将是一个明智的选择。”

Ives预计,苹果将在6月10日的WWDC大会上官宣和OpenAI的合作伙伴关系,并推出基于苹果LLM的AI聊天机器人。

本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。