数据、C端应用挤下大模型成为AI【必争之地】

硬AI
数据运营商爆赚1亿美金。

ChatGPT的爆火,刮起了一阵令人热血沸腾的AI狂潮,无数公司和创业者都迫不及待地启动项目,在这个前景广阔的【蓝海市场】中展开激烈厮杀。

站在行业如火如荼发展了大半年的今天,我们不妨一起来聊一下,哪些AI公司,在有【前途】的同时,更有【钱途】

纵观AI产业链的上、中、下游,我们感觉,最有【钱途】的那波公司,可能是给大模型喂料的数据供应商,可能是定价自由的C端应用开发商,但唯独不可能是大模型开发商。

接下来,让我们具体聊聊我们的观察与分析。

本文核心观点:

  1.  绝大多数大模型都在陪跑,如若GPT3.5/4开源,面临毁灭性打击;
  2. 数据版权纠纷找上谷歌,数据运营商的价值开始凸显;
  3.  C端应用落地和变现更容易,成为兵家必争之地

大模型企业:绝大多数,都是陪跑

首先,各家大模型与Open AI的差距还是很明显,原本留给其他大模型厂家的市场空间就已经很小。

而开源的出现推动大模型进入百模大战,但问题在于产品同质化严重,又没有可媲美GPT4的能力,这就会导致大模型的话语权非常低,大模型定价方面只会越来越难;

最近连OpenAI也要开源新的大模型了,如果GPT3.5开源,那对于追赶GPT的绝大部分大模型厂商来说可谓是毁灭性的打击。

其次,大模型企业为了优化输出结果,还需不断迭代模型,这就需要大量、专业的数据投喂,因此数据企业提供方也会成为制约大模型发展的重要角色。

最后,大模型的训练成本很高不说,想要做出超强大模型还得拼算力,也就是看谁能抢到更多英伟达A/H100芯片;

总体而言,对大部分大模型企业都面临着一边难收费,一边要拼命花钱的困境,想必未来很多大模型企业会放弃这条拥挤、又不赚钱的赛道。

除非真的是能追上GPT4的水平,大模型才会有绝对的竞争力。

数据运营商:春天,就在前方

上文提到,扼住大模型发展的除了AI芯片,就是训练大模型必不可少的数据。

我们认为,数据运营商将迎来发展的黄金期。

谷歌最近就因为非法搜集用户数据用于训练AI模型,被美国加利福尼亚州克拉克森律师事务所起诉,要求向用户赔偿数据使用费和告知数据用途。

哪里有问题,哪里就有解决方案。

这不是,海外Prolific公司就牢牢抓住了这个风口。不仅获得3200万美元融资,还赚了1亿+美元的数据提供费用;目前每小时的数据试用价格在6—8美元,未来有可能更高。

目前,Prolific已获得了3000多家知名组织,其中包括谷歌、牛津大学、斯坦福大学、伦敦国王学院和欧盟委员会等,超过2万名科研人员在其平台上获取高质量数据。

也就是说,Prolific提供的这种可以用于商业化并且具有版权的数据是市场所需要的,这一点对于大模型厂商来说非常重要,能够很好避免产生数据版权的纠纷。

Prolific也表示,高质量、真实训练数据对于AI大模型来说能够减少幻觉、非法输出、增强RLHF能力。

与此同时,数据运营商也容易变现,我们认为,其在AI赛道上的商业价值才开始显现。

C端应用:流量入口,兵家必争

哪里有流量,哪里就有财富聚集。

开源还是封闭大模型其实本质上不是最核心的问题,而关键在于如何形成好的数据飞轮。

最近“数据飞轮“这个词在科技圈内非常火,简单来说是一种描述数据价值增长的循环过程。

在互联网时代我们看到数据量的激增,而在AI时代数据爆发体量将远超上一次。

如果从产品落地和价值变现的速度来看,那么C端应用必然是兵家必争之地。

无论是微软用Microsoft 365 Copilot开启办公AI时代、还是一直在内卷的AI绘画、和即将开卷的AI视频;

C端应用往往比B端更容易落地、也更容易变现,核心在于C端产品更标准化;

而B端的问题在于诉求更多,很难统一这也就导致了落地进度更难,更别提还有很多隐私数据、know-how等专业内容要考虑。

这也就为什么在国内互联网流量红利期赚的盆满钵满的是阿里、腾讯、字节这样的巨头,因为他们掌握了C端流量,而工业互联网企业都活在了“贫民窟”;

谁掌握了用户流量、产品定价权,收入便有了保障;

总的来说,C端一定会成为AI行业最先变现的细分赛道。

本文作者:韩枫,来源:硬AI;原文标题:数据、C端应用挤下大模型成为AI【必争之地】|【硬AI】

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。