一周要点
华尔街见闻·见智研究视角:GPU严重供不应求,光模块、存储PCB需求共振。
海外:
谷歌StyleDrop又来炸场AI作图,具有创造力同时风格更可控;
苹果要启动AIGC+MR策略,AI+XR 成为下一代移动端战场;
英伟达团队推出3D视频AI大模型,虚拟现实更逼真;
微软年底上线Teams 2.0,操作系统将发起AI总攻;
国内
多地政策利好,北京上海深圳相继出台AI发展方案;
腾讯首次投资大模型!AI初创公司站在风口上;
阿里云AI助手“通义听悟”公测,移动端落地速度将超预期;
国产全自研数据库,拓尔思海贝在金融、政务领域需求强;
中文AI大模型发起开源治理,完成与AI从“投毒”和“解毒”的攻防;
见智研究视角
GPU严重供不应求,光模块、存储PCB需求共振。
OpenAI和Supermicro喊话英伟达,GPU不够!
OpenAI目前遭到客户最大的抱怨是API的可靠性和速度。OpenAI的CEO Sam Altman 承认当下GPU非常紧缺,这不得不推迟了许多的短期计划,微调 API 、专用容量产品都受到GPU 可用性的限制。不过,OpenAI还会提供专用容量,为客户提供模型的私人副本,但如若访问此服务,客户必须预先承诺支付100万美元。
超微电脑(Supermicro)创始人、CEO梁见后表示:市场对AI需求强劲,公司正扩大美国、荷兰等地产能,在马来西亚及日本也都设有服务器生产基地,预计年底前要把4000台机柜产能拉升至5000台。他还对黄仁勋表示,请英伟达多提供一些芯片,即使目前已提供但还不够。
见智研究认为:
在生成式AI需求的推动下,GPU产品会面临持续性的缺货和涨价,英伟达目前的交货周期还在不断拉长,从之前一个月到现在基本上需要三个月或者更久,甚至部份订单到年底才能交付。
此外,英伟达还发布了超强AI计算平台GH200,用于大模型训练不仅速度快还更省钱,谷歌云、Meta、微软和软件等都宣布将用于生成式 AI 工作上;
对产业链来说:光模块用量增加已成为普遍共识,同时存储和PCB的需求增长已经开始慢慢兑现。英伟达高阶GPU拉动HBM存储芯片需求连续两年激增,三星和海力士,两家存储大厂HBM订单都在快速增加
海外
1、谷歌定制大师StyleDrop又来炸场AI作图圈,既具有创造力同时风格更可控。
StyleDrop能够捕捉各种样式的纹理、阴影和结构的细微差别,只需要一张图作为参考,无论多么复杂的艺术风格,都能解构再复刻。就连英伟达科学家将其称为「现象级」成果。
见智研究认为:
相比于此前大火的文生图工具MidJourney来说, StyleDrop能够更好地控制图片生成的风格,生成内容也会更贴近设计师的需求。而 MidJourney的特点在于避免了日常朴素的摄像效果,在生成超清晰图像时会增加整体的真实感,另外会在内容和美学偏好上更倾向于后者。
但是两者的相同之处在于,都能够从其他艺术媒介、绘画风格上汲取灵感,并进行创作。
2、苹果要启动AIGC+MR策略,AI+XR 成为下一代移动端战场
市场对MR的期待非常高,况且以苹果在消费电子一向有风向标的意义来看,等待了7年的MR或将给XR行业投下一个重磅炸弹,大家都很期待MR无论是在技术上还是体验感上所带来的全新变化。
见智研究认为:
生成式AI的快速发展与MR的结合将会带来移动端产品的全面升级,特别是在应用内容创新方面会突破此前的开发方式,极大改善现阶段XR爆款游戏品类少的问题。
而这也将会成为MR市场下沉的一个重要因素,此前XR游戏渗透力进入增长瓶颈后的突破的难点就在于应用生态的小众化,而苹果生态的忠实粉数量极度庞大,在内容+终端+生态的全方位高质量融合下,有助于MR的快速销售,同时带动XR产业链新一轮发展周期。在AI日报中我们也分析过VR市场巨头Meta提前官宣了秋季发售的Oculus 3的影响。
3、英伟达团队推出3D视频AI大模型,虚拟现实更逼真
NVIDIA Research 开发了一种新AI大模型Neuralangelo,这是一种利用神经网络对3D视频剪辑从而进行2D重建的AI模型。新模型可以将任何设备的视频转换为详细的3D结构。
见智研究认为:
3D生成技术虽然早已存在,但是值得关注的是Neuralangelo这款AI大模型,在2D视频转化3D物体能力方面,显著超越了以往的所有方法。模型会从2D视频中选取不同角度拍摄的画面,从而得到构架3D物体表征的细节,最后进行渲染以提高细节清晰度。该模型的特点在于采用英伟达的解决方案能够更好的对视频细节进行构造,使得内容看起来更清晰,无论是对于小型雕像还是大型建设都可以很好的进行应用。
特别是关注未来能够大范围应用的领域:比如虚拟现实、数字孪生、机器人开发、工业数字等使用3D物体构建的大规模场景。
4、微软年底上线Teams 2.0,操作系统将发起AI总攻
微软计划于2023年年底前,在 Win10、Win11 平台上,开始默认使用Teams 2.0版本;向 Mac、VDI 和网页用户推出Teams 2.0预览版,并进一步推广到教育和政府等其它客户群体。
新版Teams承诺安装速度提高3倍,启动时间快2倍,聊天和频道之间的切换速度提高1.7倍。加入会议的速度也应该快2倍;内存资源占用减少50%,磁盘空间减少70%。
见智研究认为:
Teams 2.0嵌于Windows上,对于操作系统来说影响将会是翻天覆地的,这会极大的加速PC端AI化的进程,包括视频会议、AI聊天助手、Office365等众多工具的便捷性和智能化,将完全改变用户的使用习惯。特别值得关注的是,升级后的Teams 2.0在内存上占用更小,并且速度更快,使得多线程、高频使用也不会特别卡顿。
国内AI
1、多地政策利好,北京上海深圳相继出台AI发展方案
见智研究认为:
各地方政府将会相继出台鼓励发展AI行业的政策,从底层硬件的算力建设到应用端具身智能机器人研发,都将进入政策红利期,为的是创造更好、更开放的环境推动AI行业的快速发展。昨天北京和上海也出台了对AI新的政策方案;分别包括实施算力伙伴计划,与云厂商加强合作,提供多元化优质普惠算力;支持民间投资参与重大项目,参与数据、算力等人工智能基础设施建设等内容。
总的来看,当前国内在大模型研发上进展也非常快,开源大模型也有了安全数据库,AI应用侧的发展比如传媒IP、游戏等内容上都在快速落地中,之后要重点关注具身智能赛道的发展,这里领域还处于比较早期的阶段,创新性发展机会值得期待。
2、腾讯首次投资大模型!Minimax被曝完成2.5亿美元新融资
见智研究认为:
由于ChatGPT带动的大模型、AI发展浪潮,正有许多明星创业公司相继显露头角,MiniMax仅成立一年半多的时间,就成为创投领域最具吸金力的明星玩家。去年11月发布虚拟聊天软件产品Glow;今年3月上线生成式对话AI助手Inspo;还推出面向企业用户的API开放平台,支持文本和语音模型的服务调用。MiniMax自创办以来增长迅猛,目前整体估值超过12亿美元。这是腾讯首次开始投资大模型初创企业,想必在资本的认可和追求下,AI创业氛围也会更加活跃。
3、阿里云AI助手“通义听悟”公测,应用落地速度将超预期
见智研究认为:
国内大模型在应用领域的落地进展非常迅猛,通义听悟主要应用于音频、视频领域,为用户带来音频和视频内容记录和阅读的全新体验。而传统软件的用户粘性很快就会被打破。值得关注的是:在内容总结方面,飞书妙记还只能给出关键词;而针对不同嘉宾的发言,听悟都能给出对应的发言总结,同时应关注关注语音大模型在移动端的应用进展,比如智能音箱就是非常好的端口。
4、拓尔思发布纯自研数据库——海贝搜索数据库V10
见智研究认为:
海贝作为从底层分词算法,到核心引擎以及上层系统都完全自研的纯国产搜索引擎数据库,具有更高等级安全性、兼容性以及高性能检索的特征,不仅能够做到全字段索引,支持任意维度的组合查询,在数据查询和分析的效率上高于其他的大数据管理系统;同时还可以实现冷热数据自动分区,支持多种存储混合使用。
在应用层面来看,特别是对于专用性强、安全性高的领域,比如:银行、政务、军工等表现出非常强的竞争力。
5、中文AI大模型首个反歧视对抗性开源项目:每个人提出100道“有毒”问题
见智研究认为:
数据标注是在大模型过程中至关重要的步骤,用标注后的“安全数据集”进行模型训练才能够得到趋近理想的训练结果。但是数据标准一直伴随有主观、宗教、个人偏好的特色,所以如果用国外的数据集进行训练,某种程度上会“水土不服”,而搭建本地训练数据集就显得非常重要。中文AI首个反歧视对抗项目凝聚力众多行业专家,之后会成为国内开源大模型训练的高标准数据集之一。
下周关注
苹果WWDC大会,MR能否不负期待,引领XR产业进入新时代。