手握万块A100芯片，量化巨头幻方发布通用大模型！

券商中国

2023/11/03 11:14

幻方旗下的AGI研究组织“深度求索”发布第一代大模型DeepSeek Coder，号称“最强开源代码大模型”，免费商用，完全开源，已开放内测。

又一个大模型来了！

11月2日晚间，量化巨头幻方探索AGI（通用人工智能）的新组织“深度求索”在成立半年后，发布了第一代大模型DeepSeek Coder，并表示免费商用，完全开源。深度求索表示，这可能是最强开源代码大模型。目前，DeepSeek Coder已经开放内测。

作为一家隐形的AI巨头，幻方拥有1万枚英伟达A100芯片，而国内拥有超过1万枚GPU的企业不超过5家。幻方此前表示，将专注于做真正的人工智能，探索 AGI的本质。

有行业人士表示，幻方是量化行业的楷模，探索AI推动技术进步，需要情怀和梦想，更需要有大量资金砸进去。幻方量化当前管理规模400多亿元，较高峰期有所缩水。

深度求索发布第一代大模型

今年4月，幻方量化发布公告称，公司将集中资源和力量，全力投身到服务于全人类共同利益的人工智能技术之中，成立新的独立研究组织，探索AGI的本质。幻方将这个新组织命名为“深度求索（DeepSeek）”。

成立半年后，深度求索的第一代大模型DeepSeek Coder面世，并表示免费商用，完全开源。深度求索表示，这可能是最强开源代码大模型。

幻方量化CEO陆政哲告诉券商中国记者，这是深度求索首个成果，算是codex领域的大模型，主要是代码生成，后续还会陆续发布更多的开源模型，欢迎大家内侧试用。

值得注意的是，DeepSeek Coder还展示了用Python写一个贪吃蛇游戏，随着屏幕快速输出跳跃的代码，一段可直接运行的游戏代码即可生成；指挥DeepSeek Coder修改UI，轻松写出更难的2048游戏等。此外，DeepSeek Coder还能测试bug；作为数据分析的好帮手，学写SQL也是其必备技能；还能做题目冲击No.1。

据了解，目前DeepSeek Coder已经开放内测。DeepSeek Coder已开源7B，33B全系列模型，包含Base模型和指令调优模型。

DeepSeek表示，其致力于探索AGI的本质，不做中庸的事，带着好奇心，用最长期的眼光去回答最大的问题。“在不久的将来，我们还将呈现给社区更多更好的研究成果。让我们在这个激动人心的时代，共同推进AGI的到来！”

去年11月，ChatGPT的问世让生成式AI在短短一个月里火爆全球，各互联网大厂扎堆开发大模型，不少中国AI企业快速跟进。

据了解，距离ChatGPT诞生一年不到的时间，中国就诞生了64个大模型，累计大模型数量达到130个，超过美国的114个。

人工智能和量化投资齐头并进

作为一家隐形的AI巨头，幻方手里拥有1万枚英伟达A100芯片，而国内拥有超过1万枚GPU的企业不超过5家。除了几家头部大厂外，就是幻方量化。

据了解，幻方自研的深度学习训练平台“萤火一号”总投资近2亿元，搭载了1100块GPU。两年后，“萤火二号”的投入增加到10亿元，搭载了约1万张英伟达A100显卡。

幻方表示，多年以来，该公司坚持把营收的大部分投入人工智能领域，建设领先的AI硬件基础设施，进行大规模的研究，探索人类未知的奥秘。“我们相信几乎所有的创新都是从大胆尝试和点滴积累中孕育而来。”幻方表示。

幻方量化创始人梁文锋在接受其他媒体采访时表示，幻方的主要班底里，很多人是做人工智能的。“当时我们尝试了很多场景，最终切入了足够复杂的金融，而通用人工智能可能是下一个最难的事之一。语言大模型可能是通往AGI的必经之路，并且初步具备了AGI的特征，所以我们会从这里开始，后边也会有视觉等。”

不过，今年以来，聚光灯下的量化巨头颇为不顺，近期还遭遇了负面舆论。幻方量化很快采取了果断措施，对当事人作出停职处理。

据了解，幻方量化在高峰期规模一度突破1000亿元，今年上半年一直稳定在600亿规模。此前，有消息称“当前幻方量化已经暂停渠道募资”。幻方量化市场人士对此回应称：“幻方量化当前的基金管理规模是400多亿元，这个规模目前来看是策略比较合适的规模。”

幻方还表示，未来，该公司的研究业务以人工智能和私募基金业务归同一实控人下面的两家平行公司分管，两板块业务均为幻方集团未来重要的发力方向。

本文作者：许孝如，来源：券商中国 (ID:quanshangcn)，原文标题：《量化巨头重大发布！》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

手握万块A100芯片，量化巨头幻方发布通用大模型！

深度求索发布第一代大模型

人工智能和量化投资齐头并进

高盛深度报告：谁将成为中国AI大模型行业的长期赢家？

DeepSeek高峰涨价意味着什么?高盛：国内大模型竞争正回归理性

“不是你想投，梁文锋就会要你的钱”，DeepSeek融资510亿元，他为何选了腾讯、宁德时代、网易、京东？

融资消息曝光后DeepSeek上线识图模式，但认不出梁文锋