联合创始人布林回归，谷歌紧锣密鼓酝酿AI"杀手锏"：最强大模型Gemini最快今年可用！

2023/07/21 21:58

传说中合并了AlphaGo和类GPT-4大模型的Gemini在布林的加持下加快了应用落地的脚步，谷歌在AI大战中即将迎来“大反攻”？

四年前“归隐山林”的谷歌传奇人物又被AI的风吹回来了！

他就是谷歌联合创始人，科技行业的传奇谢尔盖·布林。

7月20日，《华尔街日报》援引谷歌内部工作人员消息称，布林本已功成身退，最近每周都会有三到四天造访谷歌位于加州山景城(Mountain View)的办公室，与研究人员合力开发谷歌AI大模型——Gemini。

知情人士称，布林去年底就曾参加过谷歌内部的AI会议，而现在参与的频率和强度都在进一步增强。他目前正与一群研究人员密切合作，打造大众期待已久的Gemini：

布林会和谷歌研究人员一同讨论了“损失曲线”等技术问题，他还会涉及到一些人事方面的事务处理，比如如何招到抢手的研究人员。

而或许是因为布林的加入，华尔街日报援引知情人士称，负责Gemini项目的谷歌高管Demis Hassabis在最近的一次全公司会议上告诉员工，全新大模型Gemini最快今年可用。

传闻中合并了AlphaGo和类GPT-4大模型的Gemini，终于要来了吗？

谷歌内紧锣密鼓

2019年12月4日，布林正式宣布“隐退”，将公司控制权转交给谷歌CEO 桑达尔·皮查伊（Sundar Pichai）。

或许布林也没想到，仅仅3年后，ChatGPT的爆火能带来一场AI革命，更没有想到这场AI的战火，让谷歌不得不一次次展开“正面对决”。

今年2月微软宣布将ChatGPT集成进Bing，并在GPT-4的推动下拥有自己的生成搜索体验，更是一度让谷歌“脊背发凉”。

不少谷歌员工表示，从去年11月AI热潮开始，布林便频繁参加谷歌与AI相关的会议，布林在谷歌的影响力正不断扩大，从这一点便可看出AI大战的激烈程度，没有一个科技巨头愿意“认输”，也可以看出布林对AI的热情。

值得一提的是，大名鼎鼎的“谷歌大脑”团队就脱胎于布林早年间领导的Google X部门。在2018年发出的一封股东信中，布林曾写道：“AI的能力和潜力，以及通过计算来解决重要问题的潜力从未如此巨大。AI的发展将成为我有生以来在计算机领域(见到)的最重大发展。”

媒体称，谷歌CEO“劈柴”得知布林将加入谷歌AI领域的研究后感到非常兴奋，并鼓励他作出贡献。

谷歌一直被视为顶尖人工智能研究中心，但随着AI竞争加剧，这家科技巨头开始了“防守”模式——为了抵御一群灵活且日益庞大的AI竞争对手、为了保护其核心搜索业务、股价，以及潜在的未来的安全威胁。

华尔街见闻提及，今年4月，谷歌母公司Alphabet旗下两大顶级AI团队谷歌大脑与DeepMind合并，交由原DeepMind创始人Demis Hassabis出任CEO。彼时，谷歌称，此举将加快其 AI 进展。

对于合体后的全新团队，Haasabis显然非常自信。他表示，全新的团队汇集了两股对最近的人工智能进步至关重要的力量。

“如果你看看我们在人工领域的位置，你会相信，未来80%或90%的创新，就会来自其中一个团队。在过去十年里，两个团队都做出了极其出色的成果。”

而这个将由人工智能领域的顶尖团队推出的——Gemini或许可以被称为谷歌在这场AI之战中的“背水一战”。

谷歌DeepMind CEO Hassabis最新爆料，全新Gemini模型将结合进AlphaGo和大语言模型。

一个是用强化学习击败人类围棋冠军、创造历史的AI系统，一个是霸榜几乎所有大模型榜单的最强多模态大模型，两个大模型合体后的，会碰撞出怎样的火花？

华尔街见闻此前提及，Gemini会将AlphaGo与GPT-4等大模型的语言功能合并，系统解决问题和规划的能力将大大增强。

一些人工智能专家认为，语言模型通过文本间接地学习是其发展主要的限制。

而AlphaGo的优势可以解决这一点，2016年，DeepMind设计的AI系统AlphaGo以4比1的比分击败了世界围棋冠军李世石，是史上首个战胜围棋世界冠军的机器人。

AlphaGo基于DeepMind开创的强化学习技术，该技术通过让AlphaGo反复尝试并接受表现的反馈，学会处理需要选择采取何种行动的棘手问题。同时，AlphaGo使用了蒙特卡洛树搜索技术方法来探索和记忆棋盘上的可能行为。

语言模型的下一步飞跃可能是在计算机上执行更多任务，此前文章提到，Gemini的最大优势在于其多模态能力，不仅能够理解和生成文本、代码，还能够看懂和生成图像。相比之下，ChatGPT只是一个纯文本模型，只能理解和生成文本。

此外，制作和ChatGPT类似能力的语言模型的一个重要的步骤是使用人类反馈强化学习来完善其性能，DeepMind在强化学习方面的深厚经验可赋予Gemini新的能力。

在5月的谷歌开发者I/O大会上，谷歌就曾提到，从一开始，Gemini的目标就是多模态、高效集成工具、API。而当时谷歌的预告是：“虽然还在早期，但我们已经在Gemini中，看到了在之前的模型中从未见过的多模态能力，这让人印象太深刻了。”

语言模型的下一个重大飞跃在哪里？Gemini或许指引了下一代语言模型的方向。而加快推出Gemini或许会让谷歌在这场AI大赛中的胜算更大些。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。