腾讯汤道生：在大模型的训练和使用过程中，需要大量异构算力的支持

据腾讯官微，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示，在大模型的训练和使用过程中，需要大量异构算力的支持，对网络速度与稳定性要求也很高，加上GPU服务器比一般服务器稳定性更低一些，服务器的运维、问题的排查更频繁，整体运维的难度与工作量会高很多。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

在训练集群中，一旦网络有波动，训练的速度就会受到很大的影响；只要一台服务器过热宕机，整个集群都可能要停下来，然后训练任务要重启，这些问题会使得训练时间大大增加，投入在大模型的成本也会飙升。

风险提示及免责条款