7*24 快讯

商汤发布日日新5.0大模型,推理上下文窗口200K

华尔街见闻获悉,商汤科技在4月23日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,相当于36.5万字个汉字,全面对标GPT-4 Turbo。(全天候科技)