金融界4月24日消息 商汤涨幅扩大至超25%,最新报0.74港元,涨幅21.31%。商汤科技昨日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,大量合成数据,推理上下文窗口200K,强调知识、推理、数学、代码能力可达到或超越GPT-4。
商汤科技表示,这是行业内首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求。公司技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。商汤科技董事长兼CEO徐立表示,在尺度定律(Scaling Law)的准则下,商汤持续推动自身大模型研发,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。
昨日在技术交流日活动现场,商汤原创打造的文生视频生成平台首次亮相,聚焦为用户提供可控的文生视频创作体验。徐立展示了三段完全由大模型生成的视频片段,充分展现了商汤文生视频技术对人物、动作和场景的高度可控性。
去年4月10日,商汤首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景
推荐东方材料,子公司东方超算为商汤提供算力