致力打造国内好用的AI产品导航平台
开发者:商汤
商汤日日新大模型是商汤科技宣布推出的大模型体系,包括自然语言生成、文字生成图片、感知模型标注以及模型研发功能。
自2022年4月首度发布至今,“日日新SenseNova”大模型体系已完成五次重要迭代。最新的“日日新SenseNova 5.0”(简称“日日新5.0”)基于超过10TB tokens的庞大训练数据和大量合成数据,采用混合专家架构,使得推理时上下文窗口可达约200K,进一步拓宽了模型的理解和处理边界。
此次升级聚焦于知识、数学、推理和代码四大能力的强化,全方位对标并超越GPT-4 Turbo。在一系列主流客观评测中,“日日新5.0”在各项指标上与GPT-4 Turbo不相伯仲。在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。