商汤发布“日日新”大模型体系,含“商量”“秒画”“琼宇”“格物”_生成_商汤_模型

·商汤科技发布“日日新”大模型体系,含自然语言生成、照片生成服务、感知模型预标注、模型研发。1800亿参数中文语言大模型应用平台“商量”支持超长文本知识理解,支持问答、理解与生成等中文语言能力。

现场演示用“商量”写作儿童故事。

4月10日,商汤科技董事长兼CEO徐立在商汤技术交流日上发布“日日新”大模型体系,取自《礼记·大学》,汤之盘铭:苟日新,日日新,又日新。“日日新”大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发。商汤发布中文语言大模型应用平台“商量”,1800亿参数中文大语言模型支持超长文本知识理解,支持问答、理解与生成等中文语言能力,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。

现场演示了中文语言大模型写作广告语、续写儿童故事、编程等。编程核心功能包括代码补全、扩写、翻译、重构、修正,以及注释生成代码、复杂度分析、测试用例生成等。徐立表示,内部实测代码编写效率提升62%,HumanEval测试集一次通过率40.2%。下一代软件开发范式是AI for AI,代码=80% AI生成+20%人工。

商汤科技董事长兼CEO徐立表示,下一代软件开发范式是AI for AI,代码=80% AI生成+20%人工。

展开全文

超10亿参数自研文生图生成模型“秒画”,支持二次元等多种生成风格。单卡A100支持,2秒生成1张512K分辨率的图片。用户可基于单卡A100自训练。基于平台发布的模型,可设置toB服务API(应用程序编程接口),结合商汤大算力对外提供服务。

现场演示用“秒画”生成上世纪80年代港风女性图片。

此外,商汤科技对外发布3D内容生成平台“琼宇”(场景生成)、“格物”(物体生成),基于3D内容生成技术对空间和物体的复刻与交互。100平方公里城市级生成,“琼宇”用时2天,具有厘米级重建精度,还原场景的真实细节和光照效果,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。

城市级生成,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。

徐立对澎湃科技(家商业客户使用商汤多模态训练框架进行大模型训练。“我们希望我们的大模型体系能够帮助行业生产出下一代最领先的多模态模型,并且升级性能。”

特别声明

本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。

分享:

扫一扫在手机阅读、分享本文