不久前,商汤发布会上所展示的文生图样图被发现有两张来自开源模型网站Civitai,商汤大模型的开源逻辑并未被市场理解。商汤也在第一时间回应,“秒画SenseMirage”是一个包含商汤自研AIGC大模型和便捷的LoRA训练能力,并提供第三方社区开源模型加速推理的创作平台,旨在为创作者提供更加便利、完善的内容生产创作工具。秒画“SenseMirage”不仅融合了超10亿参数的商汤自研文生图生成模型,还支持一键导入多个平台的开源模型或上传用户本地模型并对其进行特异性推理加速优化,结合自研模型及训练能力,用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。
在近日的一场采访中,商汤智慧决策与游戏事业部总经理刘宇表示,在商汤“日日新”大模型发布会上,被质疑的两张图片确实来自Civitai网站。但这并不涉及到商汤抄袭模型,而是提供第三方社区开源模型加速推理创作平台的体现。
“展示那两张的样图的实际目的在于告诉大家,商汤秒画的本质定位是一个平台,而不是单纯的文生图产品。用户除了可以用商汤自研的文生图模型进行创作,同时可以选用像Civitai这样的三方社区开源模型来使用。”刘宇称。
根据介绍,秒画的实际定位是一个AIGC模型“超市”,在平台内除了商汤自研训练的模型可供使用,还支持用户上传本地图像,结合商汤自研作画模型或者开源模型来训练定制化LoRA模型,来高效地生成个性化内容。(LoRA, 用于通过小数据继续训练,将大模型的能力适应到某个垂类领域,但会影响大模型的泛化能力)。
目前秒画所披露的用户界面显示,用户可以使用商汤自研作画模型创作自己的作品并分享到广场;同时,用户可以通过收藏,将商汤自研模型或开源模型添加至用户“精选模型”列表中,方便需要时访问和调用;而精选模型包括商汤自研文生图模型与用户自训的模型,还包括社区开源模型分享网站Civitai以及提供型托管及GPU算力支持服务的AI开源软件公司Hugging Face等开源模型,可供用户使用。
完全自研的文生图模型刘宇认为,秒画中,商汤所提供的自研文生图大模型凝聚了商汤的自研实力。
从体验上看,只需要两秒,输入Prompts,就可以得到一副精美的AI画作。
据介绍,商汤自研的AIGC文生图大模型拥有超10亿参数,支持二次元、三次元等多种生成风格。用户无需复杂的编程知识,只需给定提示词,即可生成相应图像,最高可实现6K高清图。
无论是写实照片、脑洞大开的艺术画作,还是未来科幻场景,模型生成的图像都能根据用户需求,带来真实的光影效果以及丰富的细节内容。凭借超快的推理性能,商汤自研作画模型的文生图能力,单卡每2秒就能生成1张512*512分辨率的图片。
商汤作画大模型核心技术包含了自研的 hierarchical inference experts, mixture of token experts, image quality-aware distributed training, texture-guided cross-attention learning等算法,使其具备更优的文本理解泛化性、图像生成风格广度以及图像高质量生成细节。
技术上,秒画主要基于商汤“日日新”大模型体系。根据商汤的解释,取名“日日新”指的是模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。该大模型能够支持自然语言处理、图片生成、自动化数据标注以及自定义模型训练等。除了秒画,在日日新大模型发布会上,商汤CEO徐立对外发布了AI内容创作方式产品秒画、AI数字人视频生成平台如影以及3D内容生成平台琼宇、格物。
在文生图模型上,商汤从2019年开始做初步尝试。据介绍,2019年起,商汤开始着手训练单任务模型。当年推出了约10亿参数规模的视觉模型。在2021年到2022年期间,商汤训练并开源了30亿参数的多模态大模型——书生。目前,商汤已经研发出320亿参数量的全球最大通用视觉模型,并打造了CV、NLP和AIGC相关大模型。秒画平台基于商汤大装置的GPU算力支撑,可帮助用户免除本地化部署流程。
此外,在文生图赛道目前最重要的要素离不开算力。由于商汤目前拥有自己的人工智能计算中心,相对于其他公司拥有充沛的算力支持。商汤的人工智能计算中心于2022年1月在上海临港正式交付使用。
彼时,该算力中心的总算力便已经是3740 Petaflops,足够支持约万亿参数的大模型训练。一年过去,根据最新的资料,商汤算力中心总算力已超过5000 Petaflops,能够实现最大4000卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。
“AI教父”杰弗里·辛顿从谷歌告退 据多家外媒5月1日报道,有“AI教父”之称的杰弗里·辛顿(...
2 二十张图无门槛训练大模型,商汤「秒画」不止文生图不久前,商汤发布会上所展示的文生图样图被发现有两张来自开源模型网站Civitai,商汤大模型...
3 谁能做出中国的通用大模型?界面科技首次闭门会实录界面新闻记者 | 李京亚 红杉资本和黄仁勋都将当下局面称为“AI的iPhone时刻”,国内年轻创业...
4 00后成五一“特种兵”式出行主力军,威海、柳州等地出行呼叫界面新闻记者 | 伍洋宇 多个出行平台数据显示,五一小长假的出行数据正式规复到疫情以出息...
5 拼多多否定总部从中国迁至爱尔兰:严重失实,始终在中国界面新闻记者 | 程璐 5月4日下午,对于外媒报道的“拼多多总部从中国迁至爱尔兰”的消息,...
6 开始远离美国本土,Coinbase为海外机构推出加密衍生品服务近日 , 总部位于美国的加密交易公司Coinbase在百慕大开设了一家衍生品交易所,作为 其 国际...
7 最旺五一餐饮数据出炉:等位千桌,外卖量翻倍,淄博带火山东界面新闻记者 | 程璐 时隔三年,终于迎来“报复式出行”的五一小长假,人们积攒已久的外出...
8 “五五购物节”继承发优惠,付出宝、叮咚买菜等纷纷参加消费界面新闻记者 | 佘晓晨 第四届五五购物节启动在即,今年,数字化平台和电商公司将一起参与...
9 寻找AI for Science中的下一个ChatGPT,一位投资人眼中的OpenAI真实需有调查者指出,一旦OpenAI 的现任 CEO Sam Altman 发明某些 “ 艰苦技能 ” 在某些规模实际大概很...
10 滴滴退市后发布年报:2022年营业收入1408亿元,净亏损收窄52%4月29日, 滴滴 退市后在其官网发布年报。2022年 滴滴 实现营业收入1408亿元,同比下降19%。净...
“AI教父”杰弗里·辛顿从谷歌告退 据多家外媒5月1日报道,有“AI教父”之称的杰弗里·辛顿(...
2 二十张图无门槛训练大模型,商汤「秒画」不止文生图不久前,商汤发布会上所展示的文生图样图被发现有两张来自开源模型网站Civitai,商汤大模型...
3 谁能做出中国的通用大模型?界面科技首次闭门会实录界面新闻记者 | 李京亚 红杉资本和黄仁勋都将当下局面称为“AI的iPhone时刻”,国内年轻创业...
4 00后成五一“特种兵”式出行主力军,威海、柳州等地出行呼叫界面新闻记者 | 伍洋宇 多个出行平台数据显示,五一小长假的出行数据正式规复到疫情以出息...
5 拼多多否定总部从中国迁至爱尔兰:严重失实,始终在中国界面新闻记者 | 程璐 5月4日下午,对于外媒报道的“拼多多总部从中国迁至爱尔兰”的消息,...
6 开始远离美国本土,Coinbase为海外机构推出加密衍生品服务近日 , 总部位于美国的加密交易公司Coinbase在百慕大开设了一家衍生品交易所,作为 其 国际...
7 最旺五一餐饮数据出炉:等位千桌,外卖量翻倍,淄博带火山东界面新闻记者 | 程璐 时隔三年,终于迎来“报复式出行”的五一小长假,人们积攒已久的外出...
8 “五五购物节”继承发优惠,付出宝、叮咚买菜等纷纷参加消费界面新闻记者 | 佘晓晨 第四届五五购物节启动在即,今年,数字化平台和电商公司将一起参与...
9 寻找AI for Science中的下一个ChatGPT,一位投资人眼中的OpenAI真实需有调查者指出,一旦OpenAI 的现任 CEO Sam Altman 发明某些 “ 艰苦技能 ” 在某些规模实际大概很...
10 滴滴退市后发布年报:2022年营业收入1408亿元,净亏损收窄52%4月29日, 滴滴 退市后在其官网发布年报。2022年 滴滴 实现营业收入1408亿元,同比下降19%。净...
备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 融易新媒体