当前位置:主页 > 产业 > 传媒 > 度小满开源国内首个千亿参数金融大模型“轩辕”

度小满开源国内首个千亿参数金融大模型“轩辕”

2023-05-31 19:40:05来源:互联网

文章导读
(原标题:度小满开源国内首个千亿参数金融大模型“轩辕”) 近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。 在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融...
(原标题:度小满开源国内首个千亿参数金融大模型“轩辕”)

近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。

在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

BLOOM (Big Science Language Open-science Open-access Multilingual)是2021年由 1000 多名志愿研究人员在一个名为“大科学 BigScience”的项目中创建,2022年 7 月 12 日正式发布。BLOOM 拥有 1760 亿个参数(决定输入数据如何转换为输出内容的变量),稍多于拥有 1750 亿个参数的 GPT-3。BLOOM拥有1.61TB文本,包含46种自然语言和13种编程语言。相比Meta发布的130亿参数的LLaMA(Large Language Model Meta AI)模型,Bloom参数量更占优势。

目前,千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。

度小满CTO许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,融易新媒体,提升金融行业智能化水平。

作为AI新基建,大模型在金融及各个行业有着广泛的应用场景。轩辕大模型开源后,对金融机构有何意义?

许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位的提升金融企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

度小满依托于百度人工智能技术,已经开展了一系列基于大模型的应用。以风险管理为例,度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及AI算法,能够将征信报告解读出40万维的风险变量,更好的识别小微企业主的信贷风险。今年5月份,这一工程荣获了 “吴文俊人工智能科学技术奖”。今年2月份,百度基于文心大模型技术推出的生成式对话产品“文心一言”(英文名:ERNIE Bot)开放生态合作,度小满成为首家接入的金融科技公司。

免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 销售稳增、经营稳健、财务从容,多家券商看好龙湖

(原标题:销售稳增、经营稳健、财务从容,多家券商看好龙湖) 近期,恒生指数继续震荡向...

2 度小满开源国内首个千亿参数金融大模型“轩辕”

(原标题:度小满开源国内首个千亿参数金融大模型“轩辕”) 近日,度小满正式开源国内首...

3 国资委:到2035年全面建成央企新型智库体系;聚焦人工智能,头

(原标题:国资委:到2035年全面建成央企新型智库体系;聚焦人工智能,头部公募“集结重兵...

4 业绩下滑与反向生意业务问题表现 兴证全球基金谢治宇面对压力

(原标题:业绩下滑与反向交易问题浮现 兴证全球基金谢治宇面临压力) 《投资者网》张斯文...

5 临商银行再成被执行人 股权管理问题难解

(原标题:临商银行再成被执行人 股权管理问题难解) 《投资者网》孟行 日前,中国执行信...

6 宣肺败毒方对“二阳”症状七:嗅觉、味觉暂时失灵的情况,有效

(原标题:宣肺败毒方对“二阳”症状七:嗅觉、味觉暂时失灵的情况,有效) “二阳”也就是...

7 澳门国际银行广州分行首发人民币同业存单 开创澳资银行境内刊

(原标题:澳门国际银行广州分行首发人民币同业存单 开创澳资银行境内发行同业存单先河)...

8 白酒包装破损率万分之五 京东超市上线酒水新包装覆盖白酒 葡

(原标题:白酒包装破损率万分之五 京东超市上线酒水新包装覆盖白酒 葡萄酒 洋酒近千款产...

9 北京人寿:“保险+康养”双轮驱动探索养老产业发展新思路

(原标题:北京人寿:“保险+康养”双轮驱动探索养老产业发展新思路) 2023年5月24日由北京...

10 “满血复生”的线下表演有多拉动经济?|思维糊口+

(原标题:“满血复活”的线下演出有多拉动经济?|思维生活+) 2023年,线下演唱会市场在...

1 销售稳增、经营稳健、财务从容,多家券商看好龙湖

(原标题:销售稳增、经营稳健、财务从容,多家券商看好龙湖) 近期,恒生指数继续震荡向...

2 度小满开源国内首个千亿参数金融大模型“轩辕”

(原标题:度小满开源国内首个千亿参数金融大模型“轩辕”) 近日,度小满正式开源国内首...

3 国资委:到2035年全面建成央企新型智库体系;聚焦人工智能,头

(原标题:国资委:到2035年全面建成央企新型智库体系;聚焦人工智能,头部公募“集结重兵...

4 业绩下滑与反向生意业务问题表现 兴证全球基金谢治宇面对压力

(原标题:业绩下滑与反向交易问题浮现 兴证全球基金谢治宇面临压力) 《投资者网》张斯文...

5 临商银行再成被执行人 股权管理问题难解

(原标题:临商银行再成被执行人 股权管理问题难解) 《投资者网》孟行 日前,中国执行信...

6 宣肺败毒方对“二阳”症状七:嗅觉、味觉暂时失灵的情况,有效

(原标题:宣肺败毒方对“二阳”症状七:嗅觉、味觉暂时失灵的情况,有效) “二阳”也就是...

7 澳门国际银行广州分行首发人民币同业存单 开创澳资银行境内刊

(原标题:澳门国际银行广州分行首发人民币同业存单 开创澳资银行境内发行同业存单先河)...

8 白酒包装破损率万分之五 京东超市上线酒水新包装覆盖白酒 葡

(原标题:白酒包装破损率万分之五 京东超市上线酒水新包装覆盖白酒 葡萄酒 洋酒近千款产...

9 北京人寿:“保险+康养”双轮驱动探索养老产业发展新思路

(原标题:北京人寿:“保险+康养”双轮驱动探索养老产业发展新思路) 2023年5月24日由北京...

10 “满血复生”的线下表演有多拉动经济?|思维糊口+

(原标题:“满血复活”的线下演出有多拉动经济?|思维生活+) 2023年,线下演唱会市场在...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 融易新媒体