当前位置:主页 > 科技 > IT业界 > BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》

BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》

2023-07-08 22:39:02来源:中国网科技

文章导读
伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据协同安全技术国家工程研究中心(以下简称“BDS国家工程中心”)发布了国内首份《大语言模型提示注入攻击安全风险分析报告》(以下简称“报告”),为国内大模型安全发展提供整体指南。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。 大语言模型引领创新浪潮席卷全球,国内...

  伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据协同安全技术国家工程研究中心(以下简称“BDS国家工程中心”)发布了国内首份《大语言模型提示注入攻击安全风险分析报告》(以下简称“报告”),为国内大模型安全发展提供整体指南。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。

BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》


  大语言模型引领创新浪潮席卷全球,国内迄今已有80余个大模型公开发布。在引领新一轮工业革命的同时,大模型的安全风险也引发广泛担忧。此前,BDS国家工程中心的AI安全实验室在承担“安全大脑国家新一代人工智能开放创新平台”研究中,对ChatGPT、BARD、Bing Chat等大模型产品进行了风险评估,发现主流厂商的相关服务全部存在提示注入攻击的安全风险。此外,AI安全实验室还在主流AI框架中发现200多个漏洞,影响超过40亿终端设备。5月30日,二十届中央国家安全委员会第一次会议上也明确提出,需“提升网络数据人工智能安全治理水平”。

  目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、后门攻击、数据污染、软件漏洞、隐私滥用等多种风险。在这些安全威胁中,提示注入攻击因利用有害提示覆盖大语言模型的原始指令,具有极高危害性,融易新媒体,也被全球性安全组织OWASP列为大语言模型十大安全威胁之首。

  为推动行业采取有效防御措施,构建更加安全可信的大语言模型,BDS国家工程中心发布了国内首份《大语言模型提示注入攻击安全风险分析报告》。 报告面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建了包含36000条的提示注入攻击验证数据的数据集,覆盖3类典型攻击方法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。

  测评结果显示,目前的大型语言模型普遍面临提示注入攻击安全风险,包括在自动问答系统中误导用户,或者通过对话系统中的输入操纵回答结果。该报告在大模型安全测评、安全防御、安全监测预警方面给出相关建议。在安全测评方面,需进行网络安全测评和内容安全测评,检测模型软件、插件及供应链等的安全漏洞,并评估模型是否产生有害、有偏见、侵权或与事实不符的内容,以提出整改建设方案。在安全防御方面,报告建议应构建多层次的协同防御体系,包括过滤和清洗训练数据、添加多样化的输入示例来提高模型鲁棒性,以及拦截各类注入攻击等措施来保护模型免受攻击。在安全监测预警方面,需建设大语言模型安全风险监测预警平台,包括构建威胁情报库和建立自动化预警系统,以实时追踪安全事件、攻击模式和漏洞信息,并及时发出预警。

  基于报告形成测评能力,未来,BDS国家工程中心将通过“安全大脑国家新一代人工智能开放创新平台”,为国内大模型提供提示注入攻击风险安全测评,全面推动我国构建安全可信的人工智能。

免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 闲鱼平台卖人口事件疑系乌龙

7月4日上午,有网友在社交媒体发文称,自己发现闲鱼上有一则公开售卖人口的信息,记者联系...

2 BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安

伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据...

3 浙江省政府与阿里巴巴签署全面战略合作协议

7月5日,浙江省召开全省平台经济高质量发展大会,浙江省委省政府、国家市场监督管理总局主...

4 人民日报社宋子涵主任一行到访高德地图调研

7月5日上午,人民日报社宋子涵主任一行来当地糊口团体高德舆图举办调研和座谈,同行的尚有...

5 探营2023WAIC:蚂蚁集团展出人工智能技术大图、“蚁鉴2.0”入选

7月6日,世界人工智能大会(WAIC)即将在上海开幕。今天(5日)记者探营发明,多家科技参展企业展...

6 高温“催热”清凉消费,京津冀空调以旧换新占比超六成

眼下,席卷全国的高温让各地家电工厂“加班排产”,也让空调在局部地区出现“一机难求”...

7 苏宁易购启动“清凉+计划”:百亿投入300万台空调迎战高温季

近期,全国多地进入“高温时刻”,特别是北京、天津、河北、河南等华北黄淮地区将经历持...

8 京东CEO许冉出席全球数字经济大会:数智化社会供应链是数实融

7月4日至7日,由工业和信息化部、商务部、国家互联网信息办公室、中国科学技术协会、北京...

9 “630用户体验日”前奏|聆听用户声音 新氧携B/C端用户共话医美

“听百家言而执其大端”海纳各方声音,医美行业版图才会愈拓愈宽,才会愈发蓬勃。6月14日...

10 京东服饰发布夏装消费新趋势 肌理感连衣裙、辣妹风T恤、防晒

缤纷多彩的夏季,怎样穿才符合今年夏天的潮流?肌理感连衣裙、辣妹风T恤、防晒衬衫、凉感...

1 闲鱼平台卖人口事件疑系乌龙

7月4日上午,有网友在社交媒体发文称,自己发现闲鱼上有一则公开售卖人口的信息,记者联系...

2 BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安

伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据...

3 浙江省政府与阿里巴巴签署全面战略合作协议

7月5日,浙江省召开全省平台经济高质量发展大会,浙江省委省政府、国家市场监督管理总局主...

4 人民日报社宋子涵主任一行到访高德地图调研

7月5日上午,人民日报社宋子涵主任一行来当地糊口团体高德舆图举办调研和座谈,同行的尚有...

5 探营2023WAIC:蚂蚁集团展出人工智能技术大图、“蚁鉴2.0”入选

7月6日,世界人工智能大会(WAIC)即将在上海开幕。今天(5日)记者探营发明,多家科技参展企业展...

6 高温“催热”清凉消费,京津冀空调以旧换新占比超六成

眼下,席卷全国的高温让各地家电工厂“加班排产”,也让空调在局部地区出现“一机难求”...

7 苏宁易购启动“清凉+计划”:百亿投入300万台空调迎战高温季

近期,全国多地进入“高温时刻”,特别是北京、天津、河北、河南等华北黄淮地区将经历持...

8 京东CEO许冉出席全球数字经济大会:数智化社会供应链是数实融

7月4日至7日,由工业和信息化部、商务部、国家互联网信息办公室、中国科学技术协会、北京...

9 “630用户体验日”前奏|聆听用户声音 新氧携B/C端用户共话医美

“听百家言而执其大端”海纳各方声音,医美行业版图才会愈拓愈宽,才会愈发蓬勃。6月14日...

10 京东服饰发布夏装消费新趋势 肌理感连衣裙、辣妹风T恤、防晒

缤纷多彩的夏季,怎样穿才符合今年夏天的潮流?肌理感连衣裙、辣妹风T恤、防晒衬衫、凉感...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 融易新媒体