首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12来源: 15210273549

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

科技出海,长城汽车登陆CES 2025 长期主义的胜利,历经20年,CR-V 2024年终端销售仍接近18万辆 零跑的2024成绩单有多牛?全年交付近30万辆,提前超额完成目标! 中国车企突围之路:做不成偏科生比亚迪,做“全能生”的瑞虎也不错! 别人均奔驰E了!养一台30万的小米SU7,月薪8000都可能一分不剩 大空间够舒适,真四驱足够稳!传祺GS8冬季出行最佳搭档? 开年就摘得周销冠,吉利银河星舰7都做对了什么? 玩力升级,全新高尔夫与你一起奔赴热爱之约! 比亚迪夏杀疯了 24.98万起 能否短期内称霸MPV销量榜前三? 特斯拉年度成绩单!拿下2个世界第一,新能源汽车销量仅输一厂商 新势力车企2024成绩单:谁笑到了最后,谁又在生死边缘徘徊? 小米汽车挤上牌桌,雷军称2025年目标30万辆 上汽集团痛失蝉联18年的销量冠军 小米汽车工厂开放参观预约,你准备好了吗? 全球车企市值排名“巨变”:21家中国车企入围TOP50 小米、比亚迪分列三四 从汽车到战机,中国如何以“模式升维”领跑全球? 2024鸣金收兵:造车新势力疯狂发力,汽车大厂坐怀不乱 小鹏G9限时优惠,至高减免6W,特斯拉时代已经过去? 比亚迪“天神之眼”重磅升级!无图城市领航功能全国开通! 小米SU7掉落山崖一家人安然无恙 事故竟成小米带货现场? 诚意十足!本次零跑C11的OTA都有哪些亮点? 80亿增资落地,北京现代加速布局“在中国 为全球”战略 坚守紧凑级豪华,奥迪A3都做了什么 年至不惑,上汽大众,在改革中诞生,在变革中引领 『网红』难过一周期,『流量』难撑六十年,丰田的持久之道 2024年湖南长沙市发展和改革委员会招聘中级雇员公告 2025年湖南财经工业职业技术学院_衡阳财经工业学院人才引进26人公告 2024年湖南怀化市总工会属事业单位招聘和选调5人公告 2024年湖南衡阳市雁峰区事业单位急需紧缺人才引进6人公告 2024下半年广东肇庆市端州区教育局招聘中小学教师13人公告