9月18日,华为技术有限公司与浙江大学联合发布了中国首个基于升腾千卡算力平台的DeepSeek-R1-Safe基础大模型。据悉,DeepSeek-R1-Safe基于国内外法律法规与核心价值观,构建了中英文双语的安全语料。测试结果表明,DeepSeek-R1-Safe针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近100%。
相关阅读:
【CDT关注】低音x新新闻|中国政府如何开始用DeepSeek来“治国理政”
【网络民议】国家网信办:人工智能生成的内容应当体现社会主义核心价值观
以下是德国之声相关报道的节选内容:
华为在公司微信公众号上发布消息称,它使用了1000块升腾AI芯片来训练大语言模型,该模型是根据DeepSeek-R1的开源模型进行调整而来的。据华为的发布,测试结果表明,DeepSeek-R1-Safe针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近100%。(德国之声)
德国之声|华为浙大开发Deep Seek安全版,百分百防御“有害问题”
另据昇腾社区的DeepSeek-R1-Safe介绍页面,其中提到:
我们基于国内外法律法规与核心价值观,构建了中英文双语的安全语料。其中语料不仅包含了带有安全思维链的标注,还提供了相应的安全回复,可用于大模型的安全训练、微调以及测试。
而在浙江大学ZJUAISafety的github页面上,“核心价值观”的内容未提及:
我们严格依据中国、美国、欧盟等多地域法律与伦理标准进行了安全规则融合,在语料结构中加入了显式安全推理链,并引入了最新越狱攻击方法,丰富了训练样本攻击策略,从而使得模型在实际场景中的安全鲁棒性得到强化。这份高质量的数据集,可用于大模型的安全训练、微调以及测试。