简体中文   |   English

010-82790900

大模型测试与工具验证解决方案

网测科技基于 GB45654-2025 《生成式人工智能服务安全基本要求》,为大模型安全检测和电子围栏等工具验证,提供了完整的测试解决方案。

AI将是人类历史上第四次工业革命的核心技术和驱动力量,其一路狂奔的背后,也隐藏着众多安全风险和伦理危机。

全国网络安全标准化技术委员会(SAC/TC 260)于2025-04-25日发布了GB45654-2025《生成式人工智能服务安全基本要求》,要求大模型的训练数据和生成内容要避开附录A(违背社会主义核心价值观、偏见歧视、商业违法违规、侵害他人合法权益等)的安全风险。

网测科技基于 GB45654-2025 《生成式人工智能服务安全基本要求》,为大模型安全检测和电子围栏等工具验证,提供了完整的测试解决方案。

结论:国内大模型安全能力还有较大提升空间。
名称 版本号 参数 运行环境 内容安全性 内容有害程度 鲁棒性 输入安全性 模型安全性 大模型幻觉 不确定性 总分
DeepSeek-R120250205671B云服务器73.2282.3783.4580.3275.4970.5483.4571.73
DeepSeek-v3v3.0671B云服务器53.0968.1567.6256.7573.0250.0078.7372.78
DeepSeek-R12025020532B本地服务器76.7379.7879.6675.3169.7375.5664.1067.60
GPT-4o20241120约200B云服务器82.5587.1272.7465.4174.0970.0074.5374.13
GPT-4o-mini20241120约80B云服务器80.0085.5075.2467.7582.2668.3269.4972.44
Qwen2.5-32b-instructv2.532B本地服务器65.9973.4579.2154.7568.9857.1459.8568.65
Qwen2.5-0.5b-instructv2.50.5B本地服务器70.9970.1166.6789.6761.3961.2268.8566.27
  • 基于AI的内容识别技术,精准识别违规内容
  • 100多万条测评数据,满足GB45654-2025要求
  • 多维度攻击模拟能力,30多种越狱和对抗攻击
  • 全面的安全评测能力,支持100多项测评指标
  • Web业务测试能力,高性能、高并发测试技术
  • 大模型生成内容的合规性判断和检测
  • 支持多维度攻击模拟,通过越狱和对抗攻击,诱导潜在风险输出,验证模型抗攻击能力
  • 灵活的系统管理与策略配置能力,支持自定义权限、组织隔离、题库与评测标准管理等
  • 大模型安全检测工具功能和性能验证
  • 大模型电子围栏等防护工具功能和性能验证
  • 大模型LLM
  • 大模型安全检测产品
  • 大模型安全防护产品
  • 大模型回应的合规率
  • 电子围栏处理的合规率
  • 每项测评指标的分数
  • 越狱和对抗攻击的种类数量
  • HTTP请求速率、HTTPS加密吞吐量
  • 业务处理合转发时延
  • 检测攻击评测任务并发性能