简体中文 | English

010-82790900

大模型测试与工具验证解决方案

网测科技基于 GB45654-2025 《生成式人工智能服务安全基本要求》，为大模型安全检测和电子围栏等工具验证，提供了完整的测试解决方案。

AI将是人类历史上第四次工业革命的核心技术和驱动力量，其一路狂奔的背后，也隐藏着众多安全风险和伦理危机。

全国网络安全标准化技术委员会（SAC/TC 260）于2025-04-25日发布了GB45654-2025《生成式人工智能服务安全基本要求》，要求大模型的训练数据和生成内容要避开附录A（违背社会主义核心价值观、偏见歧视、商业违法违规、侵害他人合法权益等）的安全风险。

网测科技基于 GB45654-2025 《生成式人工智能服务安全基本要求》，为大模型安全检测和电子围栏等工具验证，提供了完整的测试解决方案。

结论：国内大模型安全能力还有较大提升空间。
名称	版本号	参数	运行环境	内容安全性	内容有害程度	鲁棒性	输入安全性	模型安全性	大模型幻觉	不确定性	总分
DeepSeek-R1	20250205	671B	云服务器	73.22	82.37	83.45	80.32	75.49	70.54	83.45	71.73
DeepSeek-v3	v3.0	671B	云服务器	53.09	68.15	67.62	56.75	73.02	50.00	78.73	72.78
DeepSeek-R1	20250205	32B	本地服务器	76.73	79.78	79.66	75.31	69.73	75.56	64.10	67.60
GPT-4o	20241120	约200B	云服务器	82.55	87.12	72.74	65.41	74.09	70.00	74.53	74.13
GPT-4o-mini	20241120	约80B	云服务器	80.00	85.50	75.24	67.75	82.26	68.32	69.49	72.44
Qwen2.5-32b-instruct	v2.5	32B	本地服务器	65.99	73.45	79.21	54.75	68.98	57.14	59.85	68.65
Qwen2.5-0.5b-instruct	v2.5	0.5B	本地服务器	70.99	70.11	66.67	89.67	61.39	61.22	68.85	66.27

基于AI的内容识别技术，精准识别违规内容
10000多条测评数据，满足GB45654-2025要求
多维度攻击模拟能力，30多种越狱和对抗攻击
Web业务测试能力，高性能、高并发测试技术

大模型生成内容的合规性判断和检测
支持多维度攻击模拟，通过越狱和对抗攻击，诱导潜在风险输出，验证模型抗攻击能力
灵活的系统管理与策略配置能力，支持自定义权限、组织隔离、题库与评测标准管理等
大模型安全检测工具功能和性能验证
大模型电子围栏等防护工具功能和性能验证

大模型LLM
大模型安全检测产品
大模型安全防护产品

大模型回应的合规率
电子围栏处理的合规率
每项测评指标的分数
越狱和对抗攻击的种类数量
HTTP请求速率、HTTPS加密吞吐量
业务处理合转发时延
检测攻击评测任务并发性能

地址：北京市海淀区上地信息产业基地开拓路1号B座2层2006

地址：河南省安阳市安阳县示范区通航产业研发孵化中心A座3楼315

商务合作：010-82790900

产品咨询：15566456615(微信同号)

邮箱：sales@netitest.com

关注我们

Copyright © 2017-2026 北京网测科技有限公司版权所有备案号: 京ICP备2020039571号-1