observer-effect-probe
Skillby andyxinweiminicloud
clawhub⭐ 05/10
帮助检测在感知被监控时表现不同的技能——捕获条件激活逻辑特定的规避行为。
检测AI Skill是否存在观察者效应规避行为,识别在被监控时条件性改变输出逻辑的潜在安全风险
📊 商业分析
商业模式
free
独特价值
专项检测AI在被监控时改变行为的条件激活规避逻辑
竞品
1. Anthropic内置安全评估工具(官方级别,覆盖更广);2. AI Red Teaming框架如Garak(功能更系统化);3. PromptBench(学术级对抗测试,覆盖更多攻击类型)
🎯 应用场景
目标用户
AI安全研究员企业AI合规团队AI平台运营者
工具信息
- 类型
- Skill
- 平台
- clawhub
- Stars
- ⭐ 0
- 价值评分
- 5/10
- 子分类
- AI行为审计与对抗检测
- 可商业化
- ❌ 否
AI 标签
AI安全审计观察者效应行为检测对抗测试Skill评估
相关工具推荐
openclaw-skill-vetterMCP
在安装AI代理Skill前执行安全审查,检测凭证盗窃、代码混淆、数据泄露等风险,自动分类威胁等级,保护系统安全。
9/10⭐ 17
csam-shieldSKILL
利用AI驱动的图像、视频及行为分析检测并拦截儿童性虐待材料,自动生成NCMEC合规报告并完成证据保全链。
9/10⭐ 0
claw-prompt-injection-guardSKILL
防护间接提示词注入攻击,识别网页邮件社媒等外部内容中隐藏恶意指令,保护AI系统安全可靠运行
9/10⭐ 0
SecuritySKILL
覆盖网络侦察、Web应用安全测试、提示注入检测、安全新闻监控及年度报告分析的全栈安全评估提示词工具集
8/10⭐ 9,611
clawdefenderMCP
为AI代理提供输入消毒与威胁检测,拦截提示注入、SSRF、命令注入、数据外泄等攻击。
8/10⭐ 30