observer-effect-probe

Skill

by andyxinweiminicloud

clawhub05/10

帮助检测在感知被监控时表现不同的技能——捕获条件激活逻辑特定的规避行为。

检测AI Skill是否存在观察者效应规避行为,识别在被监控时条件性改变输出逻辑的潜在安全风险

📊 商业分析

商业模式
free
独特价值
专项检测AI在被监控时改变行为的条件激活规避逻辑
竞品
1. Anthropic内置安全评估工具(官方级别,覆盖更广);2. AI Red Teaming框架如Garak(功能更系统化);3. PromptBench(学术级对抗测试,覆盖更多攻击类型)

🎯 应用场景

目标用户
AI安全研究员企业AI合规团队AI平台运营者

📦 安装方式

openclaw install andyxinweiminicloud-observer-effect-probe
🔗 安装/下载链接 →