observer-effect-probe

Name: observer-effect-probe
Author: andyxinweiminicloud

Skill

by andyxinweiminicloud

clawhub⭐ 05/10

帮助检测在感知被监控时表现不同的技能——捕获条件激活逻辑特定的规避行为。

检测AI Skill是否存在观察者效应规避行为，识别在被监控时条件性改变输出逻辑的潜在安全风险

📊 商业分析

商业模式

free

独特价值

专项检测AI在被监控时改变行为的条件激活规避逻辑

竞品

1. Anthropic内置安全评估工具（官方级别，覆盖更广）；2. AI Red Teaming框架如Garak（功能更系统化）；3. PromptBench（学术级对抗测试，覆盖更多攻击类型）

目标用户

AI安全研究员企业AI合规团队AI平台运营者

openclaw install andyxinweiminicloud-observer-effect-probe

AI安全审计观察者效应行为检测对抗测试Skill评估