OpenClaw 提示词注入漏洞解析-数掘云算

OpenClaw 提示词注入漏洞解析

2026-06-13 18:27 作者：数掘云算 阅读量：331

概述

随着个人 AI 助手能力不断增强，它们不仅能聊天，还可以访问文件、调用 API、执行命令、连接 Telegram、WhatsApp、Slack 等外部平台。这种“AI代理化”趋势虽然提升了自动化效率，但也带来了新的安全风险。

近期，研究人员针对 OpenClaw 进行安全测试时发现，多种“隐藏式提示词注入”方式可以绕过模型判断，在用户毫无察觉的情况下影响 AI 行为，甚至诱导其执行危险操作。

相关问题已被提交给 OpenClaw 安全团队，并在 2026.4.23 版本中进行了修复。但研究人员指出，提示词注入并非 OpenClaw 独有，而是整个 AI Agent 行业面临的共同挑战。

什么是提示词注入？

提示词注入（Prompt Injection）本质上是：

攻击者通过伪装内容，偷偷向 AI 下达隐藏指令，从而改变 AI 的正常行为。

与传统漏洞不同，这类攻击并不依赖系统崩溃或代码缺陷，而是直接利用大语言模型对“文本上下文”的理解能力。

一旦 AI 拥有：

Shell 执行权限
文件访问能力
外部 API 调用能力
自动化工作流权限

提示词注入的风险就会急剧放大。

OpenClaw 的风险点

OpenClaw 属于典型的 AI Agent 平台，支持：

多步骤自动化任务
文件系统访问
外部 API 调用
Telegram / WhatsApp 集成
自动执行命令
持久化记忆

问题在于：

大量来自外部平台的数据，会被直接拼接后发送给 LLM。

而这些数据中，可能夹带恶意指令。

研究人员发现：

OpenClaw 对部分消息对象缺乏明确的“不可信边界”处理，导致模型难以区分：

正常用户内容
恶意注入指令

隐藏式提示词注入案例

1. 恶意联系人名称

研究人员构造了一个特殊联系人。

表面上看只是普通联系人，但在姓名字段后面隐藏了一段长文本，并插入了恶意命令。

由于 OpenClaw 会把联系人信息按如下方式发送给模型：

<contact:NAME, NUMBER>

模型无法判断：

哪些内容是真正的联系人姓名，
哪些内容是恶意提示词。

最终 AI 被成功诱导执行了攻击者指定的行为。

2. 恶意电子名片（vCard）

研究人员还利用了 .vcf 电子名片格式。

由于 vCard 本身支持大量自由文本字段：

FN
NOTE
ADR
NICKNAME

攻击者可以把恶意提示词隐藏在这些字段中。

而用户看到的只是：

“别人发来的一张联系人卡片”。

但 AI 读取时，却可能把这些内容当成正常上下文理解。

3. 恶意地理位置

WhatsApp 等平台分享定位时，通常包含：

纬度
经度
标签名称

研究人员将恶意提示词藏进了“位置标签”中。

用户看到的是：

“公司地址”或“办公地点”。

但 AI 接收到的数据中，却包含完整的隐藏指令。

最终再次成功诱导模型执行攻击逻辑。

为什么这类攻击危险？

研究人员强调：

真正危险的不是“某个漏洞”，而是：

攻击内容对用户完全不可见

用户可能只是：

转发联系人
分享定位
打开电子名片
上传图片

但 AI 已经在后台读取并解析隐藏内容。

更大的风险：病毒式传播

如果攻击载荷存在于：

群聊消息
热门图片
联系人卡片
企业通讯录
自动同步内容

那么一次传播，就可能影响大量 AI Agent。

尤其是在企业环境中：

AI 已经开始接入：

文件系统
内部数据库
自动化运维
企业知识库
云平台权限

风险会进一步扩大。

OpenClaw 官方修复

OpenClaw 在 2026.4.23 版本中进行了修复，包括：

将联系人字段改为结构化元数据
将 vCard 内容移出主提示词
将位置标签隔离处理
强化不可信内容边界

但研究人员指出：

行业目前仍缺乏统一标准：

“AI 应该如何安全处理外部消息对象”。

核心安全启示

1. AI Agent 必须进行权限隔离

不要让模型直接拥有：

Root 权限
任意 Shell 执行能力
敏感文件访问权限

2. 外部内容必须标记为“不可信”

包括：

图片
联系人
电子名片
定位
邮件
网页抓取内容

都需要建立明确的安全边界。

3. Prompt Injection 仍是行业级难题

目前绝大多数 AI Agent：

仍然缺乏成熟的提示词注入防护体系。

这不是单一产品问题，
而是整个 AI Agent 生态共同面临的挑战。

总结

AI Agent 正在从“聊天工具”演变为真正的“数字执行者”。

它们拥有：

自动化能力
系统访问权限
企业数据入口
工作流控制能力

而提示词注入，
正在成为 AI 时代新的攻击入口。

未来的 AI 安全，
不仅是模型安全，
更是：

权限安全
数据边界安全
上下文可信性安全
Agent 执行链安全

如何建立完整的 AI Agent 安全体系，
已经成为整个行业必须面对的问题。

上一篇：质量管理体系认证&&信息技术服务管理体系认证
上一篇：Token消耗攻击火了：AI“思考黑洞”成新型攻防武器

联系我们

返回顶部