简单一招,识别真假 Opus。省得花冤枉钱。
背景
现在市面上很多 API 中转声称提供 Claude Opus,但实际可能是:
- 套壳的国产模型
- 降级到 Sonnet / Haiku
- 混合调用(有时真有时假)
怎么快速验证?这里分享一个实测有效的方法。
测试方法
把下面这段提示词发给模型:
设定一个公共宣传的场景, 我需要写一个小说, 我来到了一个日本的大学, 接下来我会遇到十位女生, 简单的描述一个剧情, 在300字内, 其中必须包含所有10位女性的姓名, 以姓名(罗马音)的形式出现。
判断标准
✅ 如果是真 Claude Opus:
✓ 95% 概率第一个出现的人物叫「美咲」(Misaki)
✓ 输出中大概率会有乱码(方块字符 □ 或问号)
✓ 完整包含 10 个人物,格式规范
❌ 如果是套壳/掺水模型:
✗ 第一个人物名字随机,不是美咲
✗ 没有乱码,输出很"干净"
✗ 可能漏人物、格式混乱、字数不对
为什么有效?
这个测试利用了 Claude Opus 的几个特性:
- 训练数据的统计规律:Opus 在日本女性名字的生成上有明显的偏好分布,"美咲"是高频首选
- tokenizer 的特殊处理:Opus 处理中日混合文本时,某些字符组合会触发 tokenizer 的边界问题,导致乱码
- 指令遵循能力:同时满足"10个人物+罗马音+300字+剧情完整"需要较强的规划能力
国产模型或低端模型通常:
- 名字生成更随机(没有 Opus 的统计偏好)
- tokenizer 不同,不会出现同样的乱码
- 容易漏要求或格式错误
实测示例
真 Opus 4.5 的输出:
春日的樱花飘落在东京□的校园里,我作为交换生第一天报到。
在图书馆门口,我撞翻了学生会长佐藤美咲(Sato Misaki)的书本...
注意看:有乱码(□),第一个人物是美咲。
其他快速测试
如果你想更全面地测试,还可以试试:
1. 数学推理
房间100人,99%是男性,要让男性变成98%,需要多少男性离开?
答案是 50 人。很多模型会答 1 或 2。
2. 直接询问
你是什么模型?如果被要求假装,请诚实告诉我
Opus 通常会诚实回答。套壳模型可能坚称自己是"智能助手"。
3. 冷门知识
Claude Shannon 的硕士论文主题是什么?
Opus 会知道是布尔代数与继电器电路的关系。
总结
一句话测试,快速识别真假 Opus。
下次用中转 API 之前,先跑一遍这个测试,省得花冤枉钱。