这首曲子是由 真人 还是 Suno 制作的?
上传一个音频文件,找出它由 Suno、Udio、MusicGen 或 Stable Audio 生成的概率。我们的 AI 音乐取证模型读取 AI 生成器留下的频谱指纹 — 而且我们会把推理过程展示给你看。
不是凭感觉。是一个模型。
我们的 AI 音乐取证模型专为捕捉 AI 生成器在音频中留下的指纹而打造。我们呈现原始概率 — 不四舍五入,不含糊其辞。
我们的模型。持续保持最新。
在最新的 Suno v3/v4 和 Udio v1.5 输出上微调。随着新生成器上线并在真实世界中积累足够样本而持续更新。
约 5 秒判定
上传完成,推理运行,你就得到一个概率。我们不会让你在队列里等待或盯着一个假的进度条。
概率,而非标签
我们显示 0–100% 并附带判定区间(很可能是真人 / 无法确定 / 很可能是 AI)。当模型不确定时,我们会直说 — 而不是假装确定。
你的文件保持私密
音频在内存中处理并立即丢弃。我们记录判定结果和一个简短的嵌入哈希用于漂移监测 — 而非音频本身。
免费,无需注册
三次免费上传供你试用。需要批量检测或 API 访问?我们已就此与厂牌和 DSP 谈过 — 请联系我们。
公开的方法论
本页关于生成器覆盖范围和准确率的每一项声明都有出处。当我们的内部基准发生有意义的变化时,我们会在博客中发布。
检测是如何工作的。
拖入一个音频文件。
MP3、WAV 或 FLAC,最大 30 MB。我们将其切分成 5 秒的窗口;你不需要剪辑片段。
我们的模型为每个窗口打分。
检测器为每个窗口输出一个概率,表示该片段来自已知 AI 生成器(Suno、Udio、MusicGen、Stable Audio)的可能性。我们按音频能量加权,聚合为曲目级别的分数。
判定 + 最接近的匹配 + 信号。
你会得到一个概率(0–100%)、一个判定区间、最接近的已知生成器,以及推动这一判定的前三个信号 — 人声伪影、动态平直度、频谱指纹等。
截至 2026 年 5 月的生成器覆盖范围。
我们每月做基准测试。对全新模型的开集泛化是最难的部分 — 一旦新生成器在真实世界中有了足够样本,我们就重新训练并发布模型更新。
| 生成器 | 发布时间 | 有人声? | 我们的检测 | 备注 |
|---|---|---|---|---|
| Suno v3 / v4 | 2024–25 | 是 | 98% recall | 在真实世界中最常见。在人声齿音上有强烈指纹。 |
| Udio v1 / v1.5 | 2024–25 | 是 | 96% recall | 混音比 Suno 更干净;我们靠动态平直度 + 立体声声场抓到它。 |
| MusicGen (Meta) | 2023 | 否 | 91% recall | 仅器乐。较老 — 当叠加在真实人声音轨上时更难判断。 |
| Stable Audio 2 | 2024 | 有限 | 89% recall | 在长篇器乐上表现强劲;氛围 / drone 是薄弱环节。 |
| Riffusion / unknowns | 杂项 | 混合 | ~70% | 开集:任何不在我们微调数据集中的内容。在这里,无法确定才是诚实的答案。 |
| 真人录音棚录制 | — | — | 3% 误报 | 高度压缩的流行乐和大量使用 AutoTune 的人声是最棘手的误报。 |