直播带货公司“三只羊”近期遭遇风波,一段据称是其创始人卢文庆在醉酒状态下录制的音频在网上流传,内容关乎客服投诉、竞争者以及与三位女主播的关系,迅速成为热议焦点。9月26日,安徽合肥警方介入调查后宣布,该音频实为AI伪造,并已拘捕一名25岁男性嫌疑人,从其设备及使用的AI音频制作网站中找到了犯罪证据。次日,深圳言域科技有限公司承认,涉事音频采用其“Reecho睿声”技术基于卢文庆的直播片段生成,公司随即强化了安全控制措施。
此事引发了对AI声音克隆技术真实度的广泛讨论,尤其是该技术能够复制包括地方口音在内的复杂特征,令人难以分辨真假。深圳言域科技,一家成立不久的公司,凭借其能快速克隆人声的技术产品吸引了关注,其客户名单中不乏知名公司。其C端产品操作简便,用户仅需上传音频样本,AI即可学习并生成对应声音念出任意文本,甚至提供“瞬时克隆”和“专业克隆”选项,价格亲民。
然而,该技术的普及性和易获取性引起了对隐私权、版权及法律边界的担忧。有AI专家指出,虽然目前的声音克隆技术在短时间内生成的声音可能在长篇幅时显得不自然,但通过分段生成和后期编辑,仍能制作出高度仿真的音频。深圳言域的产品因允许用户自由上传音频文件进行克隆,而不局限于本人声音,被认为存在风险。市场上虽有其他公司如深声科技等也在研发类似技术,但多针对企业客户,且在使用权限上更为谨慎。