首页 > 代码库 > 扒一扒:《大话西游》中的声纹识别!

扒一扒:《大话西游》中的声纹识别!

近期,星爷经典作品大话西游重新上映,引发怀旧热潮。小编也买了票,想重温一下传说中那份感动。


万万没想到,看了一会,小编就没控制住大开的脑洞,陷入了离题万里的思考中:电影中,紫霞说一声“芝麻开门”,盘丝洞的门就自动打开了,而至尊宝说“芝麻开门”时,门不仅没开,而且还把他砸了个半死。


十年前看的时候不明白为什么,现在再看时忽然领悟了:


盘丝洞的门肯定使用了声纹识别技术!


那么现在问题来了:何为声纹识别技术?现实世界里面有应用吗?


下面就一一为大家道来。


声纹识别技术,又称说话人识别技术,是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的生物识别技术。每个人都具有独一无二的声纹,这是由我们的发声器官在成长过程中逐渐形成的特征。无论别人对我们的说话模仿的多么相似,声纹其实也是具有显著区别的。


所以,如果你的电子设备应用了声纹识别技术,那么它就只能由你来打开。现在小伙伴们都知道了,为什么盘丝洞的门只听紫霞的命令,至尊宝叫破喉咙它都开不了了吧~~


当然,这么炫酷的技术并不只存在于影视中,它早已走进了我们的日常生活。


2013年,科大讯飞就在业界率先推出了灵犀声纹锁屏应用。使用者在设备上进行3遍成功的声纹注册后,即可使用声纹锁屏应用。在手机锁屏的情况下,使用者只要对着手机说出声纹密码,即可解锁手机,如果不是本人的声音,则无法解锁。


那么机器是如何认识出我们声音的呢?


声纹识别有两个关键问题:一是特征参数提取,二是模式匹配。


特征参数提取的任务是提取并选择对说话人的声纹具有可分性强、鲁棒性高等特性的声学或语言特征。通俗来说,就是从说话人语音中提取出能够表征说话人特定器官结构或习惯行为的特征参数


该特征参数对同一说话人具有相对稳定性,不会随着时间或环境的变化而变化;同时,该参数在同一说话人说出不同话语时是一致的,而在不同的说话人说同样的话语时能够体现显著的区别,具有不易模仿性。


同时,声纹识别技术的应用要求是可以在任意场合、系统进行快速的响应,所以声纹识别技术还需要具备快速的运算机制与高抗噪性。

图:声纹识别技术的原理


没想到吧,在电光火石之间,设备在准确判断我们是不是真正“主人”的过程中,已经完成了一个如此复杂的识别流程。


当然,目前声纹识别技术并非完美。比如当你本人身体状况发生改变时,当别人录下你的声音时,声纹识别系统可能还会出现误识等。针对上述问题,科大讯飞也正在积极也在地研究解决方案,力争让大家早日用上安全、快速、可靠的声纹识别应用和产品。


相信在讯飞的努力下,声纹识别技术未来一定会有更广阔的应用空间。在不久的将来,也许你可以用声音登录银行账户,用声音签合同,用声音锁门开门……省去那些繁杂的手续,回归最自然的语音交互我们未来的生活将会因为语音技术的广泛应用更加便捷、多彩!


更多开放能力,请猛戳:http://open.voicecloud.cn/

扒一扒:《大话西游》中的声纹识别!