知识分享

预告:声纹识别技术的现状、局限与趋势丨硬创公开课

2020-11-04 11:35:32 admin

江苏卫视《蒙面唱将猜猜猜》第二季于11月27日收官,这是一档音乐悬疑竞猜类真人秀,由一群资深艺人组成的猜评团对蒙面唱歌的歌手进行身份的猜测。在第二季中,猜评团中加入了一个特别的助理,机器人小V,这个机器人的厉害之处在于能够通过声纹识别来猜歌手。据介绍,小V身后有一个数据库,输入了600多个歌手的2000多首歌。通过节目效果来看,小V成功帮助揭开那英、周深和李嘉格等歌手身份。不过,也有声音质疑以目前的声纹识别技术,小V根本不可能那么轻易得出正确答案,加上小V在与其他嘉宾的互动中的表现,小V被质疑是与此前走红网络的“娇娇”一样属于“人肉智能”。

那么,目前的声纹识别技术有没有可能让小V能快速准确识别一个人的声音,声纹识别技术的局限和趋势又在哪里。

嘉宾简介:

陈孝良,博士,声智科技创始人,曾任中科院声学所副研究员和信息化办公室主任,中科院上海高等研究院客座,北京市公安局首届网络应急专家,主要从事声学信号处理和 GPU 深度学习算法研究工作。

嘉宾履历:

2002 年从北京航空航天大学毕业后进入金山软件股份有限公司工作,2003 年进入中科院声学所,师从著名声学家田静和李晓东学习。主要参与海军某重大项目(已获得国防重大奖项)及 863、中科院战略先导项目等。期间负责的核心算法长期服役于海军某重大型号。

2016 年 4 月中旬离职中科院,带领声学阵列和深度学习两个团队在峰瑞资本的支持下成立声智科技,主要致力于解决真实场景下的语音交互问题,实现“听你所言、知你所想”的愿景。目前声智科技的语音交互技术已经应用于包括 360、小米、百度和东方网力等产品系列以及数十家音箱和汽车相关企业。