达摩院智能语音交互 - 声纹识别技术

达摩院智能语音交互 - 声纹识别技术

4课时 |
897人已学 |
(4 评论)
  • 收藏

  • 分享

  • 免费

    加入学习
    扫二维码继续学习 二维码时效为半小时 去移动端学习
    • 收藏

    • 分享

    加入学习
    课程介绍

    声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种:

    • 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题
    • 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是)

    按照应用具体分为两种:

    • 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式)
    • 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高

    本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。

    讲师介绍:

    郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

    授课教师

    达摩院算法专家
    阿里云开发者社区全面升级
    一站式体验,助力云上开发!
    进入新社区

    相关课程

    查看更多 >

    本课程相关云产品