首页 > TAG信息列表 > 声纹识别

声纹-前世今生

声纹: voiceprint. 可以将一个人的声音 与 其他人的声音区分开来 的特征 属于音频处理技术 生物特征识别技术分为:生理特征和行为特征 生理特征:指纹、DNA、人脸、视网膜 行为特征:声纹、笔迹、步态 模板匹配方法 基于时频谱的人工鉴别法 对应的文字内容一致, 文本相关的声纹识别 文本

https://blog.csdn.net/u011930705/article/details/85340905 【kaldi】【kaldi】声纹识别之X-vector声纹识别之X-vector

一.搞了几天,首先说一下X-vector的优势: 1.训练速度非常快 2.无需特定语种的训练集,由于设置一个embedding层进行提取特征直接进行plda打分 3.识别率不错 二.Kaldi中有现成的例子,可供研究 https://github.com/kaldi-asr/kaldi/tree/master/egs/sre16/v2 https://github.com/kaldi-asr/k

浅谈语音技术(ASR/TTS/质检/声纹)

文章目录 1. 写在前面2. 语音合成 TTS(1) 基本概念(2) 效果评估方法(3) 音色与定制(4) 发音规则 3. 语音识别 ASR(1) 基本概念(2) ASR效果影响因素口音噪音专业术语VAD (3) 效果评估方法(4) ASR效果提升方案声学模型(AM)语言模型(LM) 4. 语音质检(1) 基本概念(2) 质检效果(3)

时代拓灵文本无关声纹识别SDK集成调试过程

时代拓灵文本无关声纹识别SDK效果概述 声纹识别有文本相关的(Text-Dependent)和文本无关的(Text-Independent)两种。时代拓灵文本无关声纹识别系统则不规定说话人的发音内容,用户使用方便,可应用范围较宽。 根据特定的任务和应用,文本相关和文本无关两种声纹识别SDK是有不同的应

清华大学揭露人脸识别漏洞,风口渐起的声纹识别能否为安全上锁?

最近,清华大学瑞莱智慧团队展示了一款非常方便的破解技术,一副小小的眼镜就能够让智能手机的人脸识别形同虚设,而在20款国内最受欢迎的手机之中仅有一款幸存下来。 之所以会发生这样的情况,就是因为在破解过程之中利用了人工智能算法普遍存在的对抗样本bug。破解之前,测试人员拿到

声纹识别模型解析之VoxCeleb2

论文:   VoxCeleb2: Deep Speaker Recognition 思想:显然,VoxCeleb2是在voxceleb基础上扩充和改进,仍然是两个贡献点:   1)扩大声纹识别数据集,由voxceleb的1251说话人超过19万句子,到voxceleb2的超过6000说话人共计超过百万的语音句子,适用于噪声和非约束场景下的声纹识别任务;   2)相

声纹识别之xvector

说话人识别xvector网络结构理解,从tdnn到xvector向量。 TDNN 时延神经网络(TDNN)来自1989年的论文《Phoneme recognition using time-delay neural networks》。原文中主要使用TDNN来识别音素,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。 普通神经网络识别音