首页 > TAG信息列表 > 声学

声学感知刻度(mel scale、Bark scale、ERB)与声学特征提取(MFCC、BFCC、GFCC)

梅尔刻度   梅尔刻度(Mel scale)是一种由听众判断不同频率 音高(pitch)彼此相等的感知刻度,表示人耳对等距音高(pitch)变化的感知。mel 刻度和正常频率(Hz)之间的参考点是将1 kHz,且高于人耳听阈值40分贝以上的基音,定为1000 mel。在大约500 Hz以上,听者判断越来越大的音程(interval)

昨天声学所东海站的专家来交流

        昨天下午声学所东海站的专家来交流,首先介绍了他们的国产浅地层SPAS-100(内部型号),已经量产,市场型号不叫这个。他们在世纪初的十年中断了研究,现在又开始了。上世纪末有生产,型号QPY-1。非常凑巧的是,昨天上午整理单位报废设备的时候,发现好几台QPY-1。        他们现

初探语音识别ASR算法

摘要:语音转写文字ASR技术的基本概念与数学原理简介。 本文分享自华为云社区《新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素》,作者:黄辣鸡 。 语音识别技术的发展已有数十年发展历史,大体来看可以分成传统的识别的方法和基于深度学习

电子测量类期刊筛选

声学工程 声学技术 0.465 应用声学 0.496 噪声与振动控制 0.704 计量学 计量学报 1.668中国测试 0.625 机械、仪表工业 电子测量与仪器学报 2.29仪器仪表学报 2.498光学精密工程 1.803振动.测试与诊断 0.917仪表技术与传感器 0.836 电工技术 电源学报 0.89现代电力 1.612

【声学基础】20211212复习

目录第6章 声波的辐射6.1脉动球的辐射6.1.1球面声场6.1.2声辐射与球源大小的关系6.1.3声场对脉动球源的反作用————辐射阻抗6.1.4辐射声场的性质6.2声偶极辐射6.2.1偶极辐射声场6.2.2等效辐射阻6.3同相小球源的辐射6.3.1两个同相小球源的辐射声场6.3.2指向特性6.3.3自辐射阻抗

kaldi新手入门及语音识别的流程(标贝科技)

kaldi新手入门及语音识别的流程(标贝科技) 欢迎体验标贝语音开放平台 地址:https://ai.data-baker.com/#/?source=qaz123 (注:填写邀请码hi25d7,每日免费调用量还可以翻倍) ​​​​​​ 一、kaldi kaldi简介 Kaldi是当前最流行的开源的语音识别工具包,旨在提供灵活且可扩展的组

声学基础

一般人可以感觉到20 Hz~20kHz,强度为 -5dB~130dB 的声音信号。成年人为 30~16000Hz 之间,老年人为 50~10000Hz 之间。人是通过耳朵进行感受音波的,那为什么会称为波呢?最直观的可以看我们耳朵是怎么反应声音的。当声音经过外耳传入中耳时,镫骨的运动引起耳蜗内流体压强的变化,从而引起行

【声学基础】20211007课堂笔记

Ch2.弹性体振动学 Ch1.集中参数系统--质量集中在一点,描述系统的一些参数(质量、弹性系数、力阻)与空间位置无关,弹簧伸长压缩均匀 Ch2.分布参数系统(弹性体)--物体的线度同其振动的传播波长可以相比拟,振动系统的质量在空间有一连续分布,且某一部分质量包含弹性、阻尼性质 引入空间位置变

【声学基础】20210925课堂笔记

目录Ch1.质点振动学1.4质点的强迫振动1.4.1强迫振动方程1.4.2强迫振动的一般规律1.4.3质点的稳态振动1.4.4强迫振动的能量1.4.5振动控制:电声器件的工作原理1.质量控制区2.弹性控制区3.力阻控制区欧拉公式 Ch1.质点振动学 1.4质点的强迫振动 1.4.1强迫振动方程

【声学基础】20210919自习

目录Ch1.质点振动学1.3质点的衰减振动1.3.1衰减振动方程1.3.2衰减振动的一般规律1.3.3衰减振动的能量补充:二阶常系数齐次线性方程解法补充:麦克劳林级数 Ch1.质点振动学 \(F_{R}\) 阻力 \(R_{m}\) 阻尼系数或力阻 \(\delta\) 衰减系数 \(\tau\) 衰减模量 1.3质点

2021年语音合成论文统计(1~4月)

​ 论文统计每月更新一次,主要跟踪语音合成的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考,所有文章统计列表请访问http://yqli.tech/page/tts_paper.html)。读者有什么建议可以直接给我发消息,我将不断修改该统计。如有转载,请注明

第三代语音识别技术初探

全国声学大会语言声学分论坛上的现场报告知识总结   原文地址

图解什么是脉冲响应

图解什么是脉冲响应 转载:http://www.prozsound.com/index.php?g=home&m=video&a=show&id=4 什么是脉冲响应(Impulse Response)?   从基本概念上来说,一个脉冲响应(Impulse Response, IR)可以定义为一个被测系统在一个脉冲激励信号输入时,所得到的时域(时间-幅度)的响应特性。这里所

和声学基础——4、大调的功能组、经典和声进行

3、大调的功能组、经典和声进行 一、副三和弦   上一篇介绍了大调的正三和弦:Ⅰ、Ⅳ、Ⅴ。这三个和弦都是大三和弦,在大调中扮演着主要的角色。除了这三个和弦,大调的调内和弦还剩下四个,它们都叫副三和弦。副三和弦的功能式什么样的呢?   请大家观察,主和弦Ⅰ由1、3、5三级音构成,调

和声学基础——2、自然大调

2、自然大调 零、五声调式   介绍自然大调之前先来介绍五声调式。先来复习一下纯五度循环: C — G — D — A — E — B — F#/Gb — C#/Db — G#/Ab — D#/Eb — A#/Bb — F — C 五声调式就是从根音开始,在五度循环上顺序找到五个音构成的。譬如中国五声调式:宫(C)、商(D)、角(E)、徵(G)

语音识别

目录 背景基本概念一般流程预处理常用方法声学模型(一)多样性问题(二)语音识别任务的指标 语言模型解码器工作原理(一)分析声音(二)提取特征(三)识别音素和状态(声学模型)识别文字(语言模型+ 解码器) 深度学习方法发展基于transfomer的语音识别模型 语音数据集 背景 语音识别 ( Automat

2021秋招贝壳找房语音算法岗

1面 8.22 常规自我介绍 对语音(算法)这块有多少的了解?(因为本人之前不是做语音的) 有实际跑过语音(识别)这块的工具 / 流程吗?实践过吗? 一个语音识别系统,大致是怎么样的流程? 你用过哪种声学模型?GMM 还是 DNN?说一下声学模型的输入和输出分别是什么? 输入:一帧一帧的声学特

[乐理]基础乐理与和声学资源链接

1、基本概念 理科生学乐理系列:https://www.zhihu.com/question/22281022?sort=created 解释:这是5年前一位大佬写的; 2、乐理 《基本乐理教程》袁丽蓉 解释:乐理入门 3、和声学 《流行音乐多声部写作教程》潘永峰 知乎上某位用户评价很高 4、和声学 《流行音乐与爵士乐和声学》任达敏

【和声学学习】小调副三和弦

出现了!美妙的!忧郁的!文艺的!伤感的!小调副三和弦! 我选择强推弗里几亚进行Orzzzzzzzzzzzzzzzzzzz 那么今天来总结小调副三和弦。呃……其实跟大调副三和弦差不多…… 【音程辨析】 和声小调的II级与VII级是减三和弦,III级是增三和弦,VI级是大三和弦。而在功能组方面,与大调三和弦几乎没有

【信息技术】【2015.10】基于模型的多种环境下鲁棒语音识别方法

本文为英国剑桥大学达尔文学院(作者:Yongqiang Wang)的博士论文,共231页。 基于模型的方法是一种强大而灵活的鲁棒语音识别框架。该框架在过去几十年中得到了广泛的研究,并以多种方式进行了扩展,以处理各种声学因素造成的失真,包括说话人差异、信道失真和环境噪声。本文研究了在不

TWS 产业链

核心结论 Airpods系列TWS耳机成为TWS耳机的标杆。Airpods系列TWS耳机因其 通话稳定性以及长待机时间成为TWS耳机的标杆。安卓品牌产品受限于很多 基本技术问题长期以来体验不能满足基本需求的状况今年开始得到了很大改 善。 我们认为TWS耳机虽小但主控芯片设计和整机制造的门槛

是否存在适用于水下声学的基于Java的光线跟踪模型?

我正在寻找一个适用于建模基于水下射线的声学的开源Java射线跟踪系统.这样的软件包可能类似于带有高斯射线束(GRAB)的综合声学系统仿真(CASS),但我更喜欢可以在演示中使用的开源,免费使用或免费修改的模型到一个开放的论坛(例如JavaOne).   我需要的最佳模型将基于环境模型,测

《语音信号处理》《第2章 语音信号的声学基础及产生模型》

语音学三个分支: 1. 发音语音学 2. 声学语音学----进一步出现了声音模拟、语音合成、语音识别 3. 听觉语音学和心理语言学----研究人耳和大脑 本章介绍语音产生的过程及人耳的听觉过程,传统的线性语音产生模型以及目前广泛受到重视的非线性 语音产生模型,这些都是从事语音信号处理研