其他分享
首页 > 其他分享> > Joint CTC/attention decoding for end-to-end speech recognition

Joint CTC/attention decoding for end-to-end speech recognition

作者:互联网

Joint CTC/attention decoding for end-to-end speech recognition

1. 论文摘要

端到端asr 的两种主流形式:(1)基于识别结果和声学特征之间atttention 方式;(2)基于ctc,通过马尔科夫假设利用动态规划来求解序列问题。
*思路:
传统基于attention的对齐方式自由度太高,asr任务大多数都是按照序列渐进对齐,因此考虑采用ctc-based 的对齐方式来指导解码。

2. 模型架构

在这里插入图片描述

标签:end,解码,attention,decoding,ctc,序列,对齐
来源: https://blog.csdn.net/pitaojun/article/details/111493883