首页 > 其他分享> > Bilibili 字幕语料库 Bilibili 字幕语料库 2021-05-11 11:30:58 作者:互联网 文章目录 0 背景 1. 方案汇总 2. 可行性分析 2.1 tessertart-OCR 2.2 音频抽取转换 2.3 自有字幕文件 3. 字幕语料库构建 3.1 获取弹幕信息 3.2 转码处理 3.3 转换处理 4. 语料库建设 4.1 构建模型 4.2 测试模型 5. 预期收益 0 背景 近期在观看 Bilibili 视频的时候,发现一些 UP 主的视频从内容上来看都很精良,但却似乎少了点什么,粉丝量,播放量都上不去。想了想,是文案!按我的理解,大部分同类型同题材的 UP 主的文案都是类似的,撇开文案版权的问题(毕竟,读书人的事嘛[旺柴][旺柴][旺柴],怎么能叫偷呢 标签:语料库,UP,Bilibili,字幕,旺柴,文案 来源: https://blog.csdn.net/Marksinoberg/article/details/116646121