首页 > TAG信息列表 > Senta

2021SC@SDUSC-山东大学软件工程与实践-Senta(十)

本篇对SENTA中的BaseDataSetReader进行源码分析。 BaseDataSetReader:将样本中数据组装成一个py_reader, 向外提供一个统一的接口。 核心内容是读取明文文件,转换成id,按py_reader需要的tensor格式灌进去,然后通过调用run方法让整个循环跑起来。 py_reader拿出的来的是lod-ten

山东大学软件工程应用与实践----SENTA代码分析(八)

2021SC@SDUSC   这篇代码接着继续分析 先来分析base-trainer.py这个文件  BaseTrainer 类  代码如图所示  1.运行环境初始化 2.program初始化 3.计算图网络导入 4.模型参数导入 5.运行(reader) 6.模型导出 :param params: 运行的基本参数设置 :param data_set_reader: 运

2021SC@SDUSC-山东大学软件工程与实践-Senta(5)

本篇对Senta中token embedding中所使用的ELMO模型进行分析。 paddlepaddle:百度深度学习的框架 paddle.fluid.layers.dropout: 丢弃或者保持x的每个元素独立。Dropout是一种正则化手段,通过在训练过程中阻止神经元节点间的相关性来减少过拟合。根据给定的丢弃概率,dropout操作

2021SC@SDUSC-山东大学软件工程与实践-Senta(4)

SENTA通用规则中的类(代码分析) MaxTruncation:超长截断 class MaxTruncation(object): KEEP_HEAD = 0 KEEP_TAIL = 1 KEEP_BOTH_HEAD_TAIL = 2 KEEP_HEAD : 从头开始到最大长度截断 KEEP_TAIL : 从头开始到max_len-1的位置截断,末尾补上最后一个id(词或字) K

2021SC@SDUSC-山东大学软件工程与实践-Senta(1)

简介 情感分析旨在自动识别和提取文本中的倾向、立场、评价、观点等主观信息。 它包含各式各样的任务,比如句子级情感分类、评价对象级情感分类、观点抽取、情绪分类等。本次百度在Senta中开源了基于SKEP的情感预训练代码和中英情感预训练模型。SKEP是百度研究团队提出的基于