其他分享
首页 > 其他分享> > 一个利用CNN抽取实体的工具

一个利用CNN抽取实体的工具

作者:互联网

CNN4IE

项目地址:https://github.com/jiangnanboy/CNN4IE

中文信息抽取工具。使用CNN的不同变体进行信息抽取,以后会持续加入不同模型。该项目使用pytorch,python开发。

CNN4IE将各种改进版本的conv进行改动用于中文信息抽取。

Guide

Intro

目前主要实现中文实体抽取:

训练样本以B、I、O形式进行标注。

Model

模型

模型里面的conv块部分主要来自后面的paper中的部分模块。

Usage

Evaluate

评估采用的是P、R、F1、PPL等。评估方法可利用scikit-learn中的precision_recall_fscore_support或classification_report。

Install

git clone https://github.com/jiangnanboy/CNN4IE.git
cd CNN4IE
python setup.py install

通过以上两种方法的任何一种完成安装都可以。如果不想安装,可以下载github源码包

 

标签:1.00,抽取,predict,Train,实体,train,0.98,CNN,type
来源: https://www.cnblogs.com/little-horse/p/15388012.html