python – 将单词添加到WordNet的本地副本
作者:互联网
我正在使用WordNet,通过Python的NLTK访问,以比较来自社交媒体的单词的同义词.其中许多单词不在NLTK连接的WordNet版本中.
当我说出我的话时,我指的是特定领域的术语,而不是缩写词或表情符号.
我编译了这些单词的列表,并希望将该列表与WordNet合并.
搜索先前的努力开始尝试开发自动更新WordNet的方法.
我想象的步骤是:
>克隆WordNet数据库
>编写寻找本地副本的WordNet模块的扩展
>更新本地副本.
这听起来有多合理?
解决方法:
我自己还没有改变过WordNet,但是我在使用Multilingual Central Repository时有很好的经验,我相信你应该能够用你想做的事情.
它包含几种语言(包括英语)的WordNet 3.0数据文件,这些语言通过所谓的语际索引(ILI)相互联系.数据文件可以加载到MySQL或PostgreSQL数据库表中,从这一点来说,不仅要使用SQL命令查询它,而且要插入新项目,维护表之间的对应关系应该相对容易.您当然可以导出已更改的数据库,例如如果使用SQL不足以达到您的目的,则转换为CSV文件.
标签:python,python-2-7,nltk,wordnet 来源: https://codeday.me/bug/20190708/1406799.html