首页 > TAG信息列表 > text-classification

python-Cloud ML Engine和Scikit-Learn:“ LatentDirichletAllocation”对象没有属性“ predict”

我正在实现简单的Scikit-Learn管道,以在Google Cloud ML Engine中执行LatentDirichletAllocation.目标是根据新数据预测主题.这是用于生成管道的代码: from sklearn.feature_extraction.text import CountVectorizer from sklearn.decomposition import LatentDirichletAllocation

python-无法将Tensorflow模型冻结到冻结的(.pb)文件中

我指的是(here)将模型冻结为.pb文件.我的模型是用于文本分类的CNN,我正在使用(Github)链接来训练用于文本分类和以模型形式导出的CNN.我已经将模型训练到4个纪元,并且我的检查点文件夹如下所示: 我想将此模型冻结为(.pb文件).为此,我使用以下脚本: import os, argparse import ten

NLTK精度:“ ValueError:太多值无法解压缩”

我正在尝试使用NLTK工具包对Twitter上的一部新电影进行情感分析.我遵循了NLTK“ movie_reviews”示例,并建立了自己的CategorizedPlaintextCorpusReader对象.当我调用nltk.classify.util.accuracy(classifier,testfeats)时,就会出现问题.这是代码: import os import glob import nl

python – 如何绘制混淆矩阵?

参见英文答案 > How to plot confusion matrix with string axis rather than integer in python                                    4个 我正在使用scikit-learn将文本文档(22000)分类为100个类.我使用scikit-learn的混淆矩阵方法来计算混

python – MultinomialNB – 理论与实践

好的,我只是在研究Andrew Ng的机器学习课程.我目前正在阅读this chapter,并希望使用SKLearn和Python为自己尝试Multinomial Naive Bayes(第12页底部).所以Andrew提出了一种方法,在这种方法中,每种电子邮件都是如此编码的 We let x_i denote the identity of the i-th word in the

python – 使用mxnet CNN模型进行预测

嗨,我是数据科学的新手, 我遵循了本教程https://mxnet.incubator.apache.org/tutorials/nlp/cnn.html,但我对如何使用上述教程生成的训练模型进行单一预测感到困惑.请指导我正确的方向来解决这个问题.谢谢.解决方法:以下是如何使用预训练模型进行预测的教程:https://mxnet.incubator

python – 使用Keras进行文本分类

我正在努力接近单词/词汇方法,将我的输入数据表示为我在keras中的神经网络模型的一个热矢量. 我想建立一个简单的3层网络,但我需要帮助理解和开发一种方法,以文本的形式转换我的标记数据,sentinment有7个标签,范围为0-1,步长为0.2. 我曾试图使用scikit的矢量化器,但它们过于严格,即

python中大数据集的文本分类

我有220万个数据样本分类到超过7500个类别.我正在使用pandas和sckit-learn of python这样做. 以下是我的数据集示例 itemid description category 11802974 SPRO VUH3C1 DIFFUSER VUH1 TRIPLE Space heaters Architectur

java – 自然语言处理 – 将文本特征转换为特征向量

所以我一直致力于一个自然语言处理项目,在这个项目中我需要对不同的写作风格进行分类.假设已经为我提取了文本的语义特征,我计划使用Java中的Weka来训练SVM分类器,使用这些可用于对其他不同文本进行分类的特征. 我遇到麻烦的部分是训练SVM,必须将这些特征转换为特征向量.我不确定你