text-parsing

首页 > TAG信息列表 > text-parsing

JavaScript-我们可以从Wiktionary API中获得所需的部分吗？

我正在使用wiktionary api从wiktionary.org获取信息. 我正在获取json格式的数据,我也能够解析它… 但是我想从结果中删除部分数据(实际上,我只需要一些数据),但是我不知道如何从结果中删除某些内容. 我正在使用的代码是 <script type="text/javascript" src="./jquery-1.4.3.min.j

python-在Outlook中寻找API(任何语言)的有效演示,以便对电子邮件进行数据挖掘以生成社交图和知识图并进行标记.

我想在工作中对我的Outlook邮箱进行数据挖掘,以便能够更多地了解与人之间的互动以及他们的专业领域： >从“收件人：”和“抄送：”列表中生成社交图,以将人显示为网络上的节点,并与他们进行交互的人之间有界线 >用概念标记人(例如,代词和公认的公司定义概念以及电子邮件中的同义词) 这样

是否有仅Java与scala的解析器生成器等效？

Scala具有一种非常简单的创建解析器的方式.在仅使用Java的世界中,是否有相当等效的方法可以完成相同的工作,而无需花费一周的学习时间？解决方法:我不确定弯曲的曲线,但是在Java世界中,ANTLR Parser Generator被认为是最好的.

使用Java应用程序进行文本报告测试

我正在做一个项目,我必须检查从系统生成的一些(500)报告是否通过或失败. 我面临两个问题. >文本解析.每个报告都是唯一的,并且具有不同的格式. 报告示例：门票销售电影全座位销售空座位电影1 星期一100500 20 星期二120600 0 星期三8040040 星期四100500 20 星期五100500 20 电影2

C#-从字符串开头读取单个int的最简单方法

我有一个看起来像这样的输入字符串： 4 Bob 32 Joe 64 Sue 123 Bill 42 其中4表示要跟随的字符串整数对的数量.我当前的处理方式如下所示： var strings = input.Split(' '); int count = Int32.Parse(strings[0]); for ( int i = 0; i < count; i++ ) { string name = strings[co

Python优化：解析文本文件以存储默认值并在python中创建密钥对字典

我正在开发一个程序,我需要为其存储用户默认值,并且用户还应该可以选择修改默认值,以供将来使用该程序.因此,基本上,我有一个模块来管理默认参数和程序的其他方面,这些方面需要存储和稍后检索某些部分.例如,要管理默认参数,我在模块中有一个文件params.py来管理params.txt. python

Python解析框架

如果我需要促进从各种(非API)互联网资源中提取数据,是否有一种框架类型的解决方案可以简化让开发人员编写可重用但特定于源的大型解析器的过程？解决方法:我发现Pyparsing是一个Python库,对于解析自定义域特定语言非常有用.

扰乱Python itertools groupby中的奇怪行为/错误？

我正在使用itertools.groupby来解析一个短的制表符分隔的文本文件.文本文件有几列,我要做的就是将所有在特定列中具有特定值x的条目归为一组.下面的代码对名为name2的列执行此操作,以查找变量x中的值.我试图使用csv.DictReader和itertools.groupby来做到这一点.在表中,有8行符合此

如何在Java中提取多项式系数？

以字符串-2x ^ 2 3x ^ 1 6为例,如何从存储在字符串中的等式中提取-2,3和6？解决方法:没有给出确切的答案,但有一些提示： >使用replace meyhod：全部替换 – 用 – . >使用split方法： // after replace effect String str = "+-2x^2+3x^1+6" String[] arr = str.split("+"); // arr will

如何创建java pojo

我想读取一个属性文件并从中创建一个pojo.其中属性键是具有getter和setter的实例变量.和property value是实例变量的数据类型.输入将是这样的 className=Temp packageName=com.temp name=java.lang.String 输出将是 package com.temp; import java.lang.String; class Temp{ p

java – 围绕普通html文本换行标记

我的html文档中有这个结构： <p> "<em>You</em> began the evening well, Charlotte," said Mrs. Bennet with civil self–command to Miss Lucas. "<em>You</em> were Mr. Bingley's first choice."

php – 使用Regex匹配函数体

给定一个虚函数： public function handle() { if (isset($input['data']) { switch($data) { ... } } else { switch($data) { ... } } } 我的目的是获取该函数的内容,问题是匹配花括号{…}的嵌套模式. 我遇到了recursive patterns,但无法理解

C#中的正则表达式

我有这样的文字. @@MMIVLoader@ProductVer@4.1.2@BCM_7400S_LE@Product@Aug 21 2009@ @@MMIVLib@ObjectVer@4.1.2@BCM_7400S_LE@Product@Aug 21 2009@ @@HuaweFGDLDrv@ObjectVer@01.00.09@7324@PRODUCT@Aug 20 2009@ @@ProtectVer@ObjectVer@127.8.1 @BCM_SDE5.03@PRODUCT

使用python以下格式解析文件的最佳方法(防错/万无一失)是什么？

######################################## # some comment # other comment ######################################## block1 { value=data some_value=some other kind of data othervalue=032423432 } block2 { value=data some_value=some ot

使用Python解析文本：非结构化但具有不同格式的类似信息

我正在尝试使用Python解析包含公司,材料,化学属性等的数千个规格表文本文件(材料安全数据表,具体而言).文本文件包含松散结构化格式的类似信息,因此它具有人类可读性,但非结构化,不易解析(例如,不是XML或CSV).简而言之,它就是到处都是. 最初的数据是由在不同公司工作的不同人员手工

python – 保留文本结构信息 – pyparsing

使用pyparsing,有没有办法在递归下降过程中提取您所处的上下文.让我解释一下我的意思.我有以下代码： import pyparsing as pp openBrace = pp.Suppress(pp.Literal("{")) closeBrace = pp.Suppress(pp.Literal("}")) ident = pp.Word(pp.alphanums + "_" + ".") comment = p

c# – 从任意纯文本中提取特定标记

我想解析纯文本注释并在其中查找某些标记.我正在寻找的标签类型如下： <name#1234> 其中“name”是[a-z]字符串(来自固定列表),“1234”表示[0-9]数字.这些标记可以在字符串中出现零次或多次,并被任意其他文本包围.例如,以下字符串都是有效的： "Hello <foo#56> world!" "<bar#1>!"

java – 将动态XML / JSON内容与静态标记有效负载进行比较并检索标记值

我正在实现模拟http响应服务器.服务器必须验证输入请求URL和有效负载,然后将请求与配置的响应匹配,然后将其返回给调用者. 因为我需要帮助验证具有静态标记有效负载的http请求动态内容有效负载. 因此,当我获得请求有效负载时,请说json,将其与配置的标记化内容进行比较,如果不匹配则

Python使用可选的键/ val对标记句子

我正在尝试解析您有句子的句子(或文本行),并且可选地在同一行上跟随一些键/值对.键/值对不仅是可选的,而且是动态的.我正在寻找一个类似的结果：输入： "There was a cow at home. home=mary cowname=betsy date=10-jan-2013" 输出： Values = {'theSentence' : "There was a cow at