编程语言
首页 > 编程语言> > 谷歌应用程序引擎数据存储标签云与python

谷歌应用程序引擎数据存储标签云与python

作者:互联网

我们的应用引擎数据存储区中有一些非结构化的文本数据.我想在数据存储区对象的子集上创建一个属性的“一次性”标记云.环顾四周之后,我看不到任何框架可以让我在没有自己写的情况下做到这一点.

我的想法是:

>写一个地图(如map reduce)功能来遍历数据存储区中特定类型的每个对象,
>将文本字符串拆分为单词
>为每个单词增加一个计数器
>使用最终计数通过一些第三方软件生成标签云(离线 – 欢迎提出任何建议)

因为我之前从未这样做过,所以如果首先有一些框架可以帮助我(请),如果不是我以正确的方式接近它,我就会徘徊.请随意指出计划中的漏洞.

解决方法:

Feed TagCloudPyTagCloud是两种可能性.

> Feed TagCloud Generator Gadget for
Google App Engine
可能适合你的
需要.不幸的是,它是
无证.幸运的是
相当简单,虽然我不确定
它是多么适合您的需求.

它在Feed上运行,然后出现
有点灵活,所以如果你
有你的网站的饲料,它可能
不要太麻烦了
整合,虽然所有处理
将在线.
> PyTagCloud也值得一试
看.你将能够做到
脱机处理,并生成
相当英俊的云.

所有你需要做的就是得到这个
工作,导出您的数据存储区;
计数和分裂将是
像PyTagCloud一样为你完成
对文本文件进行操作.以下
App Engine中的说明
关于Uploading and
Downloading Data
的文档将告诉你
如何将数据存储导出到您的
本地机器.你会想写的
一个“出口商类”,并有
PyTagCloud在输出上运行.

如果你决定自己推出,你可能想跳过在线处理并使用上面的Uploading and Downloading Data的离线方法,除非你想要一个动态更新的云.迭代整个数据存储,进行在线计数是任务中最烦人且最昂贵的部分.如果您想要或需要动态标签云,这样做才有意义.如上所述,我建议编写一个“Exporter Class”,然后在本地操作.

标签:python,google-app-engine,tag-cloud
来源: https://codeday.me/bug/20190521/1149006.html