其他分享
首页 > 其他分享> > 信息检索的过去 当前 未来-------浅层分析报告

信息检索的过去 当前 未来-------浅层分析报告

作者:互联网

关键字:
信息检索;信息的专业分工;
专业化的信息垂直供应;信息的商品化;
商品化信息的信息;信息加工融合搜索

过去:
信息少,我们只须到163这样的网站上发发邮件,看看新闻,浏览一下图片即可满足我们的需求。
那时,信息少,上网叫冲浪。是个时髦新鲜的玩意。人们不需要关注太多,因为网络还很远。对生产,工作,学习,生活还产生不了多大的影响。

当前:
网络是必须的一个世界。它使得信息在秒级概念下传递。信息爆炸,垃圾成堆,新闻发生和无数互动者,参预者都成为信息制造者,甚至每个人,如果你愿意,你一年至少可以用发表一篇文章。或者你可以写一本书。不需要出版社,不需要政治审核。也不需要你是教授专家。网络的普及,可以说也是对所谓自由度的释放。

未来:
我们自己迷失在自己创造的信息里。或许某个专栏写手,能成为琼瑶的后来者。也许某个人的论文,应该收录进电子图书馆。我们每个人每天创造1000笔信息,却同时需要参考10W笔信息,用以我们的生产,生活,工作,学习。到这时,我们愁的就不是信息量与质的问题。我们开始不得不面对的问题:就是信息的对口供应问题。好比现在的超市:我需要厨房用品我可以直接到专柜。那里的东西分门别类,可挑可选,一应俱全,明码标价。我的成本有四个,因比价降低的成本;时间上节省的成本;总体采购累计量折扣获得的优惠成本;商品集中供应,我能集中采购比较方便而减少的成本。

同比
在信息领域呢,能否做到这样的成熟的,专业化的垂直供应,对口供应。我想能。但信息本身就是些多种媒体方式的Bit流。我们需要它,因为工作,学习,生活而原始需要,需求。专业化分类实在必要。我觉得同比传统商品的思维模式,分类,分拣模式,一定是可以参照的。只是通过的途径不一样。它更多体现在部分可商品化的实物和部分需要持续提供支持的服务。而Bit的方式也决定了它可以尽可能的节省成本和传递时间,通过网络本身来传递。直接到用户手里。这是有区别与传统商品的地方。

趋势
可以看出,专业化针对信息的产供销,是必然存在的。当然,我们目前要讨论的仅仅限与有商用价值或实用价值高的信息。blog,bbs内的信息注定只能成为我们茶馆文化,或休闲聊天的参考。如果要形成更好的价值,我看难。目前这些主要是构成沙龙,坛子,人气,圈子的聚集人气的素材,或比喻为水澡。而说某些文学类的专栏还可以出集子,那其实是说创作的发布地转移到该处而已,就其信息价值而言,如同纸张的作品一样,本身有其很高的原创价值。我们应该看到可以推动生产,生活,学习这部分有价值的,可出售,可有偿使用的这部分信息,会逐渐商品化。当然载体可能依照其它的电子身份认证来出售给个人或公司使用。或者提供一种定向的,持续的服务。

机会归属
那这个必然涉及到一个信息的采集,整理,加工的专署工厂性质的实体。它有巨大的信息存储体。有标准规范的信息格式,有众多能进行分类,检索索引,加工,压缩的机器或编辑,技术人员。显而易见。结构化的信息是受欢迎的,是规范的,容易再处理的,虽然无结构或半结构化的东西很多。明显的,现在要让自己的信息在提供给第三方或中间商时,大家默认都需要一个可以共通的格式。纸张印刷应该以后会淘汰。因为纸张的唯一作用是以最低成本往人的眼前展示的信息(newspaper)。无法进行编辑和电子化传递。我们可以想到。它肯定是各种成行成列,或依据某种规范化格式的数据,才可以让第三方能通过电脑来处理,运用,编程读取,加工等。只要你们协商好interface和format或struct.在这三个方面不变的前提下,你们可以独立的,协调的工作。提供信息,使用信息,加工信息。这个过程,甚至全在电脑之间完成,交易,传递都通过电子网路。成本,时间,精确度,都能消耗最低成本。

指向商品化信息的信息
以上一点的结论很有意思,就是信息已经结构化,电子化。有实用价值的信息再也不用通过通用搜索引擎在无序的网页上来来抓取,分析,索引,摘录了。这里讲的类似爬虫的电脑程序(spider),今天看来,大家误认为是最好的方式。其实是一种很原始,很耗时,很浪费电能,存储空间的做法。及时性也无法达到理想状态。大量累赘无序的数据存放在互联网网页,动态DB里。某个公司想要来抓取,分析,分类,处理,是不可能的。版权问题;服务器负荷问题;抓取不全面的问题;格式不统一的问题;语言障碍;存储空间问题(任何一家公司的存储能力永远不可能等于全社会公司的存储能力);摘要问题(摘要其实只是简介,不是信息本身);交易问题。要回答这些问题,那办法就是,信息细分类,格式化,电子化,网络化,产品化,商品交易化。流通化。如此,是我的答案。

那就印证了我的段落标题:指向商品化信息的信息。也就是说,我们只需要发布某个信息的供求信息。比如:我求购100篇机械行业的分析报告。那我可以通过直接供应商或中间方得到。我不需要通过其它不可靠的,耗时的,耗人力的,不专业的方式来取得。另如:我需要社会关注度最高的热点事物统计。同样我可以得到权威的,准确的,及时的信息。最大的区别在于:如果我是现在这种模式来找,不仅我无法确定来源真实性,而且我无法准确定位信息源,并且,要我具备专家的眼光和鉴别能力,是不可能的。社会化生产的分工需要专业化,专门化;信息链的生产,供应,加工,销售,都是一样要遵循这个原则。

搜索引擎的专业化
信息的提供者改被动方式为主动提交。改无索引方式为有索引。搜索引擎起到一个图书的编目库功能。而且更快,更准确,更及时,更环保省电。也更专业化。

现在的搜索只是给你一个包罗万象的块,一个基于字面机械意思关联的杂七杂八的汇总。真实世界里需要的准确,及时,专业,权威,一样都谈不上。反言之,我们现在面对的格局是无赖:明知道搜索不能达到我们的具体目的要求,可不通过搜索你又有什么办法。

通用化+垂直化+专业化+定向化是目前的解决办法。现在虽然平面搜索可说如日中天。可大家心理都明白。作为一个产品广告投放者(主动信息发布者),他的目标浏览者实际上只有总入口人流的100万分之一不到。就好比说,商场里面往往都是上万人,但买某个牌子牙膏的人不是很多。并没有某些网站夸张的广告术语那么大的效果。但作为传统媒体的拓展,网络搜索不利用不行,利用的效果不理想,也是无耐的尴尬。

信息的直达,信息的专业化对口提供是垂直化搜索的使命。但可想而知,360行,准确的说现在可能是360万行(比如说圆珠笔芯的芯油和飞机的一颗螺丝),每个行业都要做到专业化需要过程,而我们要面临这莫多专业化网站或工具,未来必然出现针对搜索的搜索。因为搜索太多。这就会形成一种从平面到垂直,普遍到专业的多层次,多格局的搜索局面。它们之间必然要形成有效沟通和协议理解,否则,不是给人带来方便,反而增加使用者难度。

所以,提供直达目的的精确搜索是搜索的必然终极要求。

信息加工融合搜索
纯粹依靠电脑技术来进行字面的匹配充其量是机械式的做法,虽然能完成人力无法完成的工作量和精准度。但离开人的参预的搜索我觉得不是人需要的搜索。靠机器是无法把一个链条整和在一起的。比如产供销。其实拿企业为例子,它是生产者,也是原料消费者,是人力资源,其它资源的消耗者,更是社会各方面的参与者。如果提供单向的脱节的信息提供模式,必然人脑会被电脑搞得受不了。必须提供能多层次,全方位,智能化,直达化,专业化,简捷化,高效率化的方式来供人使用。才是我们希望的方式。

版权声明:本文为CSDN博主「chengg0769」的原创文章

原文链接:https://blog.csdn.net/chengg0769/article/details/1679838

恋恋有词2021 发布了3 篇原创文章 · 获赞 0 · 访问量 304 私信 关注

标签:需要,信息检索,商品化,信息,浅层,搜索,当前,专业化,我们
来源: https://blog.csdn.net/qq_26023835/article/details/104175952