网站导航

 
搜索引擎的发展及应用趋势
 

        

从当前互联网上的排名情况来看,门户类服务与搜索类服务依然处于互联网应用中的主导地位。社区类服务尽管也牢牢占据着排行的前列,但因其商业模式还不够明晰,同时还受到QQ、MSN等即时通信服务的挤压,发展前景不容乐观。门户类服务将走向媒体加社区的混合服务形态,以媒体服务为主,社区服务为辅,是门户类网站保持其用户粘度的制胜法宝。综合类门户网站的市场格局,短期内不会有大的改变,传统的门户网站的霸主地位依然难以撼动。从近两年传统媒体网站的发展就可以看出,除了中央级新闻网站之外,地方媒体网站都在悄悄转型,从纯粹的新闻门户转向地方资讯门户和地方服务门户。

众所周知,门户服务的基础是内容,门户利用内容及门户特有的内容展示方式提升流量、聚集人气,反过来,将聚集的人气、聚合的忠实用户,“卖”给广告商,以获取利润。门户作为网络媒体的主要存在形态,其媒体特征与价值已被人们所认可。门户与传统媒体的关系也非常清晰,离开传统媒体,门户将失去其存在的价值;缺少门户,传统媒体的网络价值也无法提升。所以,门户类网站如何发展,很大程度上,取决于新旧媒体的合作与融合,尤其是体制上和资本上的合作与融合。Google和百度掀起的热潮让搜索无可争议地成为网络服务的焦点应用。搜索作为一种互联网上的“杀手级”应用,已经成为网络时代不可或缺的服务之一。搜索服务在取得巨大成功的同时,也在向门户渗透。新闻服务几乎成了各大搜索引擎的必备服务。

在探讨搜索引擎在传统报业的创新应用之前,有必要先研究一下现有搜索引擎的发展动向与趋势。

我们可以从搜索引擎的近期变化判断其未来走势。如果将搜索过程分为三个阶段,可以这样进行划分:首先选择搜索的范围或类别;第二步:输入搜索条件,进行搜索;第三步:搜索结果输出与展示。

从搜索范围上看,搜索服务范围在逐步扩大,从单一的网页搜索,发展为网页、新闻、网站、MP3、电影、产品等更大范围的信息搜索;从信息类别角度看,出现了图书搜索、数码产品搜索、电影搜索、视频搜索等专业的搜索服务。但无论是哪类搜索服务,其预先选定搜索范围或类别的方式,目的都是相同的,就是力图使搜索结果更贴近用户的需求。

随着互联网信息的持续高速膨胀,信息存储成本的降低,信息的增长速度还会继续加快。如果按照现在的解决思路,搜索服务前端的分类必定会越来越细、越来越多。当分类增长到一定数量时,搜索服务的分类页面就演变成了门户。而搜索方法在相当的一段时间里不会发生质的变化,关键字搜索依然是主流,尽管关键词搜索存在非常明显的缺欠。关键词搜索有一个天生的弱点,这就是,用一个词或一组词,均很难表述我们的搜索需求,而且,使用什么样的搜索词,与人们的知识水平有非常紧密的关系。

未来几年里,描述性语言搜索、自然语言搜索及智能搜索都会有相当的发展,但在近期,不会有什么特别的商业价值。原因很简单,就是由于人们几年来养成的搜索习惯,喜欢使用简单的词来表达搜索的需求。搜索结果的展示与处理,会成为搜索服务提供商近期的竞争焦点。理由很简单,基于现在的搜索方法,搜索结果的数量无法减少。仅仅依赖某种算法进行结果的排列,也无法满足不同用户的需求。

对搜索结果的处理可能会出现两种方式:一是对搜索结果进行自动分类与自动聚类,采用分类的方式进行搜索结果的展示;二是采用门户的设计思想和展示方式,对搜索结果进行处理与展示。这两种方式的目的就是,在空间有限的页面上,展示更多的搜索结果,以满足采用同一搜索条件,但具有不同信息搜索需求的用户的个性化需要。这种对搜索结果的处理思路,也可以理解为一种知识聚集与提取。在企业级搜索服务平台中,已经开始采用这种处理方法

另外,基于搜索结果的优化搜索方法,也是搜索服务提供商要解决的问题之一。

如何通过最少的搜索次数,快速收敛到一个较小的范围,也是提高搜索服务效率的途径之一。搜索服务门户化分类与搜索结果门户化展示,或许是提高搜索服务质量和效率的有效途径之一。搜索引擎的变化也表明了这样一种思路,就是人们都充分意识到,仅有搜索是不够的,仅有信息是无用的。当每次搜索结果都变成海量后,搜索的价值将明显降低。

搜索引擎会继续优化现有的通用搜索服务。从近几年的发展情况看,搜索引擎的核心技术似乎没有什么大的创新,其主要的变化在于搜索范围的扩大和搜索结果的表现形式上。搜索范围不再局限在互联网上,以Google、百度为代表的搜索引擎,已经把搜索范围扩大到非互联网领域。而非互联网领域内容的采集不能再依赖于“网络爬虫”,合作成为必须的方式与手段。图书搜索、学术搜索、地图搜索等专业搜索服务的出现,标识着搜索引擎的一个质的变化,这就是,搜索引擎正在从单纯的搜索工具向内容服务转变。传统门户将因此受到一定程度的挤压。

随着传统搜索引擎霸主地位的进一步增强,跟随其后的二流搜索引擎将发生分化。一部分搜索引擎将转向专业类搜索服务,也就是所谓的垂直搜索,此类搜索服务的成功关键在于专业内容的整合能力;还有一部分搜索引擎可能转变为内容分发服务,就是利用搜索引擎的内容采集和自动分类能力,为各类网站和机构提供内容定制服务。比如,一个旅游类网站,可能通过向搜索引擎服务商购买旅游类资讯定制服务来增加网站的资讯量,以此来降低内容采集与编辑成本。

依本人之见,从搜索到发现、从信息到知识,应是解决搜索引擎困境的一种思路。以Autonomy、Fast Search & Transfer为代表的企业级搜索平台解决方案,可能会移植到互联网搜索引擎服务中,以提高搜索引擎的信息智能处理能力。

还有一个趋势值得关注,这就是搜索引擎的服务位置将发生变化。搜索不仅会延续现在的服务形式,而且会出现在更多的商业环节之中,尤其是嵌入式的搜索、关联搜索等将呈现快速发展态势。无论是基于互联网的服务,还是基于企业内部的各类服务,都会采用相应的搜索技术。搜索服务的后移,是搜索向基础服务转变的标志之一。

那么,搜索引擎技术将如何应用在传统报业?传统报业又能从搜索引擎技术和服务中得到什么?

传统媒体和新媒体之间的一个明显区别就是其内容的丰富程度及覆盖的范围。即便一个报业的网站将自己定位于提供地方新闻和服务,也无法按照传统的媒体生产方式来生产运营。新媒体的一个特点就是具有丰富的内容,用户可以自由选择内容,而不会像从前那样,只能从几版、几十版的内容中选择。为了丰富内容,报业网站就需要通过网络抓取、内容合作、社会化采集等手段,从更大的时空范围采集信息。无论是信息的采集还是信息的处理,均需要搜索引擎这样的技术。

同样,传统的报业生产也要基于内容的自动采集与分析能力。一是报业自身的内容资产逐年增加,存贮在数据库、编辑系统等系统中的大量内容,需要一个管理平台和手段。二是内容生产需要的大量“原材料”内容,包括新闻线索、专题背景资料等,这些都需要实时的跟踪与采集。报业日趋激烈的竞争,也要求任何一家报业集团,都不能忽略对报业同行的跟踪与研究。同城报纸、同类报纸对比分析,热点新闻的发现与跟踪,都是必须基于大量的内容采集与分析才能够实现的

由此可见,无论是从报业传统的报纸编辑出版,还是从新媒体的生产运营,都要依赖于海量的内容处理与运用。一是基于海量的内容,跟踪、分析与提取新闻热点,比如,通过各类采集技术和服务,实时跟踪各类新媒体和传统媒体的动态,包括电视台、广播电台、报纸和各类网站;二是基于海量的内容分析提取各类专题资料,作为编辑参考,比如,当一个记者或编辑需要有关房地产专题时,就可以通过对历史资料的整理,自动生成房产专题,而无需人工整理和制作。其内容既可以按时间顺序显示,也可以按内容主题分类显示;三是基于海量的内容,增强报业的内容自动生产能力,比如,基于网站的一般新闻专题,就可以依赖自动分类与聚类技术,自动生成。四是基于海量的内容,可以增强报业的个性化服务能力。基于内容的自动关联技术,可以较好地实现个性化的新闻推送服务。

目前,传媒行业对搜索引擎存在一定的误读,很多人认为搜索引擎就是“网络爬虫”加上全文检索。其实不然,搜索引擎的核心技术是对内容的综合处理能力,包括搜索、采集、分类、关联、排序等。比如,利用搜索引擎的自动分类和自动关联技术,就可以有效地拓展搜索结果的展示方式,便于用户对搜索结果的快速筛选,提高搜索效率。

搜索引擎不应只用作单一的搜索工具,而应该发挥其平台的能力和作用。基于搜索引擎技术,不仅可以改进报业内部的内容整合能力和搜索能力,而且可以利用这个平台和技术,构建基于互联网和海量信息的新闻跟踪与分析系统,也可以利用搜索引擎,增强内部资料库的服务能力,还可以构建基于海量内容的自动发布系统等等。正确地理解并创新地应用搜索引擎技术,是非常重要的。引入搜索引擎技术,不是简单地构建一个搜索平台,提供一个优秀的搜索工具,而是利用搜索引擎技术,改进现有业务系统的内容处理能力,提升现有业务系统的生产能力,同时改变传媒机构的内容资产管理方式与对外服务模式。

 
 
版权所有:北京紫光新华技术开发有限公司 | 保密声明 | 使用本网站表示您同意它的条款