• 语义搜索:数字出版的突破?

    生活 > | Time Weekly - 2011-08-25 01:39:50
  • 孩子们津津有味地用电子阅读器,数字出版有着广阔的空间。 / 本报记者 姬东 摄

    本报记者 张子宇 发自广州

    2011年8月22日,南国书香节现场,广州华阅数码科技公司和汕头大学出版社签订战略合作协议。由于合作涉及新的数字版阅读平台、意义搜索等内容,这对于方兴未艾的中国数字出版市场来说,可能带来的影响值得关注。加上这次合作还拥有一定的官方背景,广东省新闻出版局、广东数字出版产业联合会都给予了支持。

    “数字出版本身是广东的强项,我们一直立足于成为这方面的全国标兵。”广东省新闻出版局数字出版管理处处长、广东数字出版产业联合会执行副会长苏毅接受时代周报记者采访时难掩雄心。实际上,早在2010年,苏毅就曾表示,成立广东省数字出版产业联合会是要进一步加强数字出版产业链上中下游的战略合作。华阅数码和汕头大学出版社的合作无疑是其中的重要一步。

    前景在于内容技术并济

    广东数字出版产业起步较早,2008年全国数字出版总收入530亿元,其中广东占100亿元;2009年全国预计达750亿元,广东占150亿元。在去年第三届中国数字出版博览会上,广东是获奖最多的省份,并囊括了业界公认难度最大的“创新技术奖”过半奖项。苏毅所在的科技与数字出版处也是全国在这个方面的首创。

    “而2011年全国数字出版产值将高达1000亿元。”汕头大学出版社社长胡开祥认为市场前景非常可观。华阅数码有两款数字阅读平台“读览天下”以及中文名为“扎克”的ZAKER,而汕大出版社则拥有语义搜索技术的优势。其中,“读览天下”除了iPad外,还支持安卓、Kindle、汉王、索尼等的阅读器,用户可以通过这个平台下载各种合法出版物,目前已加盟的有1500种杂志、30000本图书和上百家不同出版社。

    2010年12月,“读览天下”推出基于iPad操作系统的免费阅读软件ZAKER。这款软件支持用户个性化信息搜索,能将互联网资讯、报纸杂志等和微博联系到一起并自动抓取到用户的平板电脑上,再重新排版成类似电子杂志的形态。用户还可以转发或评论内容至微博。 不过,与会人士也承认,目前国内的数字化阅读产业发展还仅限于把书报刊的内容简单转为电子载体适用的形式,也就是内容没有变化,仅做技术上的调整。“往往手机和互联网的固有特性被忽略。”华阅数码CEO陈迟认为。对此,胡开祥也表示“数字化出版和阅读的最后赢家永远是内容出版社,如著名的汤姆森公司”。苏毅则认为:“数字出版前15年的发展过程中,一直都是技术为王,只有内容和技术共同拉动,才能真正发展。”

    语义搜索的突破

    正在受到关注的语义搜索技术,可能成为带动内容突破的重要因素。对于大部分用户来说,语义搜索依然陌生,这项技术正是一些IT巨头密切关注的新战场。曾经的王者、被苹果和谷歌抢去风头的微软,已经在语义搜索这个方面抢得了一些先机—微软此前推出了新一代搜索引擎Bing(必应)。

    所谓语义搜索,通俗地解释,就是搜索引擎需要越来越懂用户的意图,抓取用户最想知道的网页内容—除了文本,还有图片、视频等多媒体内容。

    “我们把必应称为‘决策引擎’,因为其用途特点在于能够智能分析搜索目标。”微软中国公关总监王岩对时代周报记者表示。“传统的搜索是以关键词为核心的,而语义搜索则是围绕主题词展开。所以搜索结果并一定因为文本里出现了最多搜索词,而是根据主题意思展开的。”胡开祥解释。在目前的搜索引擎市场里,谷歌遵循的是一条“客观主义”的搜索路线,也就是不问评价者和用户之间的关系,只根据内容所在网页的技术权重进行筛选。而微软选择的语义搜索考虑人际关系,把用户值得信任的人发布的信息在搜索结果中排序靠前。这已经有把“社交网络”和“搜索引擎”混在一起的味道了。微软早在2008年就购买了语义搜索引擎Powerset,开始在这个市场布局。

    某种程度上,对语义搜索的争夺将逐渐使目前的国际搜索引擎市场白热化。2010年年底,调研机构comScore公布了美国搜索引擎当年11月的市场份额,谷歌依然是老大,微软的bing还是排在雅虎之后做老三,市场份额为11.8%,但相对于谷歌和雅虎的略微下滑各0.1%,bing则有0.3%的小幅增长。

    中国搜索引擎霸主百度也在10个月前推出“框计算”战略,百度首席执行官李彦宏的宏伟构想是,通过语义分析预知用户需求,比如说,当你输入“5万美元”时,将被带到一个汇率换算网站;当输入“北京上海”时,将出现一个航班清单—这些内容都将显示在结果页的一个方框中。

    语义搜索与数字出版

    抛开这些跨国公司的争夺,对于数字出版行业来说,语义搜索技术是他们利用技术使内容升级的一个希望。

    “通过语义搜索技术,我们可以对目前的微博内容进行梳理。”胡开祥进一步解释,“大家都喜欢看微博,但是无效信息很多。比如我们想看经济学家的经济观点,不想看到他的私生活,这时候语义搜索可以对微博内容进行筛选,把我们需要的内容分门别类归好”。

    同样,用这个技术进行书本整理,也是盈利的重要手段。传统的书本搜索只是将关键词的位置搜索出来,语义搜索技术,可以从字词句、篇章、语用和逻辑三个层面将文章的内涵分解出可以识别的结构性信息“碎片”,然后以“百科阅读”、主题阅读等形式呈现出来。

    “我们对一本20万字的书进行整合梳理,如果收1000元的费用,那么市场前景就相当广泛。要知道,全国一年出版的书籍超过20万种。”胡开祥这样展望。

相关文章: 更多关于语义搜索 数字出版 的报道

  • ·语义搜索:数字出版的突破?(2011-08-25)
  • ·数字出版 广东弄潮(2009-08-26)
  • ·广东数字出版基地动工(2009-12-31)
  • ·专访“文著协”副总干事:我们不会成为第二个“牙防组”(2010-01-20)
  • ·盗版还是所有人的烦心事(2012-09-20)
  • ·休·豪伊:数字出版英雄的2012战绩(2013-11-14)
  • 这里是黑龙江省鸡西市,一座与俄罗斯接壤的东北小城。浓烟发出的位置正是这座城市的火电厂所在地,这里距离市中心只有一公里左右。

    马云背后的“女神”终于走上前台,这位叫彭蕾的女人手上握有马云真正的王牌——她执掌阿里巴巴庞大的金融帝国浙江蚂蚁小微金融服务集团。

    在经历了火热的招商扩张之后,韩束自称已拥有10万人的微商代理团队。

    岁末年初,中国社会保障体系改革引入新话题:刚刚闭幕的中央经济工作会议表示,“降低社会保险费,研究精简归并‘五险一金’”,将成为2016年降低企业成本的重要突破口。

    北京户籍管理制度越来越严苛,但这扇门似乎并未严丝合缝。据记者了解,假结婚成了另一个进入北京的手段。

    中科院此次改革会大幅提升部分科研人员的薪资待遇,减少对项目经费的依赖度,鼓励科学家在鲜有关注的重大科学问题上开展合作。

    悬梁自尽,投资者用最极端方式要回了自己的血汗钱。大业担保,这家曾获舞钢市政府领导站台的投资公司,一度在当地融得1.5亿元巨资,却终究未能逃脱此前已屡屡在神州大地上演的民间集

    2015年12月25日,历经800余天筹备,由中国倡议、57国共同筹建的亚洲基础设施投资银行正式成立。

    2015年12月20日,在“万宝之争”硝烟尚未散去的时候,作为万科董事会主席,王石承认自己在万科的股权治理缺陷方面负有不可推卸的责任,他希望获得所有股东的支持。

    要不是事先留意,很难发现深圳北郊笔架山的银湖景区内,坐落着一家全国知名的社会智库。