尊敬的各位领导、各位嘉宾上午好!大家知道同方知网在去年整合自身技术和资源优势研发了云出版平台,这个平台截止目前初见成效,在相关的技术产品、运营模式上得到了初步应用。今天我跟大家交流的题目是《基于知识库的动态出版》。今天的报告分为三个部分。
如今信息服务正在发生着历史性的变化,从基于传统书报刊等载体的服务转变为基于内容的服务,并正走向知识服务,这一转变主要取决于市场需求,市场需求以后将会对传统出版产生深刻的影响。实际上我们做服务来说,市场的需求就是用户的需求。我们一起看一下用户发生了哪些需求上的变化。
第一,个性化。用户要求获取个性化、专业化、一站式、垂直化的信息服务,要求信息化提供机构以人为本,从按信息服务机构组织的业务流程转向按用户行为过程组织的业务流程。
第二,及时化。用户要求服务到桌面、进现场。
第三,协同化。用户与用户、出版社之间有密切的交流,同行专家协同工作,能够进行远程科学研讨、教学等等方面,大家可以通过其获取很多隐性知识。
第四,知识化。大规模图书文献集合中蕴藏着大量的尚未发现的知识内容。
总体而言,用户关注的不再是简单的文献、知识获取,而是关注如何从复杂的信息环境当中吸取解决所面临问题的信息内容,并将这些信息动态重组为相应的解决方案。
图书情报界在知识服务方面也做了一些努力,比如资源发现、资源整合、知识揭示、知识组织。但是也有一些做的不好的地方,原因比如说数据基础不好、信息内容无序、非结构化难以重组使用。出版社是商业的内容生产制造商,源头上解决这个问题,出版社要积极参与。怎么参与呢?下面我们就探讨一下。
现在最好的方法就是基于动态出版。现在出版社出版的电子物都是非结构化或半结构化,不能满足再次重组利用以及多形态、多渠道、全媒体发布的需要。动态出版包括XML结构化加工、内容碎片化等等。
我们出版社要做动态出版的原因也是基于用户需求发生的转变。动态出版的优势,比如说实现了资源多次增值、快速增值等等。所以动态出版是数字出版发展方向之一,特别是对于专业出版社。
下面就看一下动态出版的相关技术和实现步骤。
第一个就是出版资源的数字化和内容的碎片化。我们遴选出版有价值的图书制作成XML数据,自动根据业务规则进行碎片化切割、形成可重复使用的内容单元,用XML技术将内容按统一的文档结构定义。还有就是内容管理的管理流程化、自动化。基于工作流引擎协同编撰,进行图书出版。再一个就是出版媒介和形式多样化,通过XML技术,实现样式和内容的分离。
碎片化核心就是要做动态重组。碎片化的关键,就是在“知识云”库的建设。它包含了创新点、概念、数值、图表、观点、图片等等知识元。我们认为碎片化的内容到“知识元”是比较合适的,基于知识库可以做知识索引等等,这些统一构成的知识元。
目前相对比较成熟的是基于半自动的知识元库的构建。利用知识元抽取工具,自动从图书期刊当中抽取各类知识元,同时适当配合专家审核,形成标准、内容充实、形式多样的知识元库,方便为大众提供服务。
下面是知识元库构建技术。包括知识元抽取挖掘技术、知识关联技术、多形态知识元转换技术、知识元唯一标识管理技术、XML数据库技术、知识的动态重组技术、跨媒体知识检索技术。下面我给大家介绍一些我们所做的案例。
同方知网一直在做资源整合和知识挖掘服务。我们自己也有一个定位,以知识与信息服务为市场导向,发展数字出版产业。目前同方知网基础用户达到了19000余家。我们也做了基于文献级的动态重组。围绕一篇文献可以发现它的引申文献、相似文献、读者推荐文献,使研究者通过其了解更多深层的知识。现在我们这个节点已经做到了三级。另外文献级动态重组最核心的方面就是基于文献的分组,在数据海洋知识仓库里可以按照学科类型、作者、主题词等等对其进行分组,这样方便更好、更准确的获得想要的知识。同时在知识元级别上我们也做了重组,首先是研发技术,我们成功研发了基于知识元的抽取系统,目前也比较成熟。而且今年8月份即将发布一个新的产品。还有就是知识元库建设工作方面,像理论型、事实型知识元约5亿多条。
同时我们构建了一个《商务工具书数据库系统》。比如说“红”这个字,通过这个节点可以检索字,可以发现它的同音字等等很多知识。都可以相应的推荐出来。另外也集成了多部工具书的示义。这也是最好的基于知识元库的、动态重组增值服务的例证。
我们也提供了腾云数字出版整体解决方案。
CIKI数字出版解决方案紧紧围绕内容加工、资源组织、个性化增值服务等核心点设计,为出版机构提供“技术门槛低、易上手、见效快”的技术解决方案。
这是我们所积累的一些核心技术。
同方知网也与出版社开展多层面的合作。我们帮出版社做了一些有价值有意义的技术服务。
另外我们还提供市场营销,包括资源委托代理、合作运营、收益分成等等模式。
下面就是数据加工、排版印刷。
最后希望与各界同仁一起努力,把我国数字出版产业做大、做强。谢谢大家!
来源:中国图书出版网