文章摘要:在我社“十二五”规划中,搭建全社统一的数字资源管理与推送平台是重点项目之一。自2012年初我社成立项目组以来,项目组对社内相关部门及技术厂商展开了详细的前期调研,并于年底完成公开招标,预计2013年10月完成第一期建设工作。本文旨在介绍该项目总体目标、规划和实施内容,并对项目实施过程中所面临的问题做出分析并提出建议。
关键词:数字资源管理资源建设
在我社“十二五”规划中,搭建全社统一的数字资源管理与推送平台(以下简称“资源管理平台”),是我社“十二五”规划重点项目之一,也是我社发展数字出版工作的基础工程。之所以说是基础工程,是因为数字内容资源是数字出版的重要战略资源,数字出版工作的开展,是以数字内容资源的选择加工为基础的;其次,目前我社虽存在文字、音频、视频等数字内容资源,但是数字化水平不高、标准不一、存储分散,不利于资源的综合利用和统一管理。2012年,该项目获得了2000万元的宣传文化发展资金财政支持,同时,该项目也是2012年新闻出版总署“新闻出版改革发展项目库”我社唯一入库项目。
笔者自2012年起在数字出版部工作,先后参与项目前期调研及正在进行的项目建设实施工作。本文旨在介绍该项目总体目标、规划和实施内容,并对项目实施过程中所面临的问题做出分析并提出建议。
一、 项目组织实施情况概述
在社领导的领导下,我社于2012年初成立资源管理平台项目小组(以下简称“项目组”),项目组由数字出版部牵头,组成部门为资产与投资管理部、信息技术部、总编室、科研部、版权部、教材中心、聚珍公司、电音社、数字公司等相关部门。从2012年3月至10月,项目组对社内现有资源以及应用系统情况分别进行了详细的调研,并与多家服务厂商进行技术交流,对国内外相关平台类产品展开选型工作。2012年10月,由资产与投资管理部牵头成立招标小组,于年底顺利完成了项目建设的硬件和软件政府采购招标工作。2013年3月,软件中标企业配备了专职项目组来我社进行调研,目前项目建设工作正在稳步快速推进,预计2013年10月完成一期工程。
二、我社现有业务系统和资源状况现状分析
1.现有业务相关系统及平台
在数字化基础架构方面,我社早在1996年就建立了信息管理系统,基本实现了编、印、发等环节管理的数字化,但信息技术的发展日新月异,相关系统和设备已不能适应现代数字出版的要求。
在数字化资源建设方面,我社不仅有当前使用的基础教育全学科教材,同时本社图书馆还保存了从清朝末年开始的大量中小学教材。自2003年始,初步建成数字资产管理系统并且现在仍然在图书馆运行;从2001年起步实施电子文档光盘专岗管理,到2007年开始试验远程传版项目,再到现在的“电子胶片”“电子样书”“电子样稿”一系列数字出版工作相继实施推广,为我社数字出版资源建设打下了一个好的基础;自2010年开始,利用积累的大量数字化音频、视频教学资源,电音社建立了媒体资源管理系统,该系统以中科大洋iMAM2媒资技术为核心,依托局域网络,对音像及多媒体产品进行高度整合与集成化的声、像、图、文资料存储管理,全面兼容多种数字资源格式,从一定程度上基本解决了电音社出版物和数字资源的数字化管理问题。
2.资源类型及分布
如图1所示,现已知社内存在37个系统的格式文件,其中包括Word文件、方正书版排版文件(大样文件、小样文件),CEB文件(排版文件直接转换的、双层扫描识别的),PDF文件,封面设计文件,全文检索光盘文件,VCD、DVD光盘视频文件,教学课件及光盘模拟实验小程序等。稿件来源类型主要是Word格式,封面设计稿件主要文件来源是Jpg、Tiff、Eps、Pdf、indd等。
部门 |
现有何种资源 |
资源种类及数量 |
各类资源现容量 |
预计资源年增长率 |
科研部 |
线装古籍 |
约40000册 |
无 |
|
民国图书 |
约40000册 |
无 |
||
外社中小学教科书 |
约75000册 |
15% |
||
本社版本 |
约110000册(有复本) |
5% |
||
非书资料(音像资料) |
379种(3000余件) |
较少 |
||
教学资源室 |
教辅及地方教材2500余种,以非数字为主 |
视频、动画、音频(磁带、光盘) 课程标准情景要素教学资源库(物理、化学、生物)12张光盘 |
物理、化学、生物视频、动画光盘各4张,录音磁带几十盘, |
|
物理室 |
数字/非数字 |
视频、音频、图书资料等。总量约1T |
会议视频音频、讲座视频音频、教材教辅用照片、word资料等 |
|
出版部 |
纸质 |
校样:4600份 |
可以参考总编室新书选题数量。 |
|
型版 |
胶片:约5000套 |
|||
数字 |
光盘:10350张 |
|||
信息技术部 |
发稿品种内容图文文件 |
100个/发稿期 |
单品种文:2M |
发稿期增长率 |
聚珍 |
校样高精度PDF |
500个/季 *4 |
每个品种大约600M |
年新品种增长率 |
|
500个/季 *4 |
每个品种大约50M,总数约100G |
年新品种增长率 |
|
封面印刷精度PDF |
5161个 |
每个品种大约10M |
年新品种增长率 |
|
封面低精度PDF |
1443个 |
每个品种大约1M |
年新品种增长率 |
|
封面JPG |
4779个 |
每个品种大约1M |
年新品种增长率 |
|
正文印刷精度PDF文件(300DPI) |
1595 |
每个品种大约600M,总数约960G |
年新品种增长率 |
|
电子样书低精度PDF文件(96DPI) |
803个 |
每个品种大约50M,总数约5G |
年新品种增长率 |
|
正文高显精度PDF文件(260DPI) |
200个 |
每个品种大约500M,总数约100G |
年新品种增长率 |
|
音码 |
50个 |
每个品种大约6G |
年新品种增长率 |
|
最终版式原文件 |
每年封面与正文 总数之和 |
每个正文品种 |
年新品种增长率 |
|
XML |
历年新增入库条目数与原图数总和,修改数不计 |
每个正文品种 |
年新品种增长率 |
|
电音社 |
电音社出版的各类产品中的基本内容和原始素材资源 |
视频、音频、多媒体课件为主 |
视频:35T |
3~5T |
图1 社内现有资源种类及所占容量(截止至2012年8月)
3.项目现状分析
经调研发现,我社建设立体化数字资源库所需的文字、音频、视频等基础基本存在,但形成一个有利于资源综合利用、统一管理的资源平台要面临如下几大问题:
(1)我社现有资源数字化水平不高、标准不一、资源数据类型复杂、管理分散、存储分散,对于形成一个统一的数字资源库来说聚合难度大;
(2)我社资源建设经验较少,资源标准与规范尚未统一;
(3)部分资源(例如图片类资源)的版权信息不完整;
(4)资源的使用规范、管理流程以及计费方式尚待进一步研究;
(5)各主要应用系统如ERP、数字出版平台等尚未建立,系统选型和技术标准都未明确。
三、项目建设目标及规划
资源管理平台项目规模庞大,涉及部门及业务多,未来业务相对不明确,项目组根据对社内调研结果,依据项目的建设目标并结合我社的实际情况,按照 “整体设计、分布实施、考虑现实、着眼未来”的指导思想,决定将项目按照以下内容分两期逐步建设,本次建设为一期工程。
项目一期主要建设资源采集系统、资源管理平台及部分资源应用系统,建立现有数字资源的标准化规范;实现对现有资源的采集、标引、导入;实现资源管理平台与现有应用系统的无缝对接;实现资源的上传、导入、查询、下载、修改等基本功能;实现资源的分级管理、使用统计等功能,并结合实际情况探讨制定资源碎片化的合理方案。
项目二期将主要实施资源碎片化;根据资源管理流程对资源的流转进行有效管理、统计、计费;与ERP系统、数字出版平台、人教网综合服务平台等实现无缝对接,并根据社内其他应用系统以及工作流程的建设情况实现定制化服务;在积累一定优质资源后,实现资源成品打包和多渠道分发服务(即推送功能)。
四、项目一期建设主要内容
1.该平台是中文可视化图形界面管理,让用户可以很方便的使用浏览、搜索等功能(本系统只供社内使用,不对外公开);
2.建立电子样书库,对我社近年来图书、刊物,以及外购图书资源进行低精度转码并按章节拆分,对社内人员开放在线浏览功能,并可按章节查找所需内容;
3.在不影响各部门现有业务的前提下,实现资源平台与我社社内现有平台(方正畅流系统、媒资管理系统等)无缝对接,将现有资源导入新平台;
4.教材中心光盘库目前为止存有我社12000余册图书源文件,其物理光盘数量超过30000张(每册书的排版源文件分为正文和封面,刻录在2-3张光盘里)。除现有库房面积已不能满足我社出版的需求外,将来物理光盘的寿命很可能会导致源文件的破损甚至丢失等问题逐渐涌现出来。建立排版源文件库,将现有物理光盘库中源文件、电子胶片文件、文件相关信息等逐步导入,利用资源生命周期管理功能,使排版源文件的上传、下载、信息查询等功能完全在线上操作,这样不仅能够安全的保存源文件,更对我社出版部门业务及工作流程数字化奠定了基础;
5.在资源上传时强制添加版权信息,版权模糊或无版权资源入库时要注明清楚使用权限,用户在浏览相关资源时系统要提示版权信息。这样不仅为今后建设版权保护系统做好了铺垫,也能间接加强我社员工对版权保护的意识;
6.资源管理平台附有流程管理和统计分析功能,在我社数字资源相关管理制度健全后,逐步开放资源下载、线上审批功能,并且针对各部门之间资源的使用设置统计功能;
7.建立资源分享库,我社员工可以将自己的摄影作品、文章等上传分享。这样不仅能丰富资源,使资源多样化,更能调动员工对该平台使用的积极性(但需要建立资源审查制度,以保证资源的正确性和著作权等问题);
8.结合我社实际情况探讨制定资源碎片化合理方案,并开发碎片化工具。
五、项目实施过程中遇到的问题及建议
1.建立符合我社教育出版特点的碎片化标准
单独一本图书的数字资源可以数字化复制,但在新的数字产品开发中的复用性不强;按知识点形式存在的碎片化数字资源在数字产品开发中复用性强,但其碎片化标准制定的难度是很大的。近年来虽有多家出版集团和出版社建立起资源管理平台,并对资源进行简单的碎片化,但其碎片化内容多是将图书进行简单的章节拆分。
我社以出版全学科教材教辅为主,单纯对图书以章节划分碎片对今后的工作来说是体现不出价值的。制定一套符合知识体系特点的碎片化标准,需要组织学科编辑和专家,针对不同学科的特点来开展工作。如果不深入到知识体系中去,碎的太细或者太粗,对今后使用来说都没有意义。标准的制定如果从全学科开始入手的话,从现有的人员配置是不太现实的。如果根据实际情况制定规划,例如先从文科和理科中各选1-2门课程着手尝试,形成了相对完整的标准和一定经验后再对其他学科逐步开展碎片化标准研制工作的话,效果可能会更好。
2.完善社内资源管理规章制度
我社现有有关数字资源管理的规章制度只有2008年发布的《人民教育出版社图书基础数字资源管理办法(试行)》,并且社内没有音视频等其他资源的相关管理办法。随着我社数字出版工作的开展,该办法已不能满足现有业务需求,需要相关部门重新制定新的管理规章制度,形成完整的资源申请审批、资源使用、内容审核的管理流程。只有建立完善的管理流程,才能实现我社资源的规范化统一管理。
3.资源建设相关人员不足
随着资源平台调研过程的不断深入,越发体现出需要成立专门数字资源建设(管理)部门的重要性。随着资源碎片化标准的建立,仅仅将现有资源碎片化拆分入库这一项工作就需要大量的人员来进行标引标注。因为学科专业性强,在没有学科编辑的指导下,仅依靠社外数据加工外包公司来做,资源标注的准确性完全不能得到保证。同时,随着大量资源的上传,也需要专门的部门来对这些资源进行内容审核、管理等工作。
资源管理平台项目一期建设工作于2013年2月正式开始,到截稿为止中标公司的调研团队已在我社调研近1个月,预计10月底完成一期工程并开始试运行。从2012年初成立项目组以来,该项目得到了社领导、资产与投资管理部、信息技术部、总编室、科研部、版权部、教材中心、聚珍公司、电音社、数字公司等相关部门的领导和同仁的大力支持。资源管理平台的建设是一个长期的过程,仅是建设好资源平台并不是目标,最广泛的聚集大量优质资源才能为我社数字出版工作奠定坚实的基础,这需要我社全体员工共同努力才能完成。
主要参考文献:
[1]陈洁:《出版社数字内容管理平台的构架与实施》,《科技与出版》2009年01期
[2]董言笑,周澍民:《出版社内容资源数字化管理及应用》,《青年记者》2010年30期
[3]王运武:《我国数字化教育资源现状及发展策略》,《中国教育信息化》2008年01期