【百道网薛学彦专栏】数字出版中的“交互”是核心问题,否则,我们可以遵照 HTML。要解决交互,就一定要建立基于 XML 规范的标签集,而仅有标签集还不够,要需要有一套程序去解析标签集,这个道理和 HTML 一定要有浏览器去解析一样。
出版人最关注的问题是标准。在传统出版业,背题、断字、版心大小、行距等都依照一套规范走,编辑工作的一部分精力也花到这些标准化工作上。
数字出版仍然要依照一套标准,一套可以将内容准确推送到用户设备上的规范(specifications)。
如何理解和执行一套标准呢?是否每个出版人都要依据同一套世界标准呢?哪套标准才是世界标准呢?
标准就是规范、就是框架,是数字出版工作赖以存在的技术环境和条件。所以,标准也是炽热的数字出版工作前期大家讨论得最多的话题。
本文讨论的标准不同于环境。所谓环境,是一个生存空间,这个空间中的个体可能都有自己的特征。就计算机环境而言,DOS/WINDOWS/LINUX 等属于磁盘操作环境,JAVA 等则是相关计算机程序存在的环境。
较早和出版相关的一套规范莫过于 TEI 了,它是在标记语言诞生初期由学术机构建立的内容描述方法(http://en.wikipedia.org/wiki/Text_Encoding_Initiative)。但经历了几十年发展历史的 TEI,今天仍然不可以成为世界出版界内容描述惟一标准。
和 TEI 相比,HTML 则是一套相对简单并有程序(浏览器)支撑的内容描述规范。因为有程序支撑,当它和 WWW 概念联姻后,立即成为了世界互联网的一套规范。
但是 TEI/HTML 这类规范缺乏交互特征,标签集也相对固定,所以,这些标准给今天的教育数字出版带来麻烦。也因此,美国出现了 SCORM(http://scorm.com/)、QTI(http://www.imsglobal.org/)这样具有交互特征描述、基于 XML 的标签集。其实,当我们说 “SCORM/QTI 标准”的时候,并不是说它们象 HTML/XML 那样是世界标准,因为它们并不是世界标准,只是业界的一种做法。
数字出版中的“交互”是核心问题,否则,我们可以遵照 HTML。要解决交互,就一定要建立基于 XML 规范的标签集,而仅有标签集还不够,要需要有一套程序去解析标签集,这个道理和 HTML 一定要有浏览器去解析一样。
那么,解决这个问题是否一定要遵照 SCORM/QTI 等规范呢?
不一定。
任何一个规范都不可能满足所有用户的需求,规范中的内容也不一定是用户需要的,象 TEI 规范中对十四行诗的描述方法。即使象 HTML 这样标准化程度较高的产品,仍然有这样那样的问题。
假如一定要使用某个规范,好处之一是自己不需要花力气去建立这些规范,好处之二是一个公司可以直接(即不通过第三方程序)和另外一个公司进行数据交换。但接下来问题多多。致命问题是自己必须依赖这个规范,并一定要随着规范的升级而升级,也可能会随着规范的灭亡而灭亡。理解和消化这些规范是另一个问题,TEI 的说明文档长达几千页。是否能够高效地进行内容加工则是另一个必须考虑的问题,这个问题较早时(
http://www.bookdao.com/article/41015/)讨论过,这里不赘述。产品购买和维护费用也是一个非常突出的问题(免费的除外)。等等。
从内容描述的角度讲,数字出版业没有一个全世界都必须执行的标准,每个出版人也不一定都要盯着外国的“月亮”。象 HTML 和浏览器的关系,所谓标准无非是一套标签集外加解析这套标签集的程序。在时间就是金钱、效率就是市场的数字出版时代,一个团队根据自己的内容制订自己的标签集,进行高效(
http://www.bookdao.com/article/41015/)的内容加工可能还是首要的选择方法。毕竟,自己做的饭菜可能最合自己的口味。