薛学彦:数字出版环境中内容如何为王?
作者:薛学彦 时间:2012年05月29日 来源:百道网·薛学彦专栏
订阅《新出版日报》 分享到微博:收藏
(1)条评论
(点击图片 进入论坛)
【
百道网薛学彦专栏】
计算机对人类的贡献之一就是“标记语言”的出现。标记语言是程序能够理解的一组符号和规范,它给内容数字化提供一种方法,提供一种技术保障。
“内容为王”是出版人高度关注的一个概念,我们究竟应该如何把此概念放置在数字出版环境中去思考呢?
较早时候,本人在 iPad 的商店搜索软件时,偶然发现国内某大 IT巨头开发的一款基于其文库的一个应用软件。下载安装后发现,这款应用软件无异于垃圾。准确地说,应该是软件推送的内容无异于垃圾。
这是一个非常典型的“内容”案例。
文库虽然具有“量”,甚至到了一种 TNT 级别,是有“内容”了,但是,我们能说这就是“王”了吗?
否也。
对人们的眼球来讲,这些内容实在让人欣喜不已;可对计算机来讲,能够被识别的仅仅是背后的库架构:某个文档属于“英语学习”,某文档属于“法律”,而在这种框架下进行搜索,也只能进行大家熟知的文本搜索,结果可想而知。
如何有效地从文本中提取信息,是语言学界和计算机界都普遍重视的话题,虽然人们取得可喜的研究成果,但文本搜索的结果还不能尽如人意。
和传统出版一样,“数字出版”某种程度上也是一种标准化过程,这不仅体现在某个尺寸的页面、某个字号的内容、某个样式的标题,更重要的向读者推送准确的内容,推送人们需要的信息。
所以,数字出版界“内容为王”的概念应该被赋予一种新的含义:即无论出版社纸质的内容有多少,只有其被加工后变成了计算机可以识别的内容,那么这个内容才真正是可以称之为“王”,加工的粒度无论有多细小都不为过。谁家拥有更多被加工的内容,谁就可以是数字出版界的“大王”。是否能够在数字出版领域成为大王,和出版社大小没关系,只和决策者的工作重心和对数字出版的重视程度有关系。
计算机对人类的贡献之一就是“标记语言”的出现。标记语言是程序能够理解的一组符号和规范,它给内容数字化提供一种方法,提供一种技术保障。上个世纪八十年代,中国出现的让出版告别“铅与火”的“华光排版语言”就是一种标记语言,就是它才使数字内容变成纸上一种具有形式意义的东西。
对于数字出版来讲,无论是新作品新内容的数字化还是传统纸质内容的数字化,内容加工工作都应该是第一位的。根据自己的内容建立一种工作标准,对内容进行加工,建立数据库,数字出版才有光明的未来。
(作者薛学彦从 1990 年开始使用计算机,一直致力于在计算机和英语教学之间架起一座桥梁。1995 年完成和出版相关的词汇筛选工具,1998 年底开始制作个人网站并持续至今,2003 年开始正式介入数字出版行业。)
(点击图片 进入论坛)
点击图片 查看详情
点击图片 查看详情