【
百道网薛学彦专栏】
外语教育数字出版还应该重视“学习者数据库建设”,包括学习者语言输出结果数据库(即“学习者语料库”),因为学习者数据库可以为外语教学提供重要的语言信息,可以通过进行错误分析指导下一轮教学大纲制订、指导教师的教学、指导教材编写等。
当大家在炽热的数字出版火堆旁边徘徊时,诸多出版社没有忘记教育数字出版这块最有商业利润的市场。
的确,中国这个人口大国确实孕育着一个大的教育市场,信息爆炸及出版模式的变革肯定影响到教育产品的制造和研发。
一、教育数字出版的概念
首先,应该区分“教育数字出版”和“数字出版”两个概念,教育数字出版拥有更狭窄的含义,即数字出版应该是针对“教育”这一目的,应该和普通数字出版有区别,所有和普通数字出版相关的模式也不一定完全符合教育数字出版。
数字出版的“教育”性质决定数字内容的“分类”、“级别”和“有针对性”等特点,将教育数字出版和炽手的普通数字出版混为一谈,后果非常可怕。
社会化阅读不需要出版人过细地区分内容,新闻、小说等分类基本可以满足阅读人群的需求,但教育数字出版则不可以。例如,基础阶段的外语教育就应该把语法现象在不同时间推送给不同学生,否则,学生将不清楚某些语言现象的含义和其在语言中的使用;数学中的函数概念也不可以在小学的数学课本中出现。等等。所以,无论从模式、数据库建设等方面,出版人都应该区分教育数字出版和普通意义上的数字出版。
数字教育出版更应该是内容精细加工的过程。
二、教育数字出版中的等级信息建设
和普通元信息建设的重要性一样,教育数字出版中的等级信息建设非常重要,是不可越过的元信息建设。只有对各个数字元素的等级信息描述清楚,元素才对数字教育起作用,否则,数据将成为垃圾。
等级信息包括知识点、级别等,依据软件环境不同,可能还有其它一些信息,总之,象业界所讨论的,信息定义应该越细越好。
近几十年,随着计算机的普及和软件的发展,语言类等级信息建设有着得天独厚的条件,计算语言学、语料库语言学等使语言类信息建设细化到“字词”层面,不仅如此,人们还开始对语义等高难度语言信息建设进行研究。
就外语教育数字资源建设来讲,基础数据库从原始数据采集到入库,程序至少可以自动做到段落标记、句子标记、词性标记,根据词性标记,程序还可以进行句法标记。
应该注意的是,自动标记的准确度不可能是百分百,而数字教育则要求信息加工达到百分百的精确度。所以,对于海量数字资源建设来讲,数据加工过程中的人工的参与也是重要环节。
等级信息建设是准确信息推送的基础和关键,也是耗时耗力的工作。重视该工作势必能够赢得教育数字出版的金砖。
三、外语教育数字出版资源建设的关键
外语教育数字出版的资源建设应该包括底层基础库建设、中间的“中间数据库”建设,然后将数字资源推送给学习者。
基础数据库是包括粒度很细的语言信息的数据库,诸如词性层面的句法、词性,篇章层面的难度、主题,用于测试的试题的难度系数、区分度、级别等信息。这些基础数据库是数字出版的灵魂,是核心的东西。
除此之外,外语教育数字出版还应该重视“学习者数据库建设”,包括学习者语言输出结果数据库(即“学习者语料库”),因为学习者数据库可以为外语教学提供重要的语言信息,可以通过进行错误分析指导下一轮教学大纲制订、指导教师的教学、指导教材编写等。
中间数据库包括为用户服务的各种数据库,主要是为级别信息筛选服务的内容。
有了这两种数据库,外语教育数字出版才能完成教学大纲(或曰“课程标准”)倡导的“以学生为中心”的教学活动。