您现在的位置: 首页
2014年12月01日 来源:百道网
时间:
【百道编按】建立分析工具,除了需要强大的技术支撑,更需要研发人员对内容的理解、对阅读的理解、对出版的理解,缺一不可。但目前国内相关研究存在各自为政相互隔离的情况。像百道网这样的靠技术服务于出版业的新型公司,兼有两方面的资源和积累,开展这项工作是很有优势的。
我国儿童阅读现状:阅读量低,缺乏多样性
和欧美相比,中国的儿童阅读存在很多问题。首先,国内的教育重精读,轻泛读,阅读量不够。经合组织有一个针对全球15岁学生进行的评估项目(PISA),在阅读能力这一项,2009年和2012年上海的学生连续获得最高分,且分数远高于平均值。这只能说明我们的应试水平好,但日常阅读量恐怕就不是对手了,至于是否真的喜欢阅读,那就更难说了。我国2011版《义务教育语文课程标准》规定,3~4年级课外阅读总量不少于40万字,5~6年级不少于100万字,7~9年级不少于260万字。我认为这个要求太低,至少还可以再增加1倍。
第二个问题是阅读的多样性不够。各类推荐和书单固然有所帮助,但也增加了人为的限制。美国女教师Donalyn Miller曾写过一本名为“The Book Whisperer”的书,记载了自己在学生中开展独立阅读活动的实践和体会。她辅导的孩子能在一年的时间里自主选择、轻松完成40本以上的阅读量,且读的内容可以大相径庭,例如一位叫Tommy的,只看科幻与奇幻,一年里读了65种。我记得我小时候,也就是80年代初,孩子们的阅读口味是非常分散的,我有个小学同学天天抱着一本竖排文字的大部头,还有个初中同学偷偷看完了家藏的《隋唐五代史》。这样其实很好。但现在由于图书产品太多,引导方式狭隘,发现体系不完善,教育导向单一,儿童自主选书的动力和能力都不够。
阅读分级应该有助于解决这些问题。
我国分级阅读实践缺少内容测度
目前国内包括出版商和研究机构在内,使用的分级策略,基本是确定一套标准后,通过人工判断来进行分级分类。这种方式有它的价值,但只能覆盖有限的书,其在推动阅读个性化和自主选择方面的作用非常有限。
我认为,儿童阅读分级的宗旨,不能只是发布有限的分级书目,而是要能够给所有的图书提供完整的特征标签,让孩子有选择的自由和根据。只有把选择的主动权交给老师、家长和孩子,才能真正激发阅读的个性化、多样性。出版也有了繁荣的基础。
那么,该如何来做呢?
先来看看我们是如何描述一本书的。目前已有的方式是通过内容介绍,还有评价评语,以及对市场表现的描述(如销售情况)等。所缺少的是对图书内容的直接测度,也就是和阅读直接相关的一些定量指标。这包括:(1)文本的复杂度或叫易读性;(2)内容成分特征或叫主题成分特征;(3)内容风格特征或叫艺术特征等等。
这三者中,最后一项似乎不太可能有定量化的测定方法(全文相似性分析技术可以作为辅助),前两项其实都已经有大量的研究成果了。
以内容复杂度分析为例,蓝斯(Lexile)框架就是典型的代表,国内还有很多国际学校采用的Renaissance Learning开发的ATOS和AR系统也与之类似,只是基于的研究基础不同。在内容成分分析方面,今年7月被苹果公司收购的图书数据分析公司BookLamp就是做这个的,他们的所谓“图书基因组计划”,就是通过全书文本扫描分析来描述每本书每一部分各类内容成分(主题元素)所占的比重,由此形成一本书的特征曲线,按照图谱相似性可以匹配类似风格的书。
这些适用于英文图书的技术对我们处理中文图书是有借鉴意义的。中文有其自身的复杂性,但其分析思路是类似的。
中文内容测度的现实意义、技术要点及产业机会
不可否认,目前我国公共图书馆欠发达,以“购买”为前提的日常阅读限制了阅读量,阅读辅导也同样缺失,家长常常有心无力。针对这些问题,如果有一个好的中文图书分类分级标签体系,给图书提供上述新的描述维度,就可以有力地促进儿童阅读的自主选择,提升辅导和教育的效率,引导出版商的策划,引导创作者的写作。
我们再来剖析一下技术方面的要点。不管是文本复杂度分析,还是内容成分分析,都需要建立分析工具。这个分析工具基于两个方面,一是建立分析的标准和指标体系,二是根据这些指标体系,针对不同类型的书,建立算法模型,再借助各类新技术,研发出可以对文本进行测度的应用工具。
中文阅读分级技术要点
建立分析工具,除了需要强大的技术支撑,更需要研发人员对内容的理解、对阅读的理解、对出版的理解,缺一不可。但目前国内相关研究存在各自为政相互隔离的情况。像百道网这样的靠技术服务于出版业的新型公司,兼有两方面的资源和积累,开展这项工作是很有优势的。
做这件事情可以分三步。第一步是充分利用国内现有研究成果,确立中文文本测度要素,建立文本测度指标,研发测度工具并进行大量实验;第二步是争取获得出版商的采纳和读者认可,形成标准;第三步是与出版商合作,通过建立图书评价的多维结构,开发阅读分级的市场价值。
第一步成败很关键。以建立中文易读性分析模型为例,其思路应该是先确立中文易读性的语言因素,并在此基础上分析权重,建立算法。
中文易读性语言因素
这第三步探讨的是产业出路。实际上,内容测度体系的建立对出版业来说无疑有着很大的想象空间。以教育出版为例,这一体系可以介入语文课程的核心,通过阅读测评,制定个性化阅读目标,进而产生新的更多样的阅读需求,为出版商提供新的市场机会。
中文阅读分级产业机会-教育
内容测度体系也可以为大众出版提供营销手段,提高图书产品的可发现度,为全民阅读推广提供多一种推荐和选择的手段。
马学海,百道新出版研究院资深特邀顾问,理学博士,编审。曾在科学出版社工作12年。2009年赴加拿大西蒙菲莎大学(Simon Fraser University)学习和研究现代出版与传播。2010年加盟“百道网”,任研究总监、百道新出版研究院执行院长。2012年至今在同方知网(北京)技术有限公司工作,先后任项目经理、战略管理与行业市场部总监。
(本文编辑 岳尚华)
北京百道世纪网络信息技术有限公司及其平行公司北京百道世纪教育科技有限公司下属的网络媒体平台百道网、百道网微信、帮书店微信,以及百道学习APP和小程序等平台上发布的文章,版权属于北京百道世纪网络信息技术有限公司所有,或北京百道世纪网络信息技术有限公司与著作权人共同拥有,严禁转载。任何纸媒、网媒或社交媒体需要发布或转载,请与版权专员联系(service@bookdao.biz),获得授权后,方可转载。对于任何未经授权的转载,我们将依法追究其侵权责任。
扫描二维码 分享文章