牛宝体育娱乐平台

新闻中心

新加坡华文教研中心设语料库 供教师测验编课参阅

时间: 2025-04-27 02:36:37 作者: 牛宝体育娱乐平台

  据新加坡华文媒体音讯,“梅开二度”、“星光熠熠”、“无独有偶”和“后来居上”等形容词常常会呈现在《联合早报》。日后,这些记者惯用的书面语很可能进入中小学生的词语表中,让他们从小就能触摸媒体运用的语料。

  新加坡华文教研中心取得教育部赞助,接下来几年将针对中小学生日常触摸的媒体收拾出相应的书面语和白话语料库。在建构书面语语料库方面,中心优先剖析了报纸的文本。

  华文教研中心院长陈之权博士泄漏,语料库展开到老练阶段时,可让教育部多方运用。语料库能成为测验和课程编列的有力参阅,帮忙教师、课程开发员和评价员更有效地执行母语“乐学善用”的理念。

  陈之权举例说,假设教师要给某个年级的学生命题,而测验规模是特定的句型、语法或内容,教师可经过语料库搜索相关的文章运用。另一方面,语料库也依据词语呈现刊物的频率和词形做分类,而这对往后的课程编列能够更好的起到正面效果。假设一些词语运用的频率越高,就代表学生触摸的时机越多,学生应该早点学习。

  他说:“开端就挑选《联合早报》,是由于想选和学生日子最亲近的资讯来历,这不外乎报纸、电视和网络。加上最近几年,校园在推行报章教育,所以咱们觉得从这儿开端是不错的。”

  开发书面语语料库的项目由研讨组组长吴福焕领导,副研讨员黄雪霞博士和赵春生是这个小组的别的两名成员。

  吴福焕受访时解说,筹建《联合早报》语料库的作业从上一年初开端。他们第一步搜集2005年至2009年的报纸,但由于语料量相当大,他们先抽样处理2007年至2009年的文本。

  为了保证抽样有必定的随机性,并能抒发不同日期刊登的栏目,他们对这些报导先后进行分层和体系抽样。分层抽样指的是搜集不同版位刊登的新闻,抒发封面新闻、社会新闻和文娱新闻等。体系抽样则是依据必定的时刻间隔来抽选文本,比方第一周选星期一的报纸,第二周选星期二的报纸,以此类推。

  接着,每则新闻都会录入为独立的文档然后使用分词软件,对一连串的中文字做有意义的播种。跌倒这类软件判别词组的准确度可高达90%,但仍然会由于地域用语不同而呈现误判,所以还需要研讨预员进行人工校正。

  比方说,“甘榜”和“巴刹”等新马一带特有的名词,大多数都会被体系误判,必须由研讨员特别标示为名词。

  小组现在已反抗前期作业,剖析了三年的《联合早报》文本,语料量多达318万字。其间,常用词词表除了有中心助词如“的”、“在”、“是”等,“高频”词汇还抒发“政府”、“竞赛”、“期望”和“美元”等。

  陈之权和记者说,建造《联合早报》语料库的作业原先是华文教研中心内部的一个项目。教育部得知概况后,觉得这是很好的概念,表明乐意支撑,并要求中心把本地中小学生素日触摸的多元资讯来历也抒发在内,以树立更完好的书面语和白话语料库。

  教育部课程规划与展开司助理司长张龙晋说:“华文教研中心打开许多研讨,做许多数据收拾,而这些作业和教育部的课程理念严密挂钩,由于这些效果今后会在校园执行。所以树立这样的语料库将来不管对课程或教育方面都会有更大协助。”

  为了丰厚书面语语料库,吴福焕接下来还会和他的组员搜集《联合晚报》、《新明日报》、《逗号》、《大拇指》和其他学生读物和参阅书的文本。相关的作业估计明年末能够开始反抗。另一方面,树立白话语料库的作业刚刚展开,另一组研讨员现已经过录制讲堂活动和学生访谈搜集了小一生的白话语料。(中新网)