1、建议在语料库中对异形词采用“通用词”进行标注,既避免“噪音”和漏检,又能解决字形不够用的问题,对相关研究具有重要意义。
2、实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词。
3、杨惠中,2002,语料库语言学导论。上海:上海外语教育出版社。
4、出于以上的考虑,笔者决定借助先进的语料库工具,对在中国学生英语写作中出现的现在完成时错误进行一次分析。
5、其次,对体育语域语料库中的体育赛事语料进行词频统计,编制体育赛事基本词表,从中提取体育赛事基本词汇2217个。
6、基于BNc笔语语料库,本文研究了八千万英语笔语的篇际词汇增长曲线,并对现有数学模型进行了拟合度检验。
7、在香港慧科讯业公司提供的文本分类语料库上的测试结果表明,该算法的效率和精度满足要求。
8、一、二级字表通过语料库统计和人工干预方法,主要依据字的使用度进行定量、收字和分级。
9、“2013年春夏季中国主流报纸十大流行语”是基于北京语言大学动态流通语料库(Dcc),通过计算机提取获得。
10、首先,从记录、研究、抢救的角度来看,绘制方言地图、建立有声语料库等活动已经在各地有声有色的开展起来。
