- · 《古汉语研究》期刊栏目[01/26]
- · 《古汉语研究》投稿方式[01/26]
- · 古汉语研究版面费是多少[01/26]
来稿应自觉遵守国家有关著作权法律法规,不得侵犯他人版权或其他权利,如果出现问题作者文责自负,而且本刊将依法追究侵权行为给本刊造成的损失责任。本刊对录用稿有修改、删节权。经本刊通知进行修改的稿件或被采用的稿件,作者必须保证本刊的独立发表权。 一、投稿方式: 1、 请从 我刊官网 直接投稿 。 2、 请 从我编辑部编辑的推广链接进入我刊投审稿系统进行投稿。 二、稿件著作权: 1、 投稿人保证其向我刊所投之作品是其本人或与他人合作创作之成果,或对所投作品拥有合法的著作权,无第三人对其作品提出可成立之权利主张。 2、 投稿人保证向我刊所投之稿件,尚未在任何媒体上发表。 3、 投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、 投稿人向我刊所投之作品不得同时向第三方投送,即不允许一稿多投。 5、 投稿人授予我刊享有作品专有使用权的方式包括但不限于:通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑,以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、 第5条所述之网络是指通过我刊官网。 7、 投稿人委托我刊声明,未经我方许可,任何网站、媒体、组织不得转载、摘编其作品。
中国文学论文_基于新词发现的古典文学作品分词
作者:网站采编关键词:
摘要:文章目录 0 引 言 1 新词发现的相关技术 1.1 N-Gram算法 1.2 互信息 1.3 左右信息熵 2 基于新词发现的古典文学作品分词方法 2.1 古典文学作品分词方法 2.2 分词方法的具体实现 (1)古文文本预
文章目录
0 引 言
1 新词发现的相关技术
1.1 N-Gram算法
1.2 互信息
1.3 左右信息熵
2 基于新词发现的古典文学作品分词方法
2.1 古典文学作品分词方法
2.2 分词方法的具体实现
(1)古文文本预处理。
(2)语料切分。
(3)计算候选词的互信息。
(4)计算候选词的左右信息熵。
3 实验及结果分析
3.1 实验语料
3.2 评价指标
4 结束语
文章摘要:对于中文文本的分词研究来说,现有的分词方法和技术较多都是针对现代汉语,现代汉语的分词方法和体系已经很成熟,但对古代汉语的研究较少。由于古文的特殊性,将现代汉语的分词方法技术直接用于古汉语时,无法得到分词准确的理想效果,目前对古汉语分词方法的研究还未形成成熟的体系。文中提出一种基于新词发现的古典文学作品分词方法,即从大量古典文学作品语料中发现新词,构建古汉语分词词典,在此基础上再对古文文本进行分词。以《三国演义》古文文本处理为例,验证了基于新词发现的古典文学作品分词方法能有效提高古文分词的准确率。
文章关键词:
论文分类号:I207.413;TP391.1
文章来源:《古汉语研究》 网址: http://www.ghyyjzzs.cn/qikandaodu/2021/0924/554.html