《表1:《庄子》内七篇内容特征提取结果》
使用自然语言处理中的统计词频、逆文本频率、TF-IDF值等方法,可以较好的提取到古籍文本中的内容特征,能够帮助语言学、古典文献学等领域的人文社科研究者更便捷的理解古籍文本的语言学特征及内容特征。当前,基于深度学习的文本理解技术还依赖于大量语料数据,但古籍文本数据量极少,目前还不能产生较好的效果。随着计算机技术的逐步发展,待深度学习技术更为成熟之后,也可以尝试使用基于知识图谱和注意力模型等方法提取古籍文本的内容特征。
图表编号 | XD0057445600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 龚科瑜、张一驰 |
绘制单位 | 首钢工学院计算机与媒体艺术学院、首钢工学院计算机与媒体艺术学院 |
更多格式 | 高清、无水印(增值服务) |