《表1:《庄子》内七篇内容特征提取结果》

《表1:《庄子》内七篇内容特征提取结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于TF-IDF的古籍文本内容特征提取方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

使用自然语言处理中的统计词频、逆文本频率、TF-IDF值等方法,可以较好的提取到古籍文本中的内容特征,能够帮助语言学、古典文献学等领域的人文社科研究者更便捷的理解古籍文本的语言学特征及内容特征。当前,基于深度学习的文本理解技术还依赖于大量语料数据,但古籍文本数据量极少,目前还不能产生较好的效果。随着计算机技术的逐步发展,待深度学习技术更为成熟之后,也可以尝试使用基于知识图谱和注意力模型等方法提取古籍文本的内容特征。