《表2 五类文本相似度统计》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中国学生英语讲述中国故事的话语方式研究——基于文本发掘的发现》
注:括号中的值为EJaccard,另一种为余弦值。
在计算余弦相似度时,首先将文本转换为权值向量,通过计算两个向量的夹角余弦值,评估文本之间的相似程度。余弦值在[-1,1]之间,值越接近1代表两个向量分析越接近,两个文本之间的相似度越高。广义的杰卡德系数(EJaccard)用于文本相似性计算,其取值在[0,1]之间,值越大表示两个文本的相似度越高。五类学生写作文本的相似度统计见表2。
图表编号 | XD00155981100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.20 |
作者 | 汪顺玉 |
绘制单位 | 西安外国语大学研究生院 |
更多格式 | 高清、无水印(增值服务) |