《表5 沙漠学领域数值信息类别》

《表5 沙漠学领域数值信息类别》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《数值信息抽取研究概述及应用分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

不同类型的数值信息抽取策略多有不同。表5以地球科学领域的沙漠学数值信息类型为例,包含了地理信息、时间空间信息、气候信息、属性信息、生态信息等。沙漠学文献中涉及到的气候信息包括降水量、蒸发量、干燥度、风速、温度等内容,降水量、蒸发量一般都有标志性的数值和数值单位组成,而气候类型的数值信息抽取目标词汇则一般为“温湿、半湿润、寒冷干旱、半干旱、干冷多风”等;时空信息一类中,经纬度、海拔有特定的表达结构,而研究区域则相对弱规律化,例如“巴丹吉林沙漠位于(阿拉善高平原中西部,集中分布于弱水东岸的古日乃湖以东、宗乃山和雅布赖山以西,拐子湖以南,北大山以北的地区)”,括号内的内容为需要抽取的内容,涉及的词表类型、表达规则丰富多样,这都为数值信息的抽取增加了难度。