《表5 沙漠学领域数值信息类别》
不同类型的数值信息抽取策略多有不同。表5以地球科学领域的沙漠学数值信息类型为例,包含了地理信息、时间空间信息、气候信息、属性信息、生态信息等。沙漠学文献中涉及到的气候信息包括降水量、蒸发量、干燥度、风速、温度等内容,降水量、蒸发量一般都有标志性的数值和数值单位组成,而气候类型的数值信息抽取目标词汇则一般为“温湿、半湿润、寒冷干旱、半干旱、干冷多风”等;时空信息一类中,经纬度、海拔有特定的表达结构,而研究区域则相对弱规律化,例如“巴丹吉林沙漠位于(阿拉善高平原中西部,集中分布于弱水东岸的古日乃湖以东、宗乃山和雅布赖山以西,拐子湖以南,北大山以北的地区)”,括号内的内容为需要抽取的内容,涉及的词表类型、表达规则丰富多样,这都为数值信息的抽取增加了难度。
图表编号 | XD0039029900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.01 |
作者 | 李春杰、马建玲、主雪梅 |
绘制单位 | 中国科学院兰州文献情报中心、中国科学院大学图书情报与档案管理系、中国科学院大学图书情报与档案管理系、河北水利电力学院 |
更多格式 | 高清、无水印(增值服务) |