《表5 时间信息的识别与标注》
针对微博文本中时间信息的常用提取方法为正则表达式抽取,识别抽取类似“5月19日早上8点”的时间表述。本文同样基于正则方法抽取精确时间点,再基于词性与规则方法标识非精确时间点与时间段信息,如表5所示。对事件发生时间信息的确认还要结合微博的发布时间与语义关键词进行综合推理判定。
图表编号 | XD00211269500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.25 |
作者 | 孙鑫瑞、孟雨、王文乐 |
绘制单位 | 江西师范大学软件学院、曲阜师范大学数学科学学院、江西师范大学软件学院 |
更多格式 | 高清、无水印(增值服务) |