《中国搜农-农业搜索引擎》

点击下载 ⇩

截至2006年9月,全球共有96854877个网站、近千亿网页。面对这一海量信息资源,全球10亿网民面临严重的“信息过载”问题,搜索引擎是解决这一问题的基本工具。传统搜索引擎大致可分为三类:以目录索引为特征的搜索(YAHOO),以关键词索引、页面重要性分析与超链分析技术为特征的全文搜索(GOOGLE,BAIDU)以及元搜索(Meta Crawler、Mamma)。这三类搜索引擎在实际应用中存在两点不足:

一是用户无法用简单的关键词准确表达出查询的需求,具有一定的盲目性,查准率很难保证,出现大量与用户本意不同、无关的垃圾信息;

二是搜索引擎只返回包含成千上万的指向Web页面的链接地址,距离得到用户所需要的真正信息还有很大差距。  目前,我国建有30000余个涉农网站,积累了丰富的农业技术、市场信息、政策法规、农业新闻等信息资源。这些网站由于信息资源缺少统一的形式化表达与操作标准,使得信息异质、异构、分散、重复现象严重,形成“信息孤岛”,很难发挥农业信息资源的集成效用。考虑到农户文化水平、计算机操作能力以及农业信息服务复杂性,要求“三农”用户利用传统的搜索工具去直接交互、捕捉和筛选个性化信息,不仅是不现实的,也是不可能的。  本项目正是在这样的背景下,受国家科技支撑计划项目“基于本体的农业智能搜索引擎”,国家自然基金“农业复杂自适应搜索模型研究”等项目资助,建立专业化、个性化以及高度智能化的农业搜索模型,研究更加贴近农业领域、更加符合农业用户需求的新一代农业搜索引擎,意义重大。  因此,项目针对互联网开放性、层次性、演化性、巨量性等本质特性,从复杂适应系统这一全新的角度,以农业搜索服务为应用背景,建立个性化、专业化的复杂自适应搜索模型。建立专业信息采集、分类、清洗与服务主体联盟,并组成多主体联盟实验环境,研究这些主体之间以及主体与网络环境、用户环境之间学习与进化过程中的适应与协作机制;探索随着用户需求的逐步聚焦,采集意向的不断调整,采集信息分步净化,信息类别逐级细分,复杂自适应搜索模型的查全率、查准率在宏观上的演化规律。通过学习机制、进化机制实现对复杂、动态网络环境的适应,解决上述新一代搜索引擎面临的核心问题。同时,提出的复杂自适应搜索建模方法对建立其它行业的专业化搜索引擎也具有指导意义。  项目研究建立农业复杂自适应搜索模式,对文化程度以及计算机操作水平相对较低的涉农用户将有更加迫切的需求。国内农业专业搜索引擎,特别是个性化、自适应的农业搜索引擎还处于技术突破的前夜,因此农业复杂适应搜索模式研究成功为我国蓬勃发展的农业企业、农业协会、农民大户以及广大农业技术人员提供农业市场、农业技术以及政策新闻等个性化服务。有效缓解农业信息服务“信息过载”问题,对促进我国农业与农村信息化建设也将起到关键作用。

  1. 下载详细PDF版/Doc版

提示:为方便大家复制编辑,博主已将PDF文件制作为Word/Doc格式文件。