目前,大数据产业蓬勃发展,从而带动了人们对于非格式化文本数据的分析需求,本书全面、系统的介绍了文本信息处理的相关技术,包括分词、文本向量化、特征选择、文本相似度计算、文本分类、主题模型、情感计算等内容,并在若干综合性的章节中,设计了独到的模型算法,阐述了算法过程。所有章节都通过实例对过程做详细描述,并辅助以代码或伪代码实现,帮助读者理解,具有高度的可操作性和实用性。本书内容新颖、层次清晰,适合高校教师、研究生、高年级本科生使用,也可供相关的软件工程师做参考。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。