《语言信息处理专论》

作者	黄昌宁，夏莹主编编者
出版	清华大学出版社；广西科学技术出版社
参考页数	646
出版时间	1996（求助前请核对）目录预览
ISBN号	7302019290 — 求助条款
PDF编号	88061368（仅供预览，未存储实际文件）
求助格式	扫描PDF（若分多册发行，每次仅能受理1册）

系统维护中...

目录1

目录2

第1篇汉语文本的分析与生成2

基于评价的汉语自动分词系统的研究与实现马晏2

第1章引言3

1.1 问题的提出3

1.2 书面汉语自动分词的目标3

1.3 历史回顾4

1.4 目前存在的问题5

1.5 研究的目标5

第2章汉语自动分词的形式模型6

2.1 切分的形式模型6

2.2 切分歧义的类型8

2.3 最大匹配法9

2.4 全切分10

2.6 本章小结11

2.5 评价问题11

第3章汉语自动分词的评价层次12

3.1 评价的提出12

3.2 词典的作用12

3.3 经验和统计的意义13

3.4 句法和语义一级的评价13

3.5 语境一级的评价14

3.6 本章小结14

第4章词典的完备性与完全性14

4.1 问题的提出14

4.2 词典的完备性14

4.3 词典的完全性15

4.4 词典与分词标准的一致性19

4.5 本章小结19

5.1 主要算法回顾及切分盲点20

第5章自动分词策略20

5.2 全切分算法21

5.3 修剪问题23

5.4 本章小结26

第6章几种评价参数26

6.1 评价参数的意义26

6.2 评价参数27

6.3 本章小结29

第7章一个基于评价的自动分词系统SEG30

7.1 系统组成30

7.2 词典的构造30

7.3 SEG的分词策略32

7.4 切分效果分析33

第8章结束语34

8.1 切分正确率问题34

7.5 本章小结34

8.2 自动分词系统的作用与发展35

8.3 计算语言学的前景35

参考文献36

基于统计的汉语语料库词性自动标注的研究与实现白栓虎37

第1章绪论38

1.1 计算语言学的研究方法38

1.2 语料库和基于语料库的方法39

1.3 语料库词性标注及其意义41

1.4 问题的描述41

1.5 词性标注的研究方法及现状43

1.6 本论文主要工作内容44

第2章语料库语法标记集的设计44

2.1 制定标记集的标准和原则44

2.2 汉语语料库词性标注标记集45

2.1 粗分类特征的选择48

2.3 对标记集所作的修改48

2.4 本章小结49

第3章统计语言学模型49

3.1 理论依据50

3.2 n元语法（n-gram）及其实现方法51

3.3 数据稀疏与插值马尔科夫模型52

3.4 经验统计语言学模型53

3.5 本章小结53

第4章标记选择53

4.1 词性标注的动态规划算法53

4.2 修正的Forward-Backward算法55

4.3 对FB法输出的讨论56

4.4 输出实例57

4.5 本章小结58

第5章影响正确率的因素及词典空缺的处理59

5.1 标注试验的方法59

5.2 训练集的规模与同现标记对、词典的关系59

5.3 模型中不同因素的地位61

5.5 词典空缺处理策略63

5.4 词典的作用和词典空缺63

5.6 词典应具备的规模65

5.7 推测实例65

5.8 本章小结66

第6章系统的实现与测试66

6.1 标记集和语料67

6.2 MMCRT系统的组成67

6.3 标注系统的词典67

6.4 模型训练69

6.5 标注模块70

6.6 语料库管理71

6.7 各种模型的测试71

附录1 “八五”汉语语料库的词性标记集（1990年6月第二稿）72

附录2 对第2章细类合并得到的大类（TAGSET2）75

参考文献76

汉语真实文本的语义自动标注童翔78

1.1 词语歧义及歧义排除79

第1章引言79

1.2 语料库和语料库的标注83

1.3 汉语的义项标注84

第2章汉语语义标注系统86

2.1 资源86

2.2 系统的组成和主要数据结构89

2.3 系统工作流程90

第3章基于例子的汉语义项标注方法91

3.1 MTD与实例库91

3.2 基于实例的汉语义项标注算法92

4.1 系统的评价93

第4章系统的评价与展望93

4.2 系统的局限性及改进94

4.3 今后工作的展望96

结论97

附录1 标注样本98

附录2 《同义林词林》大类和中类的代码和分类名称100

参考文献101

汉语句法分析中的一种多扫描确定性算法及其在篇章理解中的应用孙茂松103

第1章绪论104

1.1 句法分析概述104

1.2 篇章理解概述107

1.3 句法分析与篇章理解的关系108

1.4 本文的任务及内容109

第2章汉语中的兼类词、同形类组及其处理策略109

2.1 兼类词、同形词组及同形类组109

2.2 兼类词及其处理策略112

2.3 同形类组及其处理策略115

第3章汉语句法分析的困难120

3.1 困难之一——汉语句法结构之间界限模糊120

3.2 困难之二——兼类词和同形类组122

3.3 困难之三——差异的普遍性122

3.4 困难之四——语义的引入124

3.5 走出困境的几点措施124

第4章算法构思127

4.1 算法宜采用确定性129

4.2 控制策略：自底向上与数据驱动129

4.3 从左向右、从右向左多次扫描130

4.4 两个“贯穿”137

第5章算法及实验系统138

5.1 数据结构138

5.2 汉语句法分析的一种多扫描确定性算法141

5.3 实验系统144

6.1 一类典型军事情报的特点145

第6章典型军事情报的篇章理解145

6.2 军事情报理解中的几个问题146

6.3 程序实现149

第7章结束语151

附录1 句法分析部分结果（单句）151

附录2 句法分析部分结果（军事情报篇章）160

附录3 一篇军事情报的内部表示（机器自动抽取）163

参考文献168

汉语句法分析的语料库方法研究吴升171

第1章前言172

第2章对若干基于语料库的句法分析工作的评述173

2.1 UCREL基于成分似然语法的分析系统174

2.2 BSO基于依存语法的句法分析器175

2.3 宾夕法尼亚大学的广义互信息方法176

第3章汉语依存语法及其依存关系的定义177

3.1 关于汉语依存语法模型中的几个重要概念的说明178

3.2 汉语依存语法模型及句法分析的形式化描述184

第4章知识获取和句法分析器的建造187

4.1 人工标注的形式及知识获取的过程187

4.2 系统的组成及简介188

4.3 句法分析器的主要处理流程及其策略190

4.4 两个实例分析190

4.5 关于实现中若干细节的说明192

4.6 关于开放性语料处理的讨论及途径194

第5章总结与展望196

附录1 部分分析器的分析结果一览表196

附录2 依存关系及代码一览表198

附录3 部分义类类型及代码200

附录4 词类类型及代码一览表201

参考文献202

基于合一的汉语句法分析系统的研究与实现栾浩203

前言204

第1章句法分析概论204

1.1 句法分析技术的发展历史204

1.2 句法分析技术的新发展206

第2章 UBCP的基础语法理论和分析方法206

2.1 基于合一的语法理论206

2.2 Tomita算法210

第3章　UBCP中存在的歧义问题及解决策略213

3.1 汉语的语法特征213

3.2 汉语分析中普遍存在着歧义问题213

3.3 相应的解决策略214

第4章　UBCP系统的基本设计思想218

4.1 句法分析的功能218

4.2 句法分析系统设计的一般原则219

4.3 分析器的基本设计思想220

5.1 电子词典222

第5章　UBCP的知识库222

5.2 语法规则库226

5.3 电子词典的控制机制229

5.4 规则库的控制机制230

第6章　UBCP系统的实现233

6.1 系统总体框图233

6.2 规则库处理子系统234

6.3 词典处理子系统234

6.4 用户接口子系统236

6.5 核心分析算法237

6.6 实例分析240

6.7 合一算法的讨论241

7.2 UBCP系统评价244

7.1 实验环境和实验结果244

第7章　UBCP系统的实验结果和评价244

结束语245

附录1　本系统所用词语词类代码表246

附录2　规则描写语言DRDL的书写规范246

附录3　部分实验结果250

参考文献258

基于合一算法的汉语生成研究李东260

第1章　绪论261

1.1 语言生成及其与理解的差别261

1.2 单句生成概述263

1.3 话语生成概述264

1.4 话语生成中的单句生成268

1.5 本文任务268

2.1 一种句子意义的分析模式269

第2章　汉语句子意义的一种语用语义描述269

2.2 句子意义的一种语用语义描述271

2.3 小结278

第3章　汉语常用句式及其生成规律278

3.1 汉语生成的特点278

3.2 语义链279

4.1 复杂特征集的引入285

第4章　生成系统设计285

3.3 小结285

4.2 规则宜采用陈述性描述287

4.3 基于合一的语法理论287

4.4 FUG语法用于汉语生成290

第5章　汉语句子生成实验系统的实现295

5.1 数据结构296

5.2 系统中定义的几个框架处理函数300

5.3 生成算法301

5.4 对生成中几个问题的探讨302

5.5 结论307

第6章　话语生成实验系统的设计与实现307

6.1 系统的总体设计308

6.2 知识库信息的存储和管理309

6.3 话语规划310

6.4 几个主要模块的程序实现316

第7章　结束语316

附录1　Fillmore对英语在不同时期的格表318

附录2　汉语的格体系318

附录3　汉语动词的态分类和态标记322

附录4　名词语义体系（救火机器人话语生成系统）324

附录5　DGSS的运行结果324

参考文献324

印刷体汉字识别的研究朱夏宁328

第2篇汉字识别328

第1章　引言330

1.1 印刷体汉字识别研究工作的发展概况330

1.2 印刷体汉字识别的困难和识别方法331

1.3 印刷体汉字识别的候选集确定331

1.4 印刷体汉字识别的字识别333

第2章　印刷体汉字的特征选择335

2.1 引言335

2.2 印刷体汉字的特点335

2.3 边框特征（部首）335

2.4 局部特征（字根）337

2.5 笔划端点和结点337

2.6 本章小结338

第3章　印刷体汉字结构特征的提取338

3.1 笔划及其端点的提取338

1.5 本章小结339

3.3 印刷体汉字的部首提取342

3.2 印刷体汉字的字根提取342

第4章　印刷体汉字的结构统体特性及分析346

3.4 本章小结346

4.1 印刷体汉字周边特征的分析347

4.2 印刷体汉字游程统计特性及分析349

4.3 印刷体汉字笔划特性及分析350

4.4 印刷体汉字的字根统计特性及分析352

4.5 印刷体汉字部首分布的统计及分析353

4.6 本章小结357

第5章　实验性印刷体汉字识别系统357

5.1 系统设计的一些考虑357

5.2 系统的组成与工作过程358

5.3 实验结果360

结束语362

参考文献363

人工神经网络印刷汉字识别系统的研究徐宁365

第1章　绪论367

2.1 印刷体汉字的特点368

第2章　汉字识别的嵌套分层结构368

2.2 汉字识别的嵌套分层结构369

2.3 本章小结371

第3章　基于人工神经网络的汉字特征提取372

第4章　汉字识别自组织聚类人工神经网络376

4.1 引言376

4.2 汉字识别自组织聚类人工神经网络377

4.3 实验结果与分析381

4.4 本章小结386

第5章　汉字细分类BP网络386

5.1 汉字细分类RP网络结构386

5.2 BP算法的改进386

5.3 细分类网络训练样本的选择387

第6章　基于协作模块神经网络的汉字识别方法389

6.1 问题的提出389

5.4 本章小结389

6.2 协作模块神经网络390

6.3 结论与实验结果393

第7章神经网络多体印刷汉字识别实验系统的实现393

7.1 系统的组成和建立394

7.2 实验结果396

参考文献397

联机手写汉字识别和印刷体汉字识别的研究与实践杨德顺401

第1章　联机手写汉字识别402

1.1 联机手写汉字识别方法概述402

1.2 手写汉字模式的形式化描述—汉字表达式404

1.3 笔划有序列生成407

1.4 汉字表达式的机器学习410

1.5 联机手写汉字识别系统的实现414

2.1 汉字特征点的定义及性质418

第2章　印刷体汉字识别418

2.2 汉字特征点的自动抽取419

2.3 基于特征点的印刷体汉字识别模拟系统423

附录1 局部结构分析法抽取笔划特征点的步骤示例429

附录2 关键背景点抽取的步骤示例434

附录3 局部结构分析法抽取笔划特征点的稳定性示例437

附录4 局部结构分析法抽取笔划特征点程序运行实例438

参考文献442

手写印刷体汉字识别的研究吴智彪444

第1章　手写印刷体汉字识别概述445

1.1 手写印刷体汉字识别的发展445

1.2 识别手写印刷体的结构相似法447

第2章　粗分类特征的选择和提取448

2.2 汉字图象的多角形近似450

2.3 实现投影的扫描线算法451

2.4 四边框形状特征码的获取451

2.5 本章小结452

第3章　粗分类的实现453

3.1 特征库的结构453

3.2 搜索算法454

3.3 粗分类结果的获取454

3.4 本章小结455

第4章　细分特征抽取——笔划段快速合并法456

4.1 细化算法及多角形近似抽取笔划法的不足456

4.2 近似多角形的特点456

4.3 合并算法457

第5章　一种新的图匹配法——相关属性关系图启发式匹配458

4.4 本章小结458

5.1 常用关系结构图匹配方法的问题459

5.2 CARG的数学描述及启发式匹配算法460

5.3 手写印刷体汉字图匹配的实现462

5.4 匹配实例465

5.5 本章小结467

参考文献467

手写汉字识别的研究曾棋荣470

第1章　引言471

1.1 手写汉字识别的进展471

1.2 手写汉字识别研究方向473

1.3 本论文的主要工作474

第2章　特征的选择和抽取474

2.1 手写体汉字的特点474

2.2 特征的选择与抽取475

3.2 快速机器学习479

第3章　粗分类及机器学习479

3.1 粗分类479

第4章　手写体汉字识别中的特征匹配判别480

4.1 特征匹配判别的一般方法及问题480

4.2 句法误差校正分析480

4.3 动态规划算法求最短距离481

4.4 实用扩散型动态规划法482

4.5 迪杰斯特拉（Dijkstra）求最短距离算法的应用482

4.6 实验结果和结论483

第5章　交互式自学习脱机手写汉字识别系统484

参考文献484

第3篇语言识别与合成489

汉语语言识别的研究李建民489

第1章　语音识别的任务、困难及研究方向491

第2章　语音识别技术VQ-HMM的简介493

第3章　汉语语音识别的特点496

第4章　基于汉语语音特点的识别方法（SVQ-SPM）497

第5章　基于音节识别的词组语音识别502

第6章　大词汇表汉语语音识别系统504

第7章　结论与讨论505

参考文献506

汉语单音节识别研究迟边进509

第1章　综述510

第2章　建立语音开发环境511

2.1 实验设备511

2.2 采样程序原理512

2.3 语音视听软件512

第3章　特征抽取与距离度量513

3.1 距离度量与匹配算法513

2.4 语音库的建立513

3.2 距离度量实验515

3.3 特征加权515

3.4 小结516

第4章　矢量量化与概率模型517

4.1 矢量量化（VQ）517

4.2 隐马尔可夫模型（HMM）517

4.3 基于非线性分块的概率统计模型517

（Nonlinear Blocking-based Probabilistic Statistics Model，简称NBPSM）518

第5章　汉语单音节识别519

5.1 语音库的特征提取519

5.2 建码本与语音特征的矢量量化520

5.3 NBPSM与HMM及动态规划匹配算法的比较520

5.4 floor值对NBPSM的影响520

5.5 特征加权在NBPSM中的使用520

第6章　话者适应521

5.6 无调单音节NBPSM识别实验521

6.1 话者适应算法522

6.2 话者自适应实验524

6.3 新话者适应实验524

第7章　基于韵母识别的单音节粗识别525

7.1 韵母表525

7.2 声母／韵母分割526

7.3 粗识别实验526

第8章　无调单音节识别及多字词识别527

8.1 无调单音节识别527

8.2 多字词识别528

第9章　结束语529

参考文献529

神经元网络用于汉语单音节识别的研究赵彤青533

1.1 神经元的生理原型534

第1章　神经元网络概述534

1.2 人工神经元网络模型535

第2章　错误回传算法536

第3章　用神经元网络实现汉语声母识别539

3.1 声母的类数考虑539

3.2 网络的结构539

3.3 LPC-CEP参数公式推导540

3.4 神经网络第一级子网输入参数的计算542

3.5 实验结果542

参考文献543

基于人工神经网络的汉语声母识别研究曾迎凡545

第1章　概述546

1.1 基于人工神经网络语音识别的发展现状546

1.2 汉语的特点与识别基元547

1.3 汉语声母发音特点547

2.1 语音信号预处理与端点检测（音节切分）548

2.2 声、韵母的自动切分548

第2章　汉语单音节的声韵母自动切分548

第3章　人工神经网络简介552

3.1 BP网络的模型553

3.2 自组织特征映射网络模型554

第4章　基于人工神经网络的语音识别556

4.1 时间延时神经网络（TDNN）557

4.2 一种时间延迟输入多层感知器558

4.3 多级识别方法559

第5章　一种声母识别的神经网络方法560

5.1 声母的特征提取和特征加权560

5.2 时间规整问题560

5.3 自组织特征映射网络在粗分类中的应用561

5.4 各级网络的训练563

参考文献568

大字表语音识别系统中的杨柳扬570

第1章　引言571

第2章　N-Gram插值语言模型和准N-Gram语言模型573

2.1 N-Gram插值语言模型575

2.2 准N-Gram语言模型577

第3章　实际语言模型的实现578

3.1 Bigram插值模型580

3.2 准Trigram插值模型580

第4章　实验结果581

4.1 复杂度估算分析581

4.2 语言模型的预测能力实验分析582

4.3 语音识别率测试实验584

参考文献586

汉语语音合成系统的研究黄金法586

第1章　语音合成研究发展概述587

第2章　语音信号的声学性质589

2.1 语音信号的产生机理589

2.2 韵母590

2.3 辅音591

2.4 汉语普通话的音节结构595

2.5 汉语声调的声学性质598

第3章　语音合成数据库建立599

3.1 语音合成算法的选取599

3.2 音元选择600

3.3 语音数据采集602

3.4 音节的声调控制604

参考文献605

汉语文本-语音转换系统的研究与实现马丹耕607

第1章　语音合成技术概述608

第2章　单音节合成系统608

2.1 音元选择609

2.2 音元数据库的建立和字-音转换610

2.3 硬件615

2.4 软件617

第3章　汉语文本-语音转换系统的实现624

第4章　结束语626

参考文献627

日语语音合成系统王春凤629

第1章　前言630

第2章　日语语音的特征分析630

2.1 日语的声学特征630

2.2 日语单词音调634

第3章　日语文本语音输出640

3.1 日语文本分析640

3.2 韵律控制641

3.3 日语语音输出642

3.4 日语文语转换系统的实现644

第4章　系统存在的问题与改进方向645

参考文献646

1996《语言信息处理专论》由于是年代较久的资料都绝版了，几乎不可能购买到实物。如果大家为了学习确实需要，可向博主求助其电子版PDF文件（由黄昌宁，夏莹主编 1996 清华大学出版社；广西科学技术出版社出版的版本）。对合法合规的求助，我会当即受理并将下载地址发送给你。

系统维护中...

高度相关资料

: 北京市中学课本语文复习参考资料; 1979 北京：北京出版社

: 制导信息处理; 1993

: 教育信息处理; 1994年8月第1版华南理工大学出版社

: FoxBASE数据库管理系统; 1995年清华大学出版社

: 汉字信息处理; 1990 北京：国防工业出版社

: 信息处理系统; 1993 北京：北京科学技术出版社

: 汉语信息处理基础; 1994 北京：北京语言学院出版社

: 语言信号处理; 1990 合肥：中国科学技术大学出版社

: 信息处理概论第2卷; 1987 北京：中国人民大学出版社

: 草药偏方治百病; 1996 福州：福建科学技术出版社

: 光学信息处理; 1986 天津：南开大学出版社

: 语言信息和语言通信; 1987 北京：知识出版社

: 汉字信息处理; 1994 成都：电子科技大学出版社

: 光学信息处理; 1985 北京：机械工业出版社

: 远程信息处理导论; 1983 北京：科学出版社

提示：百度云已更名为百度网盘（百度盘），天翼云盘、微盘下载地址……暂未提供。➥ PDF文字可复制化或转WORD

《语言信息处理专论》

高度相关资料

最优C/C++编程秘诀

编译程序构造

相关绝版资料

随机翻阅