百道网
 您现在的位置:Fun书 > 学习机器翻译
学习机器翻译


学习机器翻译

作  者:(加)西里尔·古特(Cyril Goutte)等著;曹海龙等译

出 版 社:科学出版社

出版时间:2016年02月

定  价:120.00

I S B N :9787030422972

所属分类: 教育学习  >  教材  >  研究生/本科/专科教材    

标  签:程序设计  计算机/网络  其他  

[查看微博评论]

分享到:

TOP内容简介

学习机器翻译》首先讨论若干使能技术,即解决那些不是机器翻译本身但却是与机器翻译系统开发相关的技术,其中包括从可比语料中获取双语句子对齐数据、多语名称词典的自动构造、词对齐技术等。随后介绍若干新的、改进的统计机器翻译技术,包括利用句法信息的判别式训练框架、半监督学习方法和基于核的学习方法的应用以及多机器翻译译文的组合以改进整个翻译系统的质量

TOP作者简介

作者:(加)西里尔·古特(Cyril Goutte)等著;曹海龙等

TOP目录

译者序 

原书前言 

第1章统计机器翻译初步 

1.1背景 

1.2机器翻译的评价 

1.2.1基于编辑距离的方法 

1.2.2基于n元文法的方法 

1.2.3召回率的重要性 

1.2.4使用句法的方法 

1.2.5评价方法的评价与融合 

1.2.6统计显著性检验 

1.3基于词的机器翻译 

1.3.1模型1、模型2和隐马尔可夫模型 

1.3.2模型3、模型4和模型5 

1.3.3搜索 

1.3.4现状 

1.4语言模型 

1.4.1n元文法模型和平滑技术 

1.4.2最大熵模型 

1.4.3若干最新研究趋势 

1.5基于短语的机器翻译 

1.5.1对数线性模型 

1.5.2基于短语的翻译模型 

1.5.3最小错误率训练 

1.5.4搜索 

1.5.5重打分 

1.5.6现状 

1.6基于句法的统计机器翻译 

1.6.1无需句法分析的方法 

1.6.2目标语言端进行句法分析 

1.6.3源语言端进行句法分析 

1.6.4源语言端和目标语言端都进行句法分析 

1.7其他一些重要方向 

1.7.1因子化模型 

1.7.2模型自适应 

1.7.3系统融合 

1.7.4用于机器翻译的核方法 

1.8用于统计机器翻译的机器学习 

1.8.1翻译作为一个学习问题 

1.8.2使用不精确损失函数的学习 

1.8.3用于统计机器翻译的端到端学习 

1.9结论 

1.10附录 

第一部分:使能技术 

第2章挖掘专利构建平行语料库 

2.1引言 

2.2相关工作 

2.3资源 

2.4对齐过程 

2.4.1句子对齐打分 

2.4.2降低句对齐中的噪声 

2.5专利平行语料库的数据统计 

2.5.1全集和源数据集的比较 

2.5.2基本的统计数据 

2.5.3关于机器翻译的统计数据 

2.6机器翻译实验 

2.6.1机器翻译系统 

2.6.2比较重排序限制 

2.6.3跨板块的机器翻译实验 

2.6.4对原始对齐数据的基于任务的评估 

2.7结论 

第3章多语言名称词典的自动创建 

3.1引言和动机 

3.1.1内容 

3.1.2专有名称和机器翻译 

3.1.3多语种名称实体词典与其他文本分析应用的相关性 

3.1.4存在名称变体的原因 

3.2相关工作 

3.2.1现有的名称词典或建立词典的相关探索 

3.2.2命名实体识别 

3.2.3名称变体的匹配 

3.3新名称的多语言识别 

3.3.1背景:多语言的新闻数据 

3.3.2一个允许多语言的轻量级识别过程 

3.3.3用维基百科扩充名称数据库 

3.4查找已知名称和其形态变体 

3.4.1处理词形变化 

3.4.2查找过程 

3.5人名识别的评价 

3.6名称变体的识别和合并 

3.6.1非罗马字符构成名称的音译 

3.6.2名称变体的“标准化” 

3.6.3(标准化)名称变体的近似匹配 

3.7总结与展望 

第4章多语语料库中命名实体的音译和发现 

4.1引言 

4.2前人工作 

4.3协同排序:命名实体发现的一个算法 

4.3.1时间序列生成和匹配 

4.3.2音译模型 

4.4实验性研究 

4.4.1命名实体发现 

4.4.2初始例子集合规模 

4.4.3时间序列打分函数的比较 

4.5结论 

4.6未来工作 

第5章基于多预处理机制的统计词对齐融合 

5.1引言 

5.2相关工作 

5.3阿拉伯语的预处理机制 

5.4对齐的预处理机制 

5.4.1Giza++对齐 

5.4.2对齐重映射 

5.5对齐融合 

5.6评价 

5.6.1实验数据和评价指标 

5.6.2对齐重映射的贡献 

5.6.3融合特征的贡献 

5.6.4每个单一特征的作用 

5.6.5对齐合并实验 

5.6.6测试集评估 

5.6.7对齐规则分析 

5.6.8错误分析 

5.7后记:机器翻译和词对齐的改进 

5.7.1实验设置 

5.7.2结果 

5.8结论 

第6章用于判别式语言建模的语言学增强的词序列核 

6.1动机 

6.2增加语言学知识的词序列核方法 

6.2.1词序列核方法 

6.2.2因子化表示方法和核组合 

6.2.3因子化的核 

6.2.4实例说明 

6.2.5有理数核的解释 

6.3实验验证 

6.3.1各个因子上的核 

6.3.2因子的整合 

6.3.3与n元模型的比较 

6.4结论和未来的工作 

6.5附录 

…… 

第二部分:机器翻译 

参考文献 

中英文术语

TOP书摘

TOP 其它信息

装  帧:平装

页  数:304

开  本:B5

加载页面用时:78.1449