新書推薦:

《
基于语体的语篇衔接方式的选择性研究
》
售價:HK$
74.8

《
美国政治传统及其缔造者:一部美国版《史记》
》
售價:HK$
96.8

《
孤独谱系障碍评估与干预:从理论到实践 国际经典医学心理学译著
》
售價:HK$
228.8

《
大数据导论(第2版)
》
售價:HK$
75.9

《
帝国时代
》
售價:HK$
206.8

《
现象学的心灵(第三版)(中国现象学文库·现象学原典译丛·扎哈维系列)
》
售價:HK$
107.8

《
近世通儒——纪念沈曾植逝世100周年学术研讨会论文集
》
售價:HK$
184.8

《
光速声波物理学. 1、2、3
》
售價:HK$
494.9
|
編輯推薦: |
计算语言学家。在语言学、数学、计算机科学等学科都有广博而深厚的基础,50多年来从事语言学、数学和计算机科学的跨学科研究,是我国最早从事人工智能、自然语言处理和计算语言学的学者之一。
|
內容簡介: |
本书收集计算语言学核心概念和关键术语100条,涉及计算语言学通论、语音自动处理、词汇自动处理、句法自动处理、语义自动处理、统计自然语言处理、基于神经网络和深度学习的自然语言处理等内容。适合于中文、外语、计算机等专业的广大师生作为更新知识再学习的资料。
本书的读者对象是语言学专业和计算机专业的师生,他们可以使用本书来更新知识,把语言学知识与计算机知识紧密地结合起来。
本书各部分的条目分配如下:
1. 计算语言学通论:例如,自然语言处理、形态自动处理等,共9条。
2. 语音自动处理:例如,自动语音识别、声源滤波器模型等,共6条。
3. 词汇自动处理:例如,最小编辑距离、词性标注集等,共14条。
4. 句法语义自动处理:例如,词例还原、词目还原等,共47条。
5. 统计自然语言处理:例如,隐马尔可夫模型、最大熵模型等,共6条。
6. 基于神经网络和深度学习的自然语言处理:例如,词向量、卷积神经网络等,共10条。
7. 计算语言学应用:例如,机器翻译、信息检索等,共7条。
|
關於作者: |
冯志伟,计算语言学家。在语言学、数学、计算机科学等学科都有广博而深厚的基础,50多年来从事语言学、数学和计算机科学的跨学科研究,是我国最早从事人工智能、自然语言处理和计算语言学的学者之一。
曾任国家语言文字工作委员会语言文字应用研究所,担任计算语言学研究室主任,兼任中国科学院软件研究所研究员。曾任中国语文现代化学会副会长、中国人工智能学会理事、中国科学院自动化研究所国家模式识别重点实验室学术委员会委员,现为国家语言文字应用研究所研究员、博士生导师。出版专著30多部,发表论文400多篇。
1978-1981年在法国格勒诺布尔理科医科大学自动翻译中心,师从法国著名数学家、国际计算语言学委员会主席沃古瓦学习机器翻译,研制了世界上第一个汉语到法、英、日、俄、德等多种外语的机器翻译系统FAJRA。1981年,在中国科学技术信息研究所计算中心担任机器翻译研究组组长,研制了英汉机器翻译系统ECAT、德汉机器翻译系统GCAT、法汉机器翻译系统FCAT、日汉机器翻译系统JCAT。
曾获国家图书奖、中国出版集团优秀图书奖、中华优秀出版物图书提名奖。2006年获奥地利的维斯特奖,2018年获中国计算机学会自然语言处理与中文计算杰出贡献奖。
|
目錄:
|
核心概念篇1
词汇功能语法2
词网13
词向量2
递归转移网络32
多叉多标记树模型(MMT模型)43
概率上下文无关语法55
功能合一语法66
机器翻译75
N元语法模型85
乔姆斯基层级91
人工神经网络100
上下文无关语法(短语结构语法)107
树邻接语法119
数理语言学130
线图剖析法136
依存语法144
伊尔利算法158
意义→文本模型169
优选语义学175
有限状态转移网络185
语言符号的熵196
语言形式模型204
预训练语言模型209
知识本体.223
知识图谱232
自动词义排歧244
自动语音合成254
自动语音识别262
自然语言处理(计算语言学)270
最小编辑距离277
关键术语篇285
成分结构树286
词汇歧义289
词汇增长模型292
词间关系296
词类歧义299
词例还原302
词目还原304
词性标注集305
词语法307
错拼检查更正310
CKY算法313
定子句语法316
范畴语法318
复杂特征321
概率配价模型326
概念依存理论329
感知机32
广义短语结构语法35
汉语拼音音节歧义指数39
合一运算340
花园幽径句343
计量语言学344
计算术语学347
结构歧义.350
卷积神经网络354
框架网络357
扩充转移网络361
链语法364
良构子串表367
家塔鸠语法373
命名实体识别375
PATR语法378
配价语法381
齐普夫定律385
前馈神经网络390
上下文有关语法392
深度学习396
生词增幅递减律398
声源滤波器模型402
书面汉语自动切词404
术语形成经济律405
数据平滑407
特征表示408
谓词论元结构411
文本数据挖掘414
沃古瓦三角形416
协同语言学418
信息自动抽取421
信息自动检索424
循环神经网络426
有限状态语法431
语言符号的递归性434
语义互联网437
语义网络理论441
语义语法46
噪声信道模型48
知网450
智能会话代理454
中文信息处理455
中心语驱动短语结构语法458
自动词性标注462
自动句法分析(计算句法学)463
自动形态分析(计算形态学)466
自动语义分析(计算语义学)468
自动语用处理(计算语用学)470
字符译音472
字母转写474
最大炯模型477
左角剖析法479
左结合语法484
附录489
英汉术语对照489
汉英术语对照491
|
內容試閱:
|
计算语言学(computational linguistics)是用计算机研究和处理自然语言的一门新兴的交叉学科,又叫作自然语言处理(natural languageprocessing)。
由于自然语言处理的研究对象是自然语言,因此,语言学家把它归为语言学的一个分支;由于自然语言处理采用先进的计算机科学技术来研究和处理自然语言,因此,计算机科学家把它归为计算机科学的一个分支;由于自然语言处理要研究自然语言的形式结构和自然语言处理的算法,因此,数学家把它归为应用数学的一个分支。这种情况说明,计算语言学不是一门单纯的学科,而是交叉学科,具有明显的跨学科特点。计算语言学的教学和研究有助于推进当前新文科的建设。
本书属于外国语言文学核心概念与关键术语系列中的一本,通过100条核心概念和关键术语来展示计算语言学的脉络和基本术语体系,便于读者携带和查询,独具特色。
本书收集的100条计算语言学核心概念和关键术语,涉及计算语言学通论、语音自动处理、词汇自动处理、句法自动处理、语义自动处理、统计自然语言处理、基于神经网络和深度学习的自然语言处理等内容,适合语言学专业和计算机专业的师生,他们可以使用本书来更新知识,把语言学知识与计算机知识紧密地结合起来。
本书共收入计算语言学中最能代表学科本质的核心概念30条、最不可或缺的关键术语70条,共计100条。根据系列图书的要求,本书全部术语条目均按中文术语的音序排列,并有英汉术语对照和汉英术语对照。
冯志伟
中国中文信息学会会士
中国人工智能学会理事
奥地利维斯特奖获得者
香港圣弗兰西斯科技人文奖获得者
中国计算机学会NLPCC杰出贡献奖获得者
2024年10月
|
|