登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』声纹技术:从核心算法到工程实践

書城自編碼: 3551357
分類:簡體書→大陸圖書→計算機/網絡程序設計
作者: 王泉
國際書號(ISBN): 9787121395291
出版社: 电子工业出版社
出版日期: 2020-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 130.7

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
东方美学口袋书 中国纹样
《 东方美学口袋书 中国纹样 》

售價:HK$ 47.8
唐代中层文官(中华学术·有道)
《 唐代中层文官(中华学术·有道) 》

售價:HK$ 117.6
像冠军一样学习:心理学中的高效学习法
《 像冠军一样学习:心理学中的高效学习法 》

售價:HK$ 70.8
逐利之网:从库克船长到淘金热的太平洋世界
《 逐利之网:从库克船长到淘金热的太平洋世界 》

售價:HK$ 105.6
实用妇科微创手术图谱:机器人与多孔单孔腹腔镜(原书第2版)
《 实用妇科微创手术图谱:机器人与多孔单孔腹腔镜(原书第2版) 》

售價:HK$ 225.6
梦遇 国风拟人插画绘制技法教程
《 梦遇 国风拟人插画绘制技法教程 》

售價:HK$ 155.8
制度变迁视角下的宋代经济社会
《 制度变迁视角下的宋代经济社会 》

售價:HK$ 117.6
生命进化史(增订版)
《 生命进化史(增订版) 》

售價:HK$ 357.6

 

建議一齊購買:

+

HK$ 130.7
《 实时语音处理实践指南 》
+

HK$ 120.2
《 语音信号处理(第3版) 》
+

HK$ 169.0
《 语音识别:原理与应用 》
+

HK$ 262.4
《 人工智能:语音识别理解与实践 》
+

HK$ 117.5
《 Kaldi语音识别实战 》
+

HK$ 104.3
《 PyTorch生成对抗网络编程 》
編輯推薦:
本书的目标读者主要有两类:
在高等院校里,高年级本科生、研究生、博士生,以及教职人员与科研工作者,可以将本书作为声纹技术领域的基础教材。通过学习本书,能够对声纹技术有深入浅出的了解。若是将本书作为大学教材,每章末尾的思考与练习还可以作为课后习题。
在企事业单位里,软件工程师、系统架构师、产品经理等,可以将本书作为一本参考工具书,在设计、实现、部署与声纹有关的产品和服务时,可以快速查阅相关的技术与方法,为自己的工作提供额外的指导。
阅读本书前,读者并不需要具备音频处理、语音识别等领域的相关知识,这部分内容会在第 2 章系统地学习。不过,建议读者在阅读本书前,先了解一些机器学习,尤其是神经网络、深度学习方面的基本概念。尽管这些概念在本书第 3 章里也会提及,但这些并不是本书的重点,所以不会在书中深入讲解。
本书虽然以声纹技术为主线,但是并不仅局限于各种具体的声纹技术,而是会涉及所有与声纹技术相关的基础知识,并且会从工程方面对声纹技术的具体部署进行指导。本书涉及的一些知识点,例如听觉感知、音频传输、流式信号处理、模型量化压缩等,乍看上去与声纹技术并无任何直接关系,但这些都是在声纹领域的实
內容簡介:
这是*本系统性地介绍声纹识别、声纹分割聚类及声纹在语音识别、语音合成、人声分离等领域中应用的技术书。本书内容全面且紧随时代前沿,不仅涵盖了早至 20世纪 60 年代的经典方法,而且以大量篇幅着重介绍了深度学习时代的*技术。本书注重理论与实践的结合,除了配备大量实践案例与习题,还有专门章节介绍声纹技术在实际工程部署方面的诸多课题。本书面向大学与研究机构的学生、教研人员,以及企事业单位从事声纹技术相关工作的工程师、架构师和产品经理等。
關於作者:
王泉,美国谷歌公司资深软件工程师、声纹识别与语言识别团队主管。作者毕业于清华大学自动化系,后取得美国伦斯勒理工学院计算机工程专业博士学位,曾在美国亚马逊公司参与亚马逊智能音箱语音助手Alexa的研发。在谷歌任职期间,作者带领团队将先进的声纹技术部署到了大量产品中,使得谷歌智能音箱成为市面上第一款支持多用户模式的同类产品。此外,作者在声纹识别、声纹分割聚类、人声分离、语音检测、语言识别及语音合成等诸多领域拥有大量专利,发表过多篇重量级论文,并开创了监督式声纹分割聚类及声纹定向人声分离这两个新兴研究方向。作者的工作曾被VentureBeat、TechCrunch、Engadget、CNET等国际著名科技媒体专题报道。
目錄
1 声纹技术的前世今生 1
1.1 什么是声纹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 最早的声纹技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 声纹技术的发展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 声纹技术与音频信号处理 . . . . . . . . . . . . . . . . . . . . . . 5
1.3.2 模板匹配方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.3 早期统计学方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.4 高斯混合模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.5 联合因子分析与 i-vector . . . . . . . . . . . . . . . . . . . . . . . 9
1.4 大变革:深度学习时代的来临 . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 新的机遇:智能语音助手的普及 . . . . . . . . . . . . . . . . . . . . . . . 11
2 音频信号处理基础 14
2.1 欲懂声纹,先学音频 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 声学基础 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.1 语音的产生 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.2 正弦波 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.3 频谱 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.4 听觉与感知 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.5 听觉的非线性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3 音频信号基础概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.1 模拟音频信号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 模拟转数字:采样与量化 . . . . . . . . . . . . . . . . . . . . . . 27
2.3.3 音频编码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.4 音频文件格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.5 动手实践:SoX 程序 . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4 从信号到特征:短时分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.1 传统特征分析的不足 . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.2 分帧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.3 窗函数处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.4 帧叠加与帧采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5 常用的音频特征 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5.1 时域特征 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5.2 从时域到频域:傅里叶变换 . . . . . . . . . . . . . . . . . . . . 45
2.5.3 频谱、倒谱、时频谱和功率谱 . . . . . . . . . . . . . . . . . . . 48
2.5.4 感知线性预测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.5.5 梅尔倒谱系数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.5.6 功率正则化倒谱系数 . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.5.7 动手实践:用 LibROSA 提取 MFCC 特征 . . . . . . . . . . . . 50
3 声纹识别技术 54
3.1 声纹识别:声纹技术的核心 . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.1.1 名称与概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.1.2 按任务分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.1.3 按文本内容分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.1.4 系统流程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2 声纹识别的评价指标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.1 相似匹配 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.2 录入集与验证集 . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2.3 ROC 曲线及曲线下面积 . . . . . . . . . . . . . . . . . . . . . . . 62
3.2.4 等错率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2.5 最小检测代价函数 . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2.6 辨认准确率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3 深度学习之前的方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3.1 早期方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3.2 高斯混合模型方法 . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.3 高斯混合模型-通用背景模型 . . . . . . . . . . . . . . . . . . . . 70
3.3.4 高斯混合模型-支持向量机 . . . . . . . . . . . . . . . . . . . . . 72
3.3.5 联合因子分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3.6 i-vector 方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4 基于深度学习的方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.4.1 关于深度学习的简单介绍 . . . . . . . . . . . . . . . . . . . . . . 79
3.4.2 声纹识别中的神经网络 . . . . . . . . . . . . . . . . . . . . . . . 84
3.4.3 运行时的推理逻辑 . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.4.4 声纹识别中的损失函数 . . . . . . . . . . . . . . . . . . . . . . . 93
3.5 声纹识别中的数据处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.5.1 声纹识别的数据需求 . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.5.2 数据预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.5.3 数据增强 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
3.5.4 多数据集训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.6 声纹验证 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.6.1 验证方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.6.2 分数正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.7 常用数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.7.1 TIMIT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.7.2 VCTK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.7.3 LibriSpeech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.7.4 LibriVox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.7.5 VoxCeleb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.7.6 CN-Celeb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.7.7 BookTubeSpeech . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.7.8 维基百科语音库 . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.7.9 DeepMine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4 声纹识别的工程部署 120
4.1 从模型到产品 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.1.1 模型不等于产品 . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.1.2 软件工程基本概念 . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.2 声纹识别常见工程问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.2.1 录入阶段的工程问题 . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.2.2 识别阶段的工程问题 . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.2.3 语音处理引擎:流式信号处理与计算图 . . . . . . . . . . . . . 131
4.2.4 模型版本迭代 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.2.5 在线代理指标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.3 全设备端部署 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.3.1 部署方式的分类依据 . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.3.2 版本迭代更新 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.3.3 资源限制:设备端的最大挑战 . . . . . . . . . . . . . . . . . . . 141
4.3.4 模型量化技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.4 全服务器端部署 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.4.1 全服务器端架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.4.2 版本迭代更新 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.4.3 负载均衡与故障处理 . . . . . . . . . . . . . . . . . . . . . . . . . 149
4.5 复合式部署 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.5.1 声纹信息的敏感性 . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.5.2 复合式架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.5.3 版本迭代更新 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5 声纹分割聚类技术 156
5.1 分割聚类:更好地理解对话语音 . . . . . . . . . . . . . . . . . . . . . . . 156
5.1.1 关于名称与历史 . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.1.2 常见应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.1.3 常见通用架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.1.4 声纹分割聚类的不同任务类型 . . . . . . . . . . . . . . . . . . . 162
5.2 声纹分割聚类与多说话人识别 . . . . . . . . . . . . . . . . . . . . . . . . 163
5.2.1 声源分离 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
5.2.2 连续声纹识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
5.2.3 说话人转换检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.3 聚类分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.3.1 聚类不等于分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.3.2 在线聚类技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.3.3 离线聚类技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.3.4 基于离线聚类的在线声纹分割聚类 . . . . . . . . . . . . . . . . 178
5.4 二次分割方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.4.1 基于分类的二次分割 . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.4.2 基于隐马尔可夫模型的二次分割 . . . . . . . . . . . . . . . . . 181
5.5 监督式方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.5.1 聚类方法的一些问题 . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.5.2 从传统聚类到监督式方法 . . . . . . . . . . . . . . . . . . . . . . 184
5.5.3 无界交织态循环神经网络 . . . . . . . . . . . . . . . . . . . . . . 187
5.5.4 判别神经聚类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.5.5 置换不变性训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
5.5.6 端到端模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
5.5.7 与语音识别的联合训练 . . . . . . . . . . . . . . . . . . . . . . . 200
5.6 声纹分割聚类的评价指标 . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
5.6.1 评价指标的置换不变性 . . . . . . . . . . . . . . . . . . . . . . . 203
5.6.2 分割聚类错误率 . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
5.6.3 词分割聚类错误率 . . . . . . . . . . . . . . . . . . . . . . . . . . 205
5.6.4 其他指标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
5.7 常用数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
5.7.1 CALLHOME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
5.7.2 NIST SRE 2000 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
5.7.3 ICSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
5.7.4 Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
5.7.5 AMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
6 声纹技术的其他应用 211
6.1 声纹的力量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.2 用于语音识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
6.2.1 语音识别技术概述 . . . . . . . . . . . . . . . . . . . . . . . . . . 212
6.2.2 声纹自适应声学模型 . . . . . . . . . . . . . . . . . . . . . . . . . 213
6.3 用于语音合成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
6.3.1 语音合成技术概述 . . . . . . . . . . . . . . . . . . . . . . . . . . 214
6.3.2 声纹克隆:合成任意说话人的声音 . . . . . . . . . . . . . . . . 218
6.4 用于语音检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.4.1 语音检测技术概述 . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.4.2 个性化语音检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.5 用于人声分离 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
6.5.1 人声分离技术概述 . . . . . . . . . . . . . . . . . . . . . . . . . . 221
6.5.2 定向人声分离 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
6.6 声纹转换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
6.7 声纹还原度测试 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
6.7.1 音频处理的声纹保留性质 . . . . . . . . . . . . . . . . . . . . . . 227
6.7.2 音频编码格式的还原度测试 . . . . . . . . . . . . . . . . . . . . 228
6.7.3 语音合成技术的还原度测试 . . . . . . . . . . . . . . . . . . . . 229
7 声纹技术的未来 231
7.1 概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
7.2 声纹技术的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
7.2.1 对信道变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . 231
7.2.2 对声纹变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . 232
7.2.3 反欺诈 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.3 对更多数据的需求 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
7.3.1 更为多样的数据增强 . . . . . . . . . . . . . . . . . . . . . . . . . 235
7.3.2 用于训练的合成语音 . . . . . . . . . . . . . . . . . . . . . . . . . 237
7.3.3 自动数据采集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
7.4 声纹技术的未来研究方向 . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
7.4.1 对抗学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
7.4.2 多模态说话人识别 . . . . . . . . . . . . . . . . . . . . . . . . . . 240
7.4.3 联邦学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
7.4.4 集成学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
7.4.5 同时完成声纹分割聚类与人声分离 . . . . . . . . . . . . . . . . 245
7.5 结语 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
中英词汇对照 248
参考文献 259
內容試閱
本书缘起
回忆起我在亚马逊工作的那段时光,虽然充实,但也有着很大的压力。我在亚马逊所在的组,是一个倾向于科研而非产品的组,因此相比于大多数亚马逊员工,来自工作环境本身的压力并不是很大。我所感受到的压力,更多是自身知识水平的严重不足导致的危机感。每次与组里的其他成员开会讨论,或者评审他们的代码、文档,都会遇到大量的概念与方法,是我当时难以理解的。而这些概念与方法,很多都是语音识别领域的基础知识。为此,每天下班后,我都会花大量的时间,查阅语音识别方面的教程、文献和网上的文章。然而,由于这些内容大多数都是英文的,对于当时刚刚接触语音识别领域的我来说,阅读起来效率很低。当时的我就十分感慨:如果有一本中文的教程,从基础概念开始,详细地介绍我所需要的领域专业知识,那该有多好。我也试着寻找过中文教程,只不过当时我能够找到的教程,其内容早已严重过时。
后来,我在谷歌成为团队主管,每次招聘新的团队成员,如果该成员没有语音领域相关的背景,那么也会面临着和我曾经入职亚马逊时相同的困境。每次我都会花大量的时间,向新的团队成员介绍音频信号处理和声纹识别相关的背景技术,以及声纹领域的研究前沿成果。
以上这些经历,便是我编写本书的原始动机。对于所有以中文为母语的朋友,我希望本书能够快速地帮助你掌握声纹技术所需要的基础知识,并熟悉最前沿的方法。我希望读者在读完本书之后,再去阅读其他与声纹相关的文章,或者使用与声纹相关的工具时,能够快速理解其核心内容,并通过与本书介绍的概念、方法进行联系和比较,大幅提升自己学习、工作的效率。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.