登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』AI数字人原理与实现

書城自編碼: 4049240
分類:簡體書→大陸圖書→計算機/網絡圖形圖像/多媒體
作者: 方进
國際書號(ISBN): 9787115642851
出版社: 人民邮电出版社
出版日期: 2024-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 98.8

我要買

share:

** 我創建的書架 **
未登入.


新書推薦:
国家名片C919(跟踪十余年,采访百余人,全景式呈现中国大飞机C919,让读者领略到中国航空科技的最新成就)
《 国家名片C919(跟踪十余年,采访百余人,全景式呈现中国大飞机C919,让读者领略到中国航空科技的最新成就) 》

售價:HK$ 140.8
中国数字人产业发展报告
《 中国数字人产业发展报告 》

售價:HK$ 107.8
另一种疯狂:精神疾病的污名与希望之旅(APS终身成就奖获得者斯蒂芬·欣肖教授倾其一生撰写;2018年美国图书节最佳图书奖)
《 另一种疯狂:精神疾病的污名与希望之旅(APS终身成就奖获得者斯蒂芬·欣肖教授倾其一生撰写;2018年美国图书节最佳图书奖) 》

售價:HK$ 63.8
罗尔斯与马克思
《 罗尔斯与马克思 》

售價:HK$ 85.8
珊瑚:美丽的怪物
《 珊瑚:美丽的怪物 》

售價:HK$ 126.5
基于语体的语篇衔接方式的选择性研究
《 基于语体的语篇衔接方式的选择性研究 》

售價:HK$ 74.8
美国政治传统及其缔造者:一部美国版《史记》
《 美国政治传统及其缔造者:一部美国版《史记》 》

售價:HK$ 96.8
孤独谱系障碍评估与干预:从理论到实践  国际经典医学心理学译著
《 孤独谱系障碍评估与干预:从理论到实践 国际经典医学心理学译著 》

售價:HK$ 228.8

 

建議一齊購買:

+

HK$ 201.2
《Xilinx Vivado数字设计权威指南:从数字逻辑、Ve》
+

HK$ 62.3
《Creo 7.0 造型设计实例教程》
+

HK$ 124.2
《中文版3ds Max从入门到精通》
+

HK$ 126.4
《Adobe Dreamweaver 2020经典教程》
+

HK$ 147.2
《Blender 3D保姆级基础入门教程》
+

HK$ 127.5
《网页设计与网站建设自学经典》
編輯推薦:
1.系统性:本书内容系统完整,覆盖数字人技术的全面知识,从基础算法、系统构建到产业应用形成完整知识体系,是一本数字人技术的百科全书。
2.前沿性:本书汇聚了数字人领域的前沿研究成果,涵盖新兴的核心技术如3D人脸重建、神经渲染、多模态融合等,读者可以通过本书掌握技术前沿。
3.实战性:本书案例丰富,每个技术点都提供代码级实现细节,读者可以快速上手,将书中的方法应用于实际场景中。
4.展望性:本书不仅涵盖了数字人技术的过去和现在,还结合行业发展对数字人技术的未来进行思考,为读者描绘数字人的发展蓝图。
5.权威性:本书作者在数字人相关领域有过多年的深入研究,曾参与国家级项目研发,对行业发展格局有独到解析,书写权威性强。
內容簡介:
本书是一部系统介绍 AI 数字人技术的专业著作,涵盖了数字人的定义、发展历程、关键技术及应用实
践等内容,全书共分 3 部分。
在技术基础部分,首先介绍了数字人的定义、发展历程、分类和应用场景,接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理,以及语义理解和知识表示技术如何提升数字人的智能和表现力。
在应用实践部分,带领读者深入探索数字人的创作流程,从内容策划、角色建模到交互设计,每一步都进行了详细讲解。此外,还讨论了数字人的身份认知和技术规范,为数字人的应用实践提供了必要的知识。
在展望未来部分,探讨了数字人技术的未来发展趋势,为读者描绘了数字人与人类和谐共生的美好蓝图。
本书内容丰富,结构清晰,适合对数字人技术感兴趣的读者,包括数字人技术的研究者、开发者、相关行业的从业人员及爱好者等阅读。
關於作者:
方进 资深软件架构师,长期深耕于前沿技术领域,曾在多家知名企业成功推动机器学习平台建设,领导模型创新工作。在自然语言处理、计算机视觉和语音合成等领域积累了丰富的算法研发经验,并对生成式AI技术及预训练语言模型进行了深入研究。密切关注数字人行业,通过开源项目和学术研究,不断提升自己的数字人系统构建技能;精通SD图生成、VITS语音合成等技术,实现了数字人在形象、语音和情感等方面的创新创作。
目錄
技术基础
第 1 章 数字人概述 3
1.1 什么是数字人 3
1.1.1 数字人的定义 4
1.1.2 数字人的特征 4
1.2 数字人的发展历史 5
1.2.1 早期虚拟角色 5
1.2.2 人工智能与数字人的融合 5
1.3 数字人的分类 5
1.3.1 根据外观分类 6
1.3.2 根据用途分类 6
1.3.3 根据智能级别分类 7
1.4 数字人的应用场景 7
1.4.1 娱乐场景 7
1.4.2 教育场景 8
1.4.3 客服场景 9
1.5 数字人技术的发展趋势 9
1.6 数字人的社会影响 10
1.7 本章小结 11
第 2 章 数字人系统的架构 12
2.1 系统的组成模块 12
2.1.1 输入模块 13
2.1.2 内容生成模块 16
2.1.3 渲染模块 19
2.1.4 交互模块 22
2.2 多模态信息融合流程 25
2.2.1 文本生成 25
2.2.2 语音合成 26
2.2.3 表情映射 28
2.2.4 唇型同步 29
2.3 数字人云服务架构 30
2.3.1 云平台选型 31
2.3.2 模型仓库 32
2.3.3 多模态处理 33
2.3.4 在线服务 34
2.4 数字人的数据表示 35
2.4.1 文本数据表示 36
2.4.2 音频数据表示 37
2.4.3 视频数据表示 38
2.4.4 多模态数据表示 38
2.5 本章小结 39
第 3 章 数字人视觉算法 41
3.1 3D 人脸建模 42
3.1.1 建模流程 42
3.1.2 参数调整 45
3.1.3 3D 人脸重建技术 47
3.1.4 建模软件比较 51
3.2 表情分析 54
3.2.1 表情识别 54
3.2.2 表情生成 62
3.2.3 表情跟踪 69
3.2.4 表情融合 74
3.3 姿态估计 81
3.3.1 2D 姿态估计 81
3.3.2 3D 姿态估计 87
3.3.3 手势估计 92
3.3.4 手势生成 96
3.4 唇形检测和口型匹配 99
3.4.1 2D 唇型检测 99
3.4.2 2D 口型匹配 105
3.4.3 3D 唇型检测 109
3.4.4 3D 口型匹配 115
3.4.5 唇型同步评价 119
3.5 本章小结 125
第 4 章 数字人语音合成 126
4.1 语音数字化原理 127
4.1.1 音频采样 127
4.1.2 语音编码 130
4.2 基于拼接的语音合成 137
4.2.1 段音拼接 137
4.2.2 语音跨段平滑 141
4.3 基于深度学习的语音合成 144
4.3.1 LSTM 在语音合成中的应用 145
4.3.2 基于注意力机制的 Tacotron 模型 147
4.3.3 Tacotron2 与 WaveNet 集成 151
4.3.4 基于 Transformer 的语音合成 154
4.3.5 基于非自回归结构的实时语音合成 155
4.4 语音风格迁移 158
4.4.1 声纹提取 159
4.4.2 风格转换 159
4.5 个性化语音合成 162
4.6 语音风格增强 164
4.7 多语种语音合成 165
4.7.1 多语言模型训练 165
4.7.2 语言嵌入 166
4.7.3 语言自适应模型 167
4.7.4 语音后处理 168
4.8 本章小结 169
第 5 章 数字人语义理解 171
5.1 语义解析 172
5.1.1 词法分析 172
5.1.2 句法分析 175
5.1.3 语义分析 179
5.2 情感分析 183
5.2.1 情感识别 184
5.2.2 情感分类 188
5.3 语义编码器 - 解码器 191
5.3.1 编码器架构 191
5.3.2 解码器架构 195
5.3.3 注意力机制 197
5.3.4 应用场景 200
5.4 本章小结 203
第 6 章 数字人知识表示 204
6.1 知识表示基础 205
6.1.1 符号主义知识表示 205
6.1.2 连接主义知识表示 210
4.4 语音风格迁移 158
4.4.1 声纹提取 159
4.4.2 风格转换 159
4.5 个性化语音合成 162
4.6 语音风格增强 164
4.7 多语种语音合成 165
4.7.1 多语言模型训练 165
4.7.2 语言嵌入 166
4.7.3 语言自适应模型 167
4.7.4 语音后处理 168
4.8 本章小结 169
第 5 章 数字人语义理解 171
5.1 语义解析 172
5.1.1 词法分析 172
5.1.2 句法分析 175
5.1.3 语义分析 179
5.2 情感分析 183
5.2.1 情感识别 184
5.2.2 情感分类 188
5.3 语义编码器 - 解码器 191
5.3.1 编码器架构 191
5.3.2 解码器架构 195
5.3.3 注意力机制 197
5.3.4 应用场景 200
5.4 本章小结 203
第 6 章 数字人知识表示 204
6.1 知识表示基础 205
6.1.1 符号主义知识表示 205
6.1.2 连接主义知识表示 210
7.4.4 数字人表情及动作生成实例 265
7.5 语音及视频合成 266
7.5.1 语音驱动的唇型动画 266
7.5.2 体积感渲染 267
7.5.3 数字人语音及视频合成实例 268
7.6 内容编辑和后期制作 268
7.6.1 视频编辑 269
7.6.2 后期特效制作 270
7.6.3 渲染与输出 270
7.6.4 数字人后期编辑与渲染实例 271
7.7 交互设计与内容运营 272
7.7.1 交互设计 273
7.7.2 内容运营策略 275
7.7.3 数字人交互设计与内容运营
实例 278
7.8 本章小结 279
第 8 章 数字人身份认知 280
8.1 数字人的身份定位 280
8.1.1 个体或工具 280
8.1.2 数字人的角色定位 281
8.2 数字人的权利保障 283
8.2.1 知识产权 283
8.2.2 隐私权 285
8.3 数字人的成长与没落 286
8.3.1 持续学习 287
8.3.2 版本迭代 288
8.4 数字人的伦理问题 290
8.4.1 摒弃偏见和歧视 290
8.4.2 透明可解释性 292
8.4.3 尊重多样性 293
8.5 本章小结 295
第 9 章 数字人技术规范 296
9.1 数字人信息安全规范 296
9.1.1 数据隔离规范 297
9.1.2 访问控制规范 298
9.2 数字人内容审核规范 300
9.2.1 内容审核方式 300
9.2.2 违规处理机制 302
9.3 数字人应用管理规范 303
9.3.1 应用接入管理 303
9.3.2 应用监测与审计 305
9.4 本章小结 308
展望未来
第 10 章 人机共生 311
10.1 人机共生的美好时代 311
10.1.1 人机共生的定义与理念 312
10.1.2 人机共生时代的社会生态 312
10.2 数字人与人类的深度互动 313
10.2.1 互动模式的多样性 313
10.2.2 数字人与人类文化的交融 314
10.3 社区共建 315
10.3.1 数字人与人类社区的融合 315
10.3.2 共同学习的平台与机制 316
10.3.3 社区共建与数字人技术的创新 316
10.4 本章小结 317

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.