登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書

『簡體書』大模型核心原理与企业落地实践

書城自編碼: 4117627
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: 林学森、吴锋、王劲涛、代声馨
國際書號(ISBN): 9787302687948
出版社: 清华大学出版社
出版日期: 2025-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 108.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
非洲:考古学的视角(国际知名人类学家、非洲研究专家高畅教授作品。)
《 非洲:考古学的视角(国际知名人类学家、非洲研究专家高畅教授作品。) 》

售價:HK$ 96.8
日本姓名的历史学
《 日本姓名的历史学 》

售價:HK$ 55.0
积极谈判(沟通力系列) 别害怕冲突 沟通力系列
《 积极谈判(沟通力系列) 别害怕冲突 沟通力系列 》

售價:HK$ 63.8
长寿的吃法:古风村的四季养生食谱
《 长寿的吃法:古风村的四季养生食谱 》

售價:HK$ 74.8
江南以南:被湮没的严州府(火与风丛书)
《 江南以南:被湮没的严州府(火与风丛书) 》

售價:HK$ 107.8
拍出绝世人像 专业摄影师的闪光灯布光技法解密
《 拍出绝世人像 专业摄影师的闪光灯布光技法解密 》

售價:HK$ 140.8
远涉重洋:欧亚贸易与商业公司的崛起(一部近代全球贸易的形成史!欧洲商业公司何以横扫东方传统商业组织?西方主导世界背后被低估的组织革命。跨学科的比较史学杰作,开拓性阐释欧亚远程贸易竞争与制度迁移。)
《 远涉重洋:欧亚贸易与商业公司的崛起(一部近代全球贸易的形成史!欧洲商业公司何以横扫东方传统商业组织?西方主导世界背后被低估的组织革命。跨学科的比较史学杰作,开拓性阐释欧亚远程贸易竞争与制度迁移。) 》

售價:HK$ 107.8
梁晓声说聊斋 茅盾文学奖得主梁晓声为你揭秘《聊斋》中隐藏的社会规则
《 梁晓声说聊斋 茅盾文学奖得主梁晓声为你揭秘《聊斋》中隐藏的社会规则 》

售價:HK$ 64.9

編輯推薦:
(1)顶尖团队倾力打造。集结清华、华为、腾讯等一线科技巨头的实战经验,揭秘大语言模型从理论到实践的完整旅程。独家呈现业界领先团队的技术创新与工程实践精华,让您站在技术巨人的肩膀上。
(2)深入浅出的核心洞察。突破技术“黑箱”,层层解密大模型背后的核心原理。采用“知其然,知其所以然”的教学理念,构建坚实的理论基础,助力您在AI浪潮中把握先机。
(3)零门槛学习体验。通俗易懂的叙述风格,丰富的图表与数据支持,循序渐进的知识体系,让零基础读者也能轻松驾驭前沿AI技术,快速跨越学习门槛。
(4)实战导向的系统方法。提供完整的大模型开发路线图,从理论框架到工程实践,再到产品落地,全方位覆盖,助您快速掌握大模型应用开发的核心技能,打造个人竞争力。
內容簡介:
全书分两大篇。第 1 篇原理篇(第 1、2 章),尝试引导读者共同探索和揭秘研发领域大模型背后的核心原理,以使读者“既知其然,又知其所以然”,并为后续章节的学习打下坚实的基础。从概率、最优化等基础理论入手,进而深入浅出地阐述 Transformer、神经元等大模型的核心组成元素,以及评估方法、数据工程建设等通用能力的建设。针对技术细节,采用通俗易懂的行文风格,并辅以大量的图表和数据,“零基础”的读者也可以高效地学习。第 2 篇应用实践篇(第3 ~ 8章),是产业界最新实践成果的总结。选取代码生成、代码转换、知识问答、推理加速、运维运营等研发大模型领域的高频业务作为剖析对象,详细展示作者在针对这些问题时的端到端思考,包括设计理念、关键技术瓶颈、解决方案及落地结果等。 來源:香港大書城megBookStore,http://www.megbook.com.hk
无论你是初学者还是行业专家,都能在本书中找到宝贵的知识和实用的技巧,本书将帮助你在大模型技术的浪潮中乘风破浪。
關於作者:
林学森,清华大学领军博士研究生,香港中文大学硕士研究生。具有20 年人工智能、操作系统、软件工程等领域的研究与创新经验。先后在多家世界500强企业担任首席架构师、首席技术规划、研发部长、软件LAB主任等研发和管理一线岗位,目前在华为公司承担某核心领域首席技术专家,AI辅助研发总体技术组副组长等工作。著有《深入理解Android内核设计思想》、《机器学习观止-核心原理与实践》等畅销作品。已被翻译出版到多个国家和地区,曾获工信部出版集团最佳图书等奖项。
吴锋,本科毕业于华中科技大学自动化与人工智能学院,博士毕业于华中科技大学自动化与人工智能学院,在南洋理工大学 Cyber Security Lab 从事博士后访问工作。分别在华为2012实验室、蚂蚁国际事业群、腾讯平台与内容事业群担任高级工程师和技术专家,从事软件成分分析、微服务架构与设计、软件治理、数据治理、人工智能与大模型在研发流程、内容审核等领域的应用落地,有着丰富的理论研究与工程实践经验。发表论文20余篇,google 引用量 500 ,申请和授权中国发明专利10余项。
王劲涛,清华大学电子工程系教授,中国电子学会会士,中国通信学会会士。主要研究领域为宽带无线通信、无线光通信、智能频谱感知、网络融合等。获国家科技进步奖一等奖、北京市科学技术奖一等奖、中国通信学会青年科技奖、国际电联信息社会世界峰会(WSIS)冠军奖等多项科研奖励。
代声馨,于四川大学计算机学院获得工学博士学位。曾在华为2012实验室担任高级工程师,从事人工智能、计算机视觉等相关研发工作。现为四川大学计算机学院讲师,主要研究方向为人工智能、嵌入式系统与软件工程。主持国家自然科学基金项目1项,四川省自然科学基金项目1项,四川省科学基金项目课题2项。获得吴文俊人工智能科学技术奖三等奖一项。
目錄
第1篇 原理篇
第1章 人工智能概述 002
1.1 人工智能的定义 002
1.2 人工智能发展简史 003
1.2.1 史前文明,曙光初现(1956年之前) 004
1.2.2 初出茅庐,一战成名(1956—1974年) 008
1.2.3 寒风凛冽,首次入冬(1974—1980年) 011
1.2.4 卷土重来,威震八方(1980—1987年) 012
1.2.5 失望弥漫,再度入冬(1987—1993年) 014
1.2.6 重出江湖,渐入佳境(1993年至今) 016
1.3 自然语言处理和大语言模型 018
1.3.1 自然语言处理 018
1.3.2 大语言模型 037
第2章 大模型的数学基础 039
2.1 微分学 039
2.1.1 链式求导法则 039
2.1.2 对数函数求导 039
2.1.3 梯度和梯度下降算法 040
2.2 线性代数 041
2.2.1 向量 041
2.2.2 矩阵拼接 046
2.2.3 特征值和特征向量 053
2.2.4 几何变换 054
2.3 概率论 056
2.3.1 概率分布 056
2.3.2 先验概率和后验概率 058
2.3.3 最大似然估计 059
2.3.4 贝叶斯法则 060
2.4 统计学 061
2.4.1 数据的标准化和归一化 061
2.4.2 标准差 062
2.4.3 偏差和方差 062
2.4.4 协方差和协方差矩阵 063
2.5 深度神经网络基础 064
2.5.1 神经元 064
2.5.2 激活函数 067
2.5.3 前向传播和后向传播算法 072
2.5.4 损失函数 077
2.6 Transformer机制详解 084
2.6.1 Transformer简介 084
2.6.2 分词及向量化 085
2.6.3 位置编码 086
2.6.4 自注意力和多头注意力 087
2.6.5 残差连接和层归一化 089
2.6.6 Transformer小结 090
2.7 其他 093
2.7.1 训练、验证和测试数据集 093
2.7.2 过拟合和欠拟合 096
2.7.3 奥卡姆剃刀原则 097
2.7.4 信息熵 098
第2篇 应用实践篇
第3章 大语言模型与检索增强生成技术 102
3.1 检索增强生成背景 102
3.2 检索增强生成技术框架 102
3.2.1 信息检索 104
3.2.2 提示工程 111
第4章 基于大语言模型的智能问答助手 114
4.1 文档离线预处理与存储 114
4.1.1 格式化 115
4.1.2 切割 115
4.1.3 向量化与存储 119
4.2 联网在线预处理与存储 122
4.3 在线 QA 服务 123
4.3.1 用户问题向量化 124
4.3.2 Prompt 组装 124
4.3.3 问答召回 124
4.4 长记忆与多轮对话 125
4.5 归因与可解释性 128
4.6 评测 129
4.7 用户反馈 131
4.8 待解决的系列问题 131
第5章 基于大语言模型的智能数据助手 134
5.1 数据标准化 135
5.2 工具 140
5.3 案例 143
第6章 基于大语言模型的鸿蒙代码转换探索 145
6.1 背景概述 145
6.2 问题剖析 145
6.3 探索破题 150
6.3.1 总体思路概述 151
6.3.2 基于“知识体系”的数据工程建设 152
6.3.3 针对被转换对象“庖丁解牛” 155
6.3.4 提取典型问题模式,利用关键技术“各个击破” 157
6.3.5 不断优化“反馈回路”,缓解工程复杂性 159
第7章 大语言模型的推理加速 161
7.1 引言 161
7.2 推理加速技术原理 165
7.2.1 推理计算与显存分析 165
7.2.2 模型压缩 169
7.2.3 计算加速 181
7.2.4 技术总览 198
7.3 推理加速框架 199
7.3.1 vLLM 199
7.3.2 TGI 206
7.4 推理加速工程实践 209
7.4.1 Llama3 在vLLM 框架上的推理 209
7.4.2 Llama3 在TGI框架上的推理 211
7.4.3 推理测试 212
第8章 大语言模型的运维与持续优化 223
8.1 运维背景 223
8.2 链路追踪 224
8.3 数据管理与测试用例管理 236
8.3.1 Web 数据集管理 236
8.3.2 SDK 数据集管理 236
8.3.3 数据集版本管理 237
8.3.4 few-shot 动态管理 238
8.4 一站式评测 239
8.4.1 评测 239
8.4.2 单元测试 241
8.4.3 回归测试 241
8.4.4 流量录制回放测试 241
8.4.5 Agent/Tool 评测 242
8.4.6 RAG 评测 244
8.5 Prompt管理 246
8.6 监控告警 248
8.6.1 过滤器 248
8.6.2 监控 248
8.7 部署 249
8.7.1 框架 249
8.7.2 k8s 部署 250
参考文献 253
內容試閱
从零基础开始,带你直击AI大模型的本质
一本深入浅出,大家都看得懂的AI大模型教材
现在是2025年初,人工智能发展到了什么程度?
ChatGPT写的本书序言
上面是作者让ChatGPT编写的本书序言,用时不到1分钟。
乍一看,似乎像那么回事,或者说相比于3年前的AI水平,这种实时的写作水平几乎是不可想象的。
这说明,过去的几年是AI技术呈井喷式发展的黄金期。值得一提的是,这种“黄金期”在AI近70年(从1956年达特茅斯会议开始计算)的发展历史中,还发生过好几次。每一次人们都“膨胀”地认为,人类已经无限接近“通用人工智能”,然后就是跌落谷底,周而复始。因而很多人这次多了些许谨慎:以大模型语言(Large Language Model,LLM)为典型代表的本轮“黄金期”,会重蹈历史的覆辙吗?
没有人可以精准预测未来,所以上述问题的答案暂时不得而知。
但可以肯定的是,相比于历史上的任何一个发展周期,LLM确实给大家带来了更多的希望。
首先是“方法”上的希望。人工智能的流派很多,如果要把它们粗略地划分为两类,那么可能是“逻辑类”和“数据类”。前者主要以数学为支撑,主打精确的逻辑推理,因而可解释性强,可靠度高;后者的“主角”则是数据,并基于数据来构建一系列支撑框架。
这二者孰强孰弱,孰优孰劣?
作者认为,短期内可能会偏向“数据类”,长期则可能是“逻辑类”渐走渐强。
这是因为针对诸如“人工智能”这种复杂系统,至少到现阶段为止,人类还无法掌控其本质原理,也就难以给出精确的数学描述。历史上以“逻辑推理”为核心的AI流派,都无一不是“昙花一现”,因为这个世界 “千变万化”。如果只是想以“上层的运行规则”来描述它,不难理解需要“遍历的场景”将是无穷无尽的,所以失败是必然的。
“数据类”的方法则依托人类在真实世界中所产生的各种“记录”,然后让AI“自我学习”。换句话说,没有人知道“智能的数学公式”是什么,取而代之的是大模型背后的“函数拟合”。这种方法与人类的学习过程似乎也是“不谋而合”的,只不过它们在具体的“数据构建”和“训练方法”上存在差异。
当然,简单有效的“数据类”方法也有先天不足。首先是“浪费”。大模型动辄百亿甚至千亿级参数,TB级的训练数据,以及需要数万甚至数十万GPU共同参与的训练计算过程,原因在于我们无法准确掌握“智能背后本质的数学描述”,只能通过一轮又一轮的参数迭代更新,“逼近”可能的“最优解”。这是一种无奈之举,也必然导致各种“浪费”。
其次是“涌现”的希望。当前的AI是通过“数据堆出来”的,所以一个悲观的判断就是,它只能解答从“数据”中学习过的“案例”,至于人类引以为傲的逻辑推理类问题, AI给出准确回答则是“天方夜谭”。然而,近两年研究人员惊喜地发现,当参数规模达到一定量级以后,原本“蠢萌”的大模型突破就“化茧成蝶”蜕变了。不仅在原先的各项任务上出现了指数级的能力增长,而且出现了神奇的“推理”能力。虽然这种“推理”略显稚嫩,但是给予了我们新的期许。
另外,“实践是检验真理的唯一标准”。AI除了带给我们上述新的希望外,也给各行各业的发展注入了新的活力。一种乐观的说法是,以深度学习和大模型为代表的AI技术,有可能是下一轮“康波经济周期”的核心动力。作者所在的公司是一家五百强企业,涉及业务范围较广。我们公司也在积极地拥抱大模型,并尝试将其融入公司的各个角落中。“是骡子是马,总归得拉出来遛遛”,特别是面向研发领域,我们在近几年开展了一系列大规模的AI实践工作。
在“遛马/骡”的过程中,我们逐步掌握了大模型越来越多的“秉性脾气”。这些经验和教训,应该也可以为广大读者学习和应用大模型技术提供些许参考。
因而就有了这本书的诞生。
致谢
感谢清华大学出版社的编辑文怡等,你们的专业态度和处理问题的人性化,是所有作者的“福音”。
感谢清华大学王劲涛、孙智等老师给予我细致入微的指导和帮助。
感谢我的家人林进跃、张建山、林美玉、杨惠萍、林月明,没有你们的鼓励与理解,就没有本书的顺利出版。
感谢我的妻子张白杨的默默付出,是你在工作之外还无怨无悔地在照顾着两个孩子,才让我有充足的时间和精力来写作。
感谢所有读者的支持,是你们赋予了我写作的动力。另外,因为个人能力和水平有限,书中难免会有不足之处,希望读者不吝指教,一起探讨学习。联系方式是:tupwenyi@163.com。
林学森
2025年2月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.