新書推薦:

《
古代晚期地中海世界贵族女性权力研究
》
售價:HK$
174.9

《
甲骨文词典
》
售價:HK$
748.0

《
明清人物十五讲(央视《百家讲坛》“开坛元勋”、著名历史学家阎崇年,讲述明清两代15个人物的命运沉浮
》
售價:HK$
107.8

《
旗袍心理文化探微
》
售價:HK$
96.8

《
虚拟社会:元宇宙及后人类体验新疆域
》
售價:HK$
75.9

《
一病一方:家庭实用中药方剂—医食同源,药食同用
》
售價:HK$
61.6

《
中国古代小说在东亚的传播影响(全三卷)
》
售價:HK$
580.8

《
盛夏之死 刘子倩译本
》
售價:HK$
42.9
|
| 內容簡介: |
|
本书不同于其他大模型的书,力求用形象生动的语言和图文并茂的形式,描述大模型的来龙去脉。从大模型的产生,大模型的演变过程,大模型的核心技术和基础架构,到大模型的应用场景,大模型面临的挑战和问题,大模型的发展趋势,给读者一个大模型的全貌。本书既适合入门者快速走进大模型,又可以为人工智能领域的大学生,研究生,创业者和研发人员提供有价值的参考和指导。
|
| 關於作者: |
|
马平,北京航空航天大学软件学院副教授,主持多项基金项目,出版多种教材,出版方向:人工智能方向。
|
| 目錄:
|
第1章 大模型的由来1 1.1 什么是大模型1 1.1.1 大模型的定义1 1.1.2 有哪些类型的大模型4 1.2 大模型发展的三个阶段和三次飞跃6 1.2.1 萌芽期6 1.2.2 沉淀期7 1.2.3 爆发期9 1.3 大模型带来的机会14 1.3.1 行业应用遍地开花14 1.3.2 商业智能落地16 1.3.3 个性化服务提升18 1.3.4 教育与培训赋能20 第2章 从深度学习到大模型29 2.1 什么是深度学习29 2.1.1 深度学习的由来29 2.1.2 深度学习的定义33 2.1.3 深度学习的应用领域35 2.2 大模型用了深度学习的哪些技术37 2.2.1 深度神经网络37 2.2.2 激活函数38 2.2.3 损失函数39 2.2.4 优化算法40 2.3 神经网络模型向大模型的发展40 2.3.1 CNN40 2.3.2 RNN41 2.3.3 Transformer42 2.3.4 多模态模型44 2.3.5 扩散模型45 2.4 大模型的建模技术47 2.4.1 大模型的预训练47 2.4.2 大模型的微调50 2.4.3 大模型的推理51 第3章 大模型的架构―Transformer54 3.1 Transformer的提出54 3.1.1 传统模型的限制54 3.1.2 Transformer模型的引入55 3.2 Transformer的优势56 3.2.1 并行计算56 3.2.2 长距离依赖建模58 3.2.3 模块化设计58 3.3 Transformer的自注意力机制58 3.3.1 自注意力机制的提出58 3.3.2 自注意力机制的三个阶段59 3.3.3 多头自注意力机制60 3.4 Transformer的架构61 3.4.1 基础Transformer架构61 3.4.2 基于Transformer的BERT62 3.4.3 基于Transformer的GPT63 3.4.4 基于Transformer的T565 3.5 Transformer的最新进展Titans66 3.5.1 Titans是什么66 3.5.2 Titans的三种变体67 3.5.3 Titans的意义与影响69 3.6 Transformer的应用场景70 3.6.1 图像和视频理解70 3.6.2 文本生成78 3.6.3 文本风格迁移79 3.6.4 内容续写79 第4章 大模型的代表―GPT80 4.1 GPT的由来80 4.1.1 GPT的提出80 4.1.2 GPT为何采用Transformer架构82 4.2 GPT的发展历程―从GPT-1到GPT-484 4.2.1 GPT-1―多项语言处理大模型84 4.2.2 GPT-2―多任务学习大模型85 4.2.3 GPT-3―复杂任务与专家知识大模型88 4.2.4 GPT-4―多模态交互大模型89 4.3 GPT的应用场景90 4.4 GPT的发展92 4.4.1 多模态能力的强大92 4.4.2 GPT-O系列的提出94 4.4.3 快思考到慢思考98 第5章 国内外典型的大模型103 5.1 OpenAI的Sora大模型103 5.2 Google的Gemini大模型107 5.3 Meta的LLaMA大模型113 5.4 百度的文心大模型114 5.5 腾讯的混元大模型118 5.6 阿里的通义千问大模型122 5.7 华为的盘古大模型124 5.8 幻方量化的DeepSeek大模型125 5.9 国内外大模型对比129 第6章 大模型的应用领域141 6.1 NLP141 6.2 对话系统与聊天机器人146 6.3 计算机视觉147 6.4 推荐系统150 6.5 自动驾驶152 6.6 医疗健康诊断153 第7章 大模型面临的挑战与对策158 7.1 算力挑战与对策158 7.2 模型架构局限性与对策162 7.3 幻觉问题与对策163 7.4 伦理与安全挑战165 7.5 模型可解释性挑战与对策176 第8章 大模型的未来展望184 8.1 大模型的跨模态融合184 8.2 大模型与智能体的融合187 8.3 大模型的具身智能193 8.4 大模型的开源与推理能力提升195 参考文献197
|
|