新書推薦:

《
萨满文化研究丛书——通古斯人的心智丛(全三册)
》
售價:HK$
351.6

《
帝国潜流:清代前期的天主教、底层秩序与生活世界
》
售價:HK$
105.0

《
鲨鱼大图鉴:世界现生536种鲨鱼完全解读
》
售價:HK$
469.6

《
佛教与晚唐诗(修订本)晚唐诗人的群星闪耀时刻
》
售價:HK$
55.0

《
大模型智能推荐系统:技术解析与开发实践
》
售價:HK$
141.9

《
别字之辨
》
售價:HK$
140.8

《
八段锦 百岁国医大师邓铁涛健康长寿之道
》
售價:HK$
43.8

《
黄帝内经精讲
》
售價:HK$
118.8
|
內容簡介: |
本书旨在提供一份全面、易懂的DeepSeek大模型实战内容,通过深入浅出的讲解,帮助读者快速掌握DeepSeek的核心技术和应用场景。本书不仅涵盖了DeepSeek的技术原理、架构设计和训练方法,还详细介绍了如何通过API调用、本地部署和云服务等方式将DeepSeek集成到实践项目中。此外,本书通过大量实例和案例分析,展示了DeepSeek在不同领域的应用实践,帮助读者更好地理解和应用这一强大的工具。本书图文并茂,理论翔实,案例丰富,适合从事DeepSeek开发的科研人员以及广大的开发者作为技术参考和培训资料,亦可作为高校本科生和研究生的教材。
|
關於作者: |
张成文,北京邮电大学副教授,中国人工智能学会高级会员、中国教育发展战略学会人工智能与机器人专委会理事、中国生物医学工程学会医学人工智能分会委员、中国人工智能产业发展联盟产学研工作组副组长
|
目錄:
|
目 录 第1章 DeepSeek初探1 1.1 大模型的定义2 1.2 从GPT到DeepSeek3 1.2.1 GPT模型的发展脉络4 1.2.2 DeepSeek模型的发展脉络7 1.2.3 技术突破:从全球竞速到本土创新10 1.2.4 应用生态的进化:从工具到生态伙伴11 1.3 DeepSeek的核心能力和独特优势12 1.3.1 核心能力12 1.3.2 独特优势14 1.4 DeepSeek的应用场景16 1.4.1 智能客服16 1.4.2 辅助办公18 1.4.3 智能家居20 1.4.4 医疗诊断21 1.4.5 教育学习22 1.4.6 金融投资24 1.4.7 智能政务24 1.5 DeepSeek带来的机遇25 1.5.1 DeepSeek模型带给个人的机遇26 1.5.2 DeepSeek带给中小企业的机遇28 小结30 第2章 DeepSeek的模型架构32 2.1 DeepSeek-V3/R1模型的架构33 2.2 混合专家35 2.2.1 稠密MoE架构和稀疏MoE架构36 2.2.2 DeepSeekMoE37 2.2.3 无辅助损耗负载均衡39 2.3 多头潜在注意力41 2.3.1 键值缓存简介41 2.3.2 RoPE简介43 2.3.3 传统MHA的缓存机制的不足46 2.3.4 低秩键值联合压缩的注意力机制47 2.4 多Token预测52 2.4.1 块级并行解码策略53 2.4.2 Meta的MTP方法53 2.4.3 DeepSeek的MTP方法54 小结56 第3章 DeepSeek的训练架构57 3.1 DeepSeek的训练58 3.1.1 基础技术58 3.1.2 训练过程61 3.2 DeepSeek在硬件层面的训练亮点62 3.2.1 FP8混合精度训练62 3.2.2 DualPipe算法63 3.3 DeepSeek在算法层面的训练亮点66 3.3.1 组相对策略优化67 3.3.2 知识蒸馏69 3.4 DeepSeek的数据优化手段70 小结72 第4章 高质量提示词74 4.1 提示词概述75 4.1.1 提示词的定义75 4.1.2 提示词的种类76 4.2 新手常见误区和陷阱77 4.3 提示词的设计技巧79 4.3.1 STAR法则:让问题更有条理79 4.3.2 5W2H法则:全面提问的利器80 4.3.3 CO-STAR框架:精准表达需求82 4.3.4 CRISPE框架:激发创意和拓展深度85 4.3.5 BROKE框架:目标导向和持续优化86 4.3.6 借助大模型优化提示词88 4.4 企业层面的提示词应用场景92 4.4.1 传播策略制定92 4.4.2 执行发展制定93 4.4.3 品牌故事生成94 4.4.4 产品定位96 小结97 第5章 面向个人的DeepSeek部署98 5.1 DeepSeek的模型99 5.1.1 DeepSeek模型的常见版本99 5.1.2 DeepSeek模型的版本说明100 5.1.3 DeepSeek模型的开源协议101 5.2 硬件需求和配置建议103 5.2.1 存储精度103 5.2.2 显存占用估算105 5.3 软件环境安装和配置107 5.3.1 Ollama安装107 5.3.2 使用Ollama部署DeepSeek模型111 5.3.3 Ollama常用API113 5.4 DeepSeek模型下载和部署121 5.4.1 Hugging Face社区简介121 5.4.2 模型下载121 5.4.3 常见大模型文件类型125 5.5 使用Web UI构建对话界面126 5.5.1 Open-WebUI126 5.5.2 Hollama129 5.5.3 ChatBox132 小结133 第6章 面向企业的DeepSeek API调用135 6.1 API调用的优势136 6.2 常用DeepSeek API调用方式137 6.2.1 DeepSeek官方开放平台137 6.2.2 DMXAPI144 小结148 第7章 面向企业的DeepSeek云服务部署149 7.1 本地部署与云服务部署的对比150 7.1.1 本地部署的特点150 7.1.2 云服务部署的特点151 7.2 模型推理加速框架152 7.2.1 推理加速框架的必要性153 7.2.2 BladeLLM153 7.2.3 SGLang156 7.2.4 vLLM159 7.3 常用DeepSeek云服务部署方式164 7.3.1 阿里云164 7.3.2 腾讯云171 7.3.3 华为云176 7.3.4 火山引擎181 7.3.5 AutoDL187 小结198 第8章 DeepSeek模型训练199 8.1 常用训练框架200 8.1.1 Unsloth200 8.1.2 TRL201 8.2 DeepSeek模型的SFT训练202 8.2.1 算力租用202 8.2.2 模型下载和部署204 8.2.3 数据预处理207 8.2.4 模型训练208 8.2.5 模型推理210 8.3 DeepSeek模型的GRPO训练212 8.3.1 加载模型212 8.3.2 配置PEFT模型213 8.3.3 数据集准备213 8.3.4 模型训练216 8.3.5 模型推理217 小结219 第9章 DeepSeek的RAG实战220 9.1 用LangChain构建简单的RAG本地系统221 9.1.1 RAG管道构建221 9.1.2 向量数据库构建223 9.1.3 Web页面启动225 9.2 开源DeepSeek RAG应用案例227 9.2.1 Local PDF Chat RAG227 9.2.2 RAG Flow231 小结239 第10章 DeepSeek的Agent实战241 10.1 基于LlamaIndex项目构建简单的智能体应用242 10.1.1 软件安装和模型下载243 10.1.2 构建本地知识库245 10.1.3 实现基于本地知识库的智能体问答246 10.2 基于Swarm框架构建智能体应用250 10.2.1 Swarm框架介绍251 10.2.2 DeepSeek模型接入253 10.2.3 调用外部工具255 10.3 开源Agent应用框架260 10.3.1 Browser Use260 10.3.2 Camel268 小结279 参考文献281
|
|