新書推薦:

《
晚清变局的前夜
》
售價:HK$
74.8

《
白魔之塔(民俗推理大师三津田信三悬疑新作)
》
售價:HK$
49.5

《
5秒法则:重拾改变生活的勇气
》
售價:HK$
63.8

《
睡虎地秦简普及本
》
售價:HK$
327.8

《
资本的全球化:近代上海外商证券市场兴衰史(1843-1941)
》
售價:HK$
107.8

《
纯粹理性批判 德国哲学家康德代表作 西方哲学史的里程碑著作 著名翻译家蓝公武经典译本
》
售價:HK$
138.6

《
惨痛的胜利:第一次世界大战中法国的战略和作战行动
》
售價:HK$
184.8

《
机器时代:技术如何改变我们的工作和生活
》
售價:HK$
63.8
|
| 編輯推薦: |
技能+实战:从数据获取、标注到优化,掌握DeepSeek、语言、绘画、语音等前沿模型训练。 8大领域应用:政务、教育、交通、智驾、医疗、法律、金融、农业,助你快速将AI技术转化为商业价值。 超值赠送:130多分钟教学视频+43个精选素材文件+21个效果展示文件+30组实用AI提示词+168页的PPT教学课件+23个AI工具使用链接+30个AI智能体+工作流实战技巧+42个DeepSeek+提示工程应用方法+45个大语言模型商业应用实操案例。
|
| 內容簡介: |
本书是一本全面且系统的 AI 训练师指南,旨在帮助读者掌握从基础理论、常用技能到商业应用的各项 AI 技巧。本书内容沿两条核心主线展开,为读者搭建扎实的学习与实践框架。來源:香港大書城megBookStore,http://www.megbook.com.hk 技能线:全面覆盖 AI 模型训练的关键技能,从基础的 AI 入门知识、模型部署、数据获取、数据标注、模型微调,到进阶的语言模型训练、绘画模型训练、语音模型训练,再到 AI 模型的商业应用,层层递进,确保读者能够系统掌握 AI 训练的核心功能与应用技巧。 案例线:精心设计多个领域的商业应用案例,包括政务、教育、交通、智驾、医疗、法律、金融和农业等,将理论知识融入实际业务场景,提升读者解决实际问题的能力。 本书内容深入浅出,实例丰富多元,适合对 AI 技术感兴趣、希望成为 AI 训练师的初学者,以及人工智能与科技、政务、教育、交通、医疗、金融、法律以及农业等各个领域的从业人员。无论是个人学习提升,还是作为培训机构和高等院校的教学参考,本书都能提供全方位的知识支持和实践指导。
|
| 關於作者: |
谷建阳,人工智能工程师、AI训练师:具备卓越的技术实力和丰富的实践经验,能够熟练地运用各种工具进行AI模型训练,为复杂的应用场景提供精准、高效的解决方案。 AI商业顾问、应用师:深耕政务、教育、交通、智能驾驶、医疗、法律、金融、农业等领域,曾策划并提供多套行业解决方案,推动AI技术跨领域融合。 AI图书兼教材作者:著有《AI训练师手册:算法与模型训练从入门到精通》等书,其著作被多所高校采用为教材。 贾一琦,计算机与软件工程双学位获得者:本科毕业于加拿大特伦特大学计算机信息系统专业,硕士毕业于北京理工大学软件工程专业。 职业教育研究者与实践者:致力于研究职业教育、校园信息化建设、继续教育、国际交流合作等相关课题。《高职院校国际交流与合作现状研究》课题获河北省人力资源和社会保障厅三等奖,《大数据时代职业技能人才培养模式路径研究》课题获河北省人力资源和社会保障厅一等奖。
|
| 目錄:
|
目录
CONTENTS
第1篇? AI基础
第1章? AI入门:认识人工智能模型训练
1.1 基础入门:了解人工智能与模型训练
1.1.1? 为什么要学人工智能
1.1.2? 人工智能是如何发展起来的
1.1.3? 人工智能的核心逻辑是什么
1.1.4? 什么是模型,模型是怎么训练的
1.1.5? 什么是模型量化与模型蒸馏
1.2 AI大模型:工作逻辑解析
1.2.1? 了解GPT模型的工作原理
1.2.2? GPT为什么能够获得成功
1.2.3? AI强化学习解决大模型推理问题
1.2.4? RAG检索技术解决大模型幻觉问题
1.2.5? 神经网络是AI模型训练的核心技术
1.2.6? Transformer催生出一切AI大模型
1.3 DeepSeek:探究其特性与应用
1.3.1? DeepSeek为什么爆火
1.3.2? DeepSeek的6种使用途径
1.3.3? DeepSeek的逻辑推理能力
1.3.4? DeepSeek的联网搜索能力
1.3.5? DeepSeek的商业应用案例
本章小结
课后实训
第2章? 模型部署:在本地使用DeepSeek
2.1 模型安装:DeepSeek本地部署
2.1.1? 部署前的准备工作
2.1.2? 安装Python依赖项
2.1.3? 下载与安装Ollama
2.1.4? 下载DeepSeek模型
2.1.5? 试运行DeepSeek模型
2.1.6? 配置Cherry Studio前端界面
2.2 插件部署:DeepSeek扩展应用
2.2.1? 安装Page Assist插件
2.2.2? 配置Page Assist插件
2.2.3? 测试DeepSeek模型
本章小结
课后实训
第3章? 数据获取:构建AI模型的知识库
3.1 数据与模型:看懂AI训练中的核心关联
3.1.1? 通俗解读模型训练中的数据集
3.1.2? 获取公开数据集的常用途径
3.1.3? 生成高质量的模型微调数据集
3.2 搭建知识库:构建大模型的训练数据集
3.2.1? 下载并安装AnythingLLM
3.2.2? 配置AnythingLLM
3.2.3? 上传私有的训练数据集
本章小结
课后实训
第4章? 数据标注:引导模型学习提升性能
4.1 数据标注:大模型的“智能基因编辑师”
4.1.1? 数据标注的概念与技术原理
4.1.2? 数据标注在大模型中的作用
4.2 MakeSense:图像数据标注实战指南
4.2.1? 选择打标任务类型
4.2.2? 创建和添加自定义标签
4.2.3? 给图像数据打标
4.2.4? 修改标注项目的名称
4.2.5? 导出打标数据文件
本章小结
课后实训
第5章? 模型微调:让AI训练效果达到预期
5.1 微调的本质:让模型“听懂”领域语言
5.1.1? 揭开模型微调的神秘面纱
5.1.2? 微调与长文本、知识库、预训练的区别
5.1.3? 模型微调的工具和基本流程
5.2 OpenAl Platform:GPT模型微调技巧
5.2.1? 模型是否真的需要微调
5.2.2? 训练数据准备规范
5.2.3? 登录OpenAl Platform平台
5.2.4? 创建微调模型并上传训练数据
5.2.5? 模型微调的超参数配置策略
本章小结
课后实训
第2篇? 模型训练
第6章? 语言模型训练:高效赋能各业务场景
6.1 使用Page Assist训练DeepSeek
6.1.1? 配置文本嵌入模型
6.1.2? 创建知识库
6.1.3? 添加提示词
6.1.4? 测试模型效果
6.2 使用Cherry Studio训练DeepSeek
6.2.1? 添加嵌入模型
6.2.2? 创建知识库
6.2.3? 添加文件并进行向量化处理
6.2.4? 搜索知识库
6.2.5? 引用知识库生成回复
本章小结
课后实训
第7章? 绘画模型训练:创意生成与视觉设计
7.1 使用SD-Trainer训练LoRA模型
7.1.1? LoRA模型简介
7.1.2? 安装SD-Trainer训练器
7.1.3? 准备与整理训练数据集
7.1.4? 使用WD标签器标注数据
7.1.5? 设置底模文件和数据集路径
7.2 使用Stable Diffusion测试模型效果
7.2.1? 部署训练好的LoRA模型
7.2.2? 使用LoRA模型实现文生图
本章小结
课后实训
第8章? 语音模型训练:智能声音克隆与处理
8.1 使用weights训练语音模型
8.1.1? 认识与登录weights平台
8.1.2? 设置模型的详细信息
8.1.3? 上传音频数据集并训练模型
8.2 使用AI模型克隆声音制作音乐MV
8.2.1? 克隆声音唱歌
8.2.2? 剪辑音频与视频素材
8.2.3? 智能识别歌词
本章小结
课后实训
第3篇? 商业应用
第9章? 政务与教育:AI赋能治理与教学创新实践
9.1 政务与教育领域的AI模型训练要点
9.1.1? 数据隐私防护
9.1.2? 多模态融合
9.1.3? 数据动态脱敏
9.2 政务领域的AI模型训练商业应用场景
9.2.1? 公共服务优化
9.2.2? 政务决策支持
9.2.3? 城市治理升级
9.3 教育领域的AI模型训练商业应用场景
9.3.1? 个性化学习支持
9.3.2? 教学效能提升
9.3.3? 教育硬件赋能
本章小结
课后实训
第10章? 交通与智驾:构建安全高效出行解决方案
10.1 交通与智驾领域的AI模型训练要点
10.1.1? 数据安全与合规
10.1.2? 模型鲁棒性强化
10.1.3? 实时性保障方案
10.2 交通领域的AI模型训练商业应用场景
10.2.1? 智能交通管理
10.2.2? 智慧出行服务
10.2.3? 主动安全防控
10.3 智驾领域的AI模型训练商业应用场景
10.3.1? 感知系统升级
10.3.2? 决策规划突破
10.3.3? 仿真测试革新
本章小结
课后实训
第11章? 医疗与法律:重塑精准诊疗与服务流程
11.1 医疗与法律领域的AI模型训练要点
11.1.1? 数据安全与隐私保护
11.1.2? 持续学习机制
11.1.3? 边缘部署优化
11.2 医疗领域的AI模型训练商业应用场景
11.2.1? 临床诊疗升级
11.2.2? 健康管理创新
11.2.3? 医院管理优化
11.3 法律领域的AI模型训练商业应用场景
11.3.1? 法律文本智能处理
11.3.2? 法律研究赋能
11.3.3? 企业合规管理
本章小结
课后实训
第12章? 金融与农业:驱动智能决策与产业升级
12.1 金融与农业领域的AI模型训练要点
12.1.1? 数据治理
12.1.2? 模型部署与监控
12.1.3? 可解释性突破
12.2 金融领域的AI模型训练商业应用场景
12.2.1? 投资决策智能化
12.2.2? 风险管控升级
12.2.3? 运营效能提升
12.3 农业领域的AI模型训练商业应用场景
12.3.1? 智能经营管理
12.3.2? 资源利用优化
12.3.3? 供应链创新
本章小结
课后实训
|
| 內容試閱:
|
前 言 写作背景 在科技兴国宏伟战略的指引下,人工智能作为科技创新的核心驱动力,正全方位重塑着社会各领域的发展格局。同时,国家出台了多项扶持政策,旨在推动人工智能的技术突破与产业应用,提升国家科技竞争力与经济活力。 2020 年 2 月,人力资源社会保障部办公厅、市场监管总局办公厅、统计局办公室联合将“人工智能训练师”列为新职业并纳入国家职业分类目录。
2021 年 11 月,人力资源社会保障部办公厅、工业和信息化部办公厅联合发布人工智能训练师的国家职业技能标准。
在此背景下,培养掌握前沿 AI 技术的专业人才成为当务之急。然而,众多学习者在探索AI模型训练的道路上遭遇如下阻碍,急需系统性指导资源破局。
(1)基础薄弱,缺乏 AI 基础与模型训练概念,入门困难。
(2)认知碎片化,未形成对模型原理、特性及应用场景的系统认知。
(3)工具使用低效,不熟悉 DeepSeek 等模型的功能与操作方法。
(4)部署技术遇到瓶颈,本地部署 DeepSeek 面临环境配置、依赖冲突难题。
(5)数据处理能力不足,数据质量参差不齐,不懂数据标注,影响训练效果。
(6)训练优化困难,过程耗时且易出现过拟合或欠拟合问题,导致模型输出不符合预期。
(7)应用场景模糊,将技术转化为生产力的路径不清晰。
(8)商业化路径缺失,未建立价值挖掘、效益评估及风险管控体系。
本书特色 在 AI 技术日新月异的今天,很多人怀着对前沿技术的热忱,渴望踏入 AI 训练师领域,却在探索之路上遭遇重重险阻。
为助力广大读者跨越这些障碍,本书应运而生。书中不仅系统梳理了 AI 训练师的知识体系,深入解析了DeepSeek等主流模型的实战技巧,还结合丰富的行业应用场景,为读者呈上一份全面且翔实的学习指引,让读者在 AI 训练学习之旅中少走弯路,稳步前行。本书特色如下。
(1)系统知识架构:本书构建起了从 AI 基础理论到模型训练、部署、应用的完整知识体系。详尽阐述模型训练原理,深入分析 DeepSeek 等模型特性,搭配丰富示例,助力读者夯实基础,逐步进阶,成为 AI 训练领域的行家里手。
(2)应用案例丰富:精心设计政务、教育、交通、智驾、医疗、法律、金融和农业等多行业的实战案例,读者可以沉浸式学习如何针对不同的业务场景精准定制模型训练方案,有效提升模型性能,切实解决实际问题,积累项目实践经验。 (3)深度工具解析:对Python、Ollama、Page Assist、Cherry Studio、AnythingLLM、OpenAI Platform、SD-Trainer、MakeSense、Weights、LiblibAI 等前沿 AI 工具进行深度剖析,从安装部署到核心功能应用,手把手指导读者熟练掌握操作技巧,充分发挥工具效能,提升工作效率。
(4)精彩视频演示:配套系列精讲视频,共计 130 多分钟,动态呈现复杂概念、关键操作流程及案例实现过程。读者在遇到晦涩难懂的文字描述时,可用手机扫码观看视频,如同老师亲临教学现场,直观感受每一步细节,轻松攻克学习难点。
(5)超值学习资料:为激发读者学习热情,我们提供丰厚的配套资料,涵盖同步教学视频、AI提示词、配套素材和效果文件、AI 工具资源链接、PPT 等,全方位拓展读者视野,助力读者持续进阶。
本书是 AI 训练师的全方位成长指南。通过精心打造的知识架构,深度契合读者需求,从基础入门到项目实战,全方位助力读者跨越学习障碍。
丰富的行业案例解析,搭配详尽的操作演示,让复杂技术变得触手可及。无论您是初学者还是进阶工程师,都能从中汲取知识养分,开启 AI 训练师职业生涯的新篇章!
教学资源
特别提示 (1)版本更新:本书在编写时,是基于当前各种 AI 工具和网页平台的界面截取的实际操作图片,但本书从编辑到出版需要一段时间,这些工具的功能和界面可能会有变动,读者在阅读时,请根据书中的思路举一反三进行学习。
其中,Python 的版本为 3.13.3、Ollama 的版本为 0.6.8、Cherry Studio 的版本为 v1.2.10、Page Assist 的 版 本 为 1.5.12、AnythingLLM 的 版 本 为 1.8.1-r2、SD-Trainer 的版本为 v1.12.0、Stable Diffusion WebUI 的版本为 1.8.0、剪映的版本为 6.0.1。
(2)提示词:也称为文本提示(或提示)、文本描述(或描述)、文本指令(或指令)、关键词或“咒语”等。需要注意的是,即使是完全相同的提示词,AI 模型每次生成的文案、图像或视频内容也会有差别,这是模型基于算法与算力得出的结果,是正常现象。
作者服务 本书由谷建阳、贾一琦编著,特别感谢参与编写整理的苏高等人。由于编者知识水平有限,书中难免有疏漏之处,恳请广大读者批评指正。
|
|