登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書

『簡體書』MLIR编译器原理与实践

書城自編碼: 4121788
分類:簡體書→大陸圖書→計算機/網絡程序設計
作者: 吴建明、吴一昊
國際書號(ISBN): 9787302686699
出版社: 清华大学出版社
出版日期: 2025-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 130.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
齐民要术(中小学生阅读指导目录·高中)
《 齐民要术(中小学生阅读指导目录·高中) 》

售價:HK$ 63.8
证券分析(全新升级版)
《 证券分析(全新升级版) 》

售價:HK$ 219.9
海洋明天的样子
《 海洋明天的样子 》

售價:HK$ 75.9
文弱书生:前现代中国的男性气概
《 文弱书生:前现代中国的男性气概 》

售價:HK$ 96.8
宿命之舞.完结篇
《 宿命之舞.完结篇 》

售價:HK$ 54.8
念遥遥 (口碑作者Further古言意难平之作)
《 念遥遥 (口碑作者Further古言意难平之作) 》

售價:HK$ 47.1
大清300年
《 大清300年 》

售價:HK$ 74.8
大学问·亦官亦商:明清时期天津的盐商与社会
《 大学问·亦官亦商:明清时期天津的盐商与社会 》

售價:HK$ 96.8

編輯推薦:
内容翔实:本书不仅讲述MLIR原理,还从MLIR多个相关领域出发,介绍当今流行的MLIR工程项目、核心的MLIR编译器关键技术、实战开发等。
知识点全面:涉及的知识点包括AI框架、LLVM后端编译、芯片、接口通信、底层驱动、操作系统、系统软件、应用软件、AI算法、算子理论、AI框架、汇编语言、编译部署与C/C 、Python语言等。
实践性强:重点介绍如何动手开发,如何优化性能,并介绍了很多典型开发示例。
內容簡介:
MLIR是一个新型的AI编译器,被广泛地应用于各种产品研发中,在企业与学术研究中有很大的影响,但是,目前国内外还找不到MLIR专著,本书试图弥补这个空缺。 來源:香港大書城megBookStore,http://www.megbook.com.hk
本书全面解析MLIR所有主要功能,帮助读者理解MLIR工作原理,以及使用MLIR对深度学习与机器学习进行的优化与部署。全书共11章,包括多用MLIR多层中间表示构建编译器、MLIR编译器基础、MLIR编译器功能模块、MLIR方言技术、TPU-MLIR开发技术分析、MLIR中间表示与编译器框架、MLIR代码生成技术、MLIR的后端编译过程、Buddy-MLIR 工程技术解析、TPU-MLIR开发实践与IREE编译流程与开发实践。各章除了包含重要的知识点和实践技能外,还配备了精心挑选的典型案例。
本书适合从事AI算法、软件、编译器开发,以及硬件开发等专业的工程技术人员、科研工作人员、高校师生、技术管理人员等读者阅读,也可以作为编译器相关专业高等院校的参考用书。
關於作者:
吴建明,博士,毕业于上海交通大学,专业方向是模式识别与智能系统 。 长期从事人工智能芯片设计、TVM/LLVM编译器、AI框架、自动驾驶、计算机视觉 、图像识别、深度学习、摄像头/相机算法、机器学习、人工智能、视频编解码、芯片制造、嵌入式系统、计算机软件等领域的研发工作。主持或参与过30多项产品研发;参与了国家自然基金、上海市科委项目,并在核心期刊发表11篇论文,其中8篇是第一作者,著有《AI芯片开发核心技术详解》《LLVMM编译器原理与实践》《TVM编译器原理与实践》。
目錄
第1章用MLIR构建编译器
1.1MLIR概述
1.2通过创建引入MLIR: 一种Toy方言
1.2.1构建一种Toy方言
1.2.2异构编译器
1.2.3根据算力调整目标
1.2.4MLIR概述
1.3Toy方言IR表示
1.4Toy方言高级转化
1.4.1接口
1.4.2Toy方言形状推理
1.4.3形状推理
1.5方言下译到LLVM
1.6ARM指令SVE、SME在MLIR中的实现方式
1.6.1MLIR基本概念
1.6.2方言子模块构成
1.6.3方言操作
1.6.4什么是区域
1.6.5SVE在MLIR中的实现
1.7ARM上的矩阵乘法
1.7.1向量的外积
1.7.2SVE模式流
1.7.3SME ZA存储
1.7.4SME的实现
1.8MLIR与LLVM中的Affine指的是什么
1.9MLIR在Magma开源软件平台中的应用
1.9.1Magma背景
1.9.2Python Magma系统
第2章MLIR编译器基础
2.1MLIR语言参考
2.1.1高层结构
2.1.2MLIR符号
2.1.3MLIR作用域
2.1.4控制流与SSACFG作用域
2.1.5类型系统
2.1.6方言类型
2.2MLIR方言及运行分析
2.2.1MLIR简介
2.2.2常见的IR表示系统
2.2.3MLIR历史
2.3方言及运行详解
2.3.1方言基本概念
2.3.2运行机构拆分
2.3.3创建新的方言操作
2.3.4加载到MLIR上下文中
2.3.5定义算子
2.3.6创建方言流程总结(使用ODS)
2.4MLIR运算与算子
2.4.1MLIR运算与算子概述
2.4.2运算类(Operation)
2.4.3算子类(Op)
2.4.4MLIR OpBase.td算子类的作用
2.4.5MLIR 运算的构建之路
2.4.6MLIR TableGen后端生成算子代码
2.5MLIR的初步知识
2.6MLIR部署流
2.6.1MLIR部署流程
2.6.2MLIR应用模块
2.7MLIR框架概览
2.8MLIR基本数据结构
2.8.1MLIR基本概念
2.8.2MLIR源代码目录
2.8.3MLIR简易UML类图
2.8.4开发中用到的具体数据结构
2.9MLIR出现的背景与提供的解决方案
2.9.1背景与演进概述
2.9.2解决方案
2.10机器学习编译器: MLIR方言体系
2.10.1基础组件
2.10.2方言体系
第3章MLIR编译器功能模块
3.1深度学习AI编译器MLIR
3.1.1MLIR实现方式
3.1.2MLIR基本概念
3.1.3Op定义方式
3.2CodeGen方言介绍
3.2.1MLIR中CodeGen概述
3.2.2兴趣方言
3.2.3现有管道TensorFlow内核生成器
3.2.4IREE编译器(LLVM目标)
3.2.5IREE编译器 (SPIRV目标)
3.2.6多面体编译器
3.3MLIR编译器DSL技术
3.3.1DSL领域特定语言介绍
3.3.2DSL分类
3.3.3DSL示例
3.3.4DSL与DDD(领域驱动)
3.3.5DSL信息量排查
3.3.6方言流程结构
3.3.7MLIR ODS要点总结
3.3.8DSL技术示例代码演示
3.3.9MLIR源码工程操作分析
3.4调用堆栈、堆栈帧与程序计数器
3.4.1堆栈调用
3.4.2堆叠异常处理
3.4.3返回堆栈调用
3.4.4异常中断与应用
第4章MLIR方言技术
4.1定义方言
4.1.1定义方言概述
4.1.2可丢弃属性验证
4.1.3默认属性与类型分析器输出
4.1.4在运行时定义操作
4.2可扩展方言的实现细节
4.2.1使用Toy语言接入MLIR,最终转换为LLVM IR
4.2.2指定自定义汇编格式
4.3优化MLIR表达式
4.3.1手动匹配重写
4.3.2采用 DRR自动生成匹配与重写函数
4.3.3三种重写格式
4.4通用的转换接口
4.4.1函数内联
4.4.2形状推理
4.5从 MLIR 表达式进行部分下译
4.5.1背景知识(下译与方言转换)
4.5.2部分下译
4.6混合方言表达式下译到LLVM IR
4.7用于机器学习编译器的MLIR CodeGen方言
第5章TPUMLIR开发技术分析
5.1TPUMLIR简介
5.1.1TPUMLIR的工作流程
5.1.2TPUMLIR编译工程
5.1.3TPUMLIR开发环境配置
5.2工具参数介绍
5.3整体设计
5.3.1TPUMLIR分层
5.3.2构建Pass
5.3.3TPUMLIR主要工作模块
5.3.4算子转换样例
5.4神经网络的量化与训练
5.4.1量化技术概述
5.4.2校准技术
5.4.3算法实现
5.4.4可视化工具visual说明
5.4.5图层组
5.4.6划分存储周期
5.4.7GMEM分配
5.4.8TOP方言操作
5.4.9评估验证
5.5QAT量化感知训练
5.5.1QAT量化技术基本原理
5.5.2TPUMLIR QAT实现方案及特点
5.5.3TPUMLIR环境配置方法
5.5.4QAT示例化基本步骤
第6章MLIR中间表示与编译器框架
6.1MLIR的背景知识
6.1.1背景介绍
6.1.2MLIR支持多种不同需求的混合中间表示
6.1.3MLIR统一框架
6.1.4MLIR中的方言功能
6.1.5MLIR方言转换
6.1.6MLIR动手实践
6.2MLIR多层编译框架实现全同态加密的讨论
6.2.1多层编译框架与全同态加密概述
6.2.2同态加密技术介绍
6.2.3同态加密技术集成到MLIR框架中
6.3MLIR编译框架下软硬协同设计的思考
6.3.1架构探索概述
6.3.2基于IR的性能分析方法
6.3.3架构级别的IR
6.3.4MLIR中引入架构探索的可能性与挑战
6.3.5AI架构数据流小结
6.4MLIR编译器的多面体优化
6.4.1多面体模型概述
6.4.2MLIR中的多面体表示
6.4.3MLIR中引入多面体优化
6.4.4多面体优化小结
6.5多模态模型AI芯片软硬件优化利器
6.5.1多模态模型基本原理
6.5.2深度学习应用的多模态模型优化
6.6基于MLIR实现GEMM编译优化
6.6.1GEMM优化策略概述
6.6.2MLIR实现GEMM优化
6.6.3MLIR实现GEMM优化的优势
6.7MLIR编译技术应对CIRCT项目硬件设计挑战
6.7.1CIRCT背景介绍
6.7.2使硬件/软件系统更容易开发
6.7.3CIRCT软件框架
6.7.4CIRCT方言转换
6.7.5CIRCT小结
6.8IREE HLO项目与MLIR编译器
6.8.1IREE HLO项目介绍
6.8.2定义方言算子内容
6.8.3实现方言间算子转换
6.8.4实现算子链的算法优化
6.8.5IREE HLO项目与MLIR编译器小结
第7章MLIR代码生成技术
7.1MLIR中的可组合和模块化代码生成
7.1.1结构化与可重定目标代码生成流程
7.1.2与代码生成相关的方言
7.1.3下层方言: 生成LLVM IR与二进制
7.1.4张量转换
7.1.5向LLVM逐步下译多维向量运算
7.2单线程CPU实验
7.2.1引擎实验
7.2.2推进转换
7.2.3实验设置
7.2.4基准测试
7.2.5内存带宽限制内核的性能
7.2.6计算约束核的性能
7.2.7深度卷积
7.2.8稀疏码生成概述
7.2.9MLIR代码生成优化示例
7.2.10代码生成技术小结
7.3利用MLIR实现矩阵乘法的高性能GPU码生成
7.3.1MLIR在GPU上张量核代码生成概述
7.3.2MLIR代码生成
7.3.3流程设计
7.3.4性能评估
7.3.5GPU上代码生成小结
第8章MLIR的后端编译过程
8.1MLIR Toy方言编译器开发技术
8.1.1MLIR Toy方言模块
8.1.2在仿射方言中寻求优化机会
8.2MLIR Toy方言下译到LLVM IR
8.2.1MLIR Toy部分下译
8.2.2IR下译到LLVM方言
8.2.3代码生成及JIT实现
8.2.4下译技术小结
第9章BuddyMLIR 工程技术解析
9.1BuddyMLIR 项目详解
9.1.1BuddyMLIR项目概述
9.1.2如何运行BuddyMLIR
9.1.3如何理解BuddyMLIR架构
9.2BuddyMLIR 工程结构
9.2.1BuddyMLIR 的Bud方言
9.2.2DIP方言
9.2.3接口实现
9.2.4Buddy优化与Buddy翻译
第10章TPUMLIR开发实践
10.1TPUMLIR快速入门
10.1.1TPUMLIR环境配置搭建
10.1.2转换成int8对称量化模型
10.2各框架模型转ONNX参考
10.2.1ONNX转MLIR
10.2.2融合cvimodel模型文件
10.2.3模型融合过程
10.2.4测试流程
第11章IREE编译流程与开发实践
11.1通过VulkanSPIRV标准编译堆栈
11.1.1现有的ML堆栈挑战
11.1.2IREE体系结构
11.1.3IREE内核编译流程
11.1.4IREE运行时
11.1.5HAL: 受Vulkan启发的硬件抽象层
11.1.6HAL IR示例
11.1.7Vulkan现状与路线图
11.2IREE编译流程解析
11.2.1IREE编译流程示例解析(1)
11.2.2IREE编译流程示例解析(2)
11.2.3IREE编译流程示例解析(3)
11.2.4IREE编译流程示例解析(4)
11.2.5IREE编译流程示例解析(5)
內容試閱
人工智能在全世界广泛应用。深度学习框架(如TensorFlow、
PyTorch、MXNet、Caffe等)推动了AI技术革命。大多数现有的系统框架针对小范围的服务器级GPU进行
优化,仍然需要做很多工作,才能在其他平台上部署,如汽车、手机、物联网设
备及专用加速器(FPGA、ASIC)。随着深度学习框架和硬件后端数量的增加,提出了一种统一的中间表示的解决方案MLIR——一种优化深度学习框架与提高效率的编译器。
有了MLIR 的帮助,可以轻松地在手机、嵌入式设备甚至浏览器上运行深度学习模型,只需做很少的额外工作。MLIR 还为多种硬件平台上的深度学习计算提供了统一的优化框架,包括一些有自研计算原语的专用加速器。
MLIR是一个深度学习编译器,所有人都能随时随地地访问高性能机器学习。MLIR 由硬件供应商、编译器工程师和机器学习研究人员组成的多元化社区共同构建了一个统一的可编程软件堆栈,丰富了整个机器学习技术生态系统并使其可供更广泛的机器学习社区使
用。
MLIR的全名为MultiLevel Intermediate Representation,是一种由谷歌公司开发的开源编译器基础设施,它将深度学习模型进行优化推理,内存管理与线程调度,借用LLVM部署到在CPU、GPU、FPGA、ARM 等硬件设备上。
本书全面解析MLIR的主要功能,帮助读者理解MLIR工作原理,以及使用MLIR对算子模型进行优化与部署开发。MLIR可以高效地部署在不同的硬件设备上,是深度学习系统的编译器堆栈。目的是缩小以生产力为中心的深度学习框架与以性能和效率为中心的硬件后端之间的差距。MLIR 与深度学习框架合作,为不同的后端提供端到端编译。
全书共分11 章,主要内容如下:
第1章用MLIR构建编译器: 讲述Toy方言与MLIR的引入。
第2章MLIR编译器基础: 讲述MLIR基础知识、功能模块及代码结构。
第3章MLIR编译器功能模块: 讲述MLIR编译,DSL技术、堆栈调用技术。
第4章MLIR方言技术: 讲述MLIR方言特征,方言开发实践。
第5章TPUMLIR开发技术分析: 讲述TPUMLIR工程、各种优化调度存储策略及实践。
第6章MLIR中间表示与编译器框架: 讲述MLIR的外部依赖、不同应用适配及示例。
第7章MLIR代码生成技术: 讲述代码生成的基本原理、下译技术及优化实践。
第8章MLIR的后端编译过程: 讲述MLIR Toy方言应用、下译映射及编译实践。
第9章BuddyMLIR工程技术解析: 讲述BuddyMLIR工程结构、代码构建及编译实践。
第10章TPUMLIR开发实践: 讲述TPUMLIR环境配置搭建、ONNX模型转换与工程实践。
第11章IREE编译流程与开发实践: 讲述IREE内核结构、编译流程与工程实践。
扫描目录上方的二维码可下载本书源码。

编者2025年2月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.