登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』AI处理器硬件架构设计 任子木 李东声

書城自編碼: 4099293
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 任子木 李东声
國際書號(ISBN): 9787111778301
出版社: 机械工业出版社
出版日期: 2025-04-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 141.9

我要買

share:

** 我創建的書架 **
未登入.


新書推薦:
张元济的生平与事业:从清代改革家到二十世纪出版家
《 张元济的生平与事业:从清代改革家到二十世纪出版家 》

售價:HK$ 85.8
他者中的近代朝鲜(西方韩国研究丛书)
《 他者中的近代朝鲜(西方韩国研究丛书) 》

售價:HK$ 85.8
索恩丛书·苏莱曼大帝的崛起:奥斯曼宫廷与16世纪的地中海世界
《 索恩丛书·苏莱曼大帝的崛起:奥斯曼宫廷与16世纪的地中海世界 》

售價:HK$ 86.9
攀龙附凤:北宋潞州上党李氏外戚将门研究(增订本)宋代将门百年兴衰史
《 攀龙附凤:北宋潞州上党李氏外戚将门研究(增订本)宋代将门百年兴衰史 》

售價:HK$ 97.9
金钱的力量:财富流动、债务、与经济繁荣
《 金钱的力量:财富流动、债务、与经济繁荣 》

售價:HK$ 97.9
超越想象的ChatGPT教育:人工智能将如何彻底改变教育     (土耳其)卡罗琳·费尔·库班     穆罕默德·萨欣
《 超越想象的ChatGPT教育:人工智能将如何彻底改变教育 (土耳其)卡罗琳·费尔·库班 穆罕默德·萨欣 》

售價:HK$ 75.9
应对百年变局Ⅲ:全球治理视野下的新发展格局
《 应对百年变局Ⅲ:全球治理视野下的新发展格局 》

售價:HK$ 85.8
前端工程化——体系架构与基础建设(微课视频版)
《 前端工程化——体系架构与基础建设(微课视频版) 》

售價:HK$ 97.9

 

編輯推薦:
《AI处理器硬件架构设计》融合了一线自研高性能处理器资深工程师多年工作经验,从人工智能处理器的架构设计出发,对比各种不同架构的人工智能处理器的优缺点,详细介绍各个组件的架构和微架构设计,循序渐进、由浅入深,图文结合。用户可根据本书的介绍,从0到1完成人工智能处理器的设计、验证工作。
內容簡介:
《AI处理器硬件架构设计》基于当前工业界主流的设计规格,详细介绍了AI处理器硬件架构及微架构的设计原理,并配有对应的工程经验总结与产品实例分析。本书主要内容包括:业界主流AI处理器架构及基础背景知识(第1章);AI处理器指令集设计与硬件架构总体设计(第2、3章);核心计算单元,即向量处理单元、矩阵处理单元、标量处理单元的微架构设计实现(第4~6章);数据搬运单元与存储系统设计(第7、8章);AI处理器设计实例剖析(第9章)。
  《AI处理器硬件架构设计》可作为从事AI处理器相关研发工作的专业人员的参考书,也可用作高等院校计算机、集成电路相关专业研究生、高年级本科生的教材和参考书,还可供对AI处理器设计感兴趣的读者自学。
關於作者:
任子木
处理器架构高级工程师
主导多款高性能推理/训练处理器和数字信号处理器架构与核心模块设计。谙熟业界主流高性能处理器指令集架构,带领团队设计的芯片广泛应用于相机、无人机和服务器中。在计算机体系结构、图像处理等方向有丰富的实践经验。申请国内外发明专利五十余项。
李东声
处理器架构师
专注于ARM/RISC-V架构高性能处理器设计、性能分析优化、架构演进探索与关键技术研究。参与和主导多项高性能CPU与AI处理器IP架构/微架构以及SoC设计,商用产品涉及服务器、移动终端、边缘计算等多个领域。授权国内外发明专利十余项。
目錄
推荐语
前言
第1章 AI处理器概述
1.1神经网络基础
1.1.1卷积神经网络简介
1.1.2残差神经网络简介
1.1.3Transformer网络简介
1.2应用场景及其硬件需求介绍
1.2.1图像识别场景简介
1.2.2自动驾驶场景简介
1.2.3自然语言生成场景简介
1.3硬件加速平台介绍
1.3.1GPU简介
1.3.2DSA简介
第2章 AI处理器指令集设计
2.1标量指令集设计
2.2向量指令集设计
2.2.1寄存器设计
2.2.2算术逻辑类指令设计
2.2.3规约类指令设计
2.2.4重排列类指令设计
2.2.5数制转换类指令设计
2.2.6访存类指令设计
2.3矩阵运算指令设计
2.4DMA描述符设计
第3章AI处理器架构设计
3.1AI处理器架构概述
3.1.1VLIW SIMD架构设计
3.1.2超标量 SIMD架构设计
3.1.3SIMT架构设计
3.2向量运算和矩阵运算的融合层级
3.2.1寄存器级融合
3.2.2存储器级融合
3.3向量处理单元架构选型
3.3.1Memory直连型向量处理单元设计
3.3.2基于VRF的向量处理单元设计
3.4标量流水线和向量矩阵流水线的位置关系
3.4.1并行流水线结构设计
3.4.2串行流水线结构设计
3.5AI处理器整体架构设计
第4章 向量处理单元设计
4.1向量处理单元整体架构设计
4.2向量指令发射设计
4.2.1顺序发射设计
4.2.2乱序发射设计
4.3浮点运算单元设计
4.3.1IEEE 754协议介绍
4.3.2浮点加法器设计
4.3.3浮点乘法器设计
4.3.4浮点除法器设计
4.3.5浮点运算的融合
4.4跨通道跨切片处理单元设计
4.4.1规约类指令的硬件实现
4.4.2压缩类指令的硬件实现
4.4.3排序类指令的硬件实现
4.5超越函数类指令的硬件实现
4.5.1CORDIC算法介绍
4.5.2分段线性逼近实现
4.5.3分段查表结合多项式运算实现
第5章 矩阵处理单元设计
5.1矩阵乘法的硬件映射
5.2数据流设计
5.2.1输出固定数据流设计
5.2.2权重固定数据流设计
5.2.3输入固定数据流设计
5.3脉动阵列的结构及计算流程
5.4脉动阵列的优化
5.4.1列间广播设计
5.4.2行间累加融合设计
5.5定点MAC单元设计
5.5.1定点乘法器设计
5.5.2定点MAC单元微架构设计
5.6浮点MAC单元设计
第6章 标量处理单元设计
6.1前端设计
6.1.1指令提取单元设计
6.1.2分支预测单元设计
6.1.3指令译码单元与指令发射单元设计
6.2执行单元设计
6.2.1执行单元流水线设计
6.2.2典型功能单元的微架构实现
6.3访存单元设计
6.3.1数据缓存子系统概述
6.3.2访存单元微架构设计
第7章 数据搬运单元设计
7.1数据搬运单元整体架构设计
7.2多维传输任务的解析
7.2.1多维传输介绍
7.2.2不同维度传输的归一化设计
7.3A线接口设计
7.4在线填充引擎设计
7.5在线排序引擎设计
7.6在线转置引擎设计
第8章 存储系统设计
8.1AI处理器中的存储器设计
8.2存储器中Bank的划分方式
8.2.1Bank间地址交织方式
8.2.2Bank划分粒度介绍
8.3向量存储器设计
8.4GatherScatter引擎设计
8.5存储系统的物理实现
第9章 AI处理器设计实例
9.1HiPU硬件架构和指令集综述
9.1.1核心组件设计
9.1.2存储层次结构设计
9.1.3指令集设计
9.2HiPU微架构与流水线设计
9.3HiPU数据平面与计算阵列设计
参考文献
內容試閱
人工智能技术正在深刻改变着我们的学习、工作和生活。从计算机视觉到自然语言处理,从自动驾驶到智能机器人,AI应用的蓬勃发展对计算平台提出了新的挑战。这些挑战主要表现在以下两个方面:1)计算需求的爆炸性增长,深度学习模型规模持续扩大,训练数据量急剧增加,实时推理应用对延迟提出更高要求,边缘计算场景对能效比的要求提升;2)新兴应用带来的特殊需求,包括大规模矩阵运算加速、灵活的数据精度支持、复杂的数据重用模式,以及特定算子的硬件映射优化。
随着人工智能技术的快速发展和广泛应用,传统通用处理器架构在处理AI工作负载时的局限性日益凸显,其瓶颈主要表现在:存储墙问题日益严重、对AI特征计算支持不足、控制逻辑开销过大,以及数据搬运效率低下。为了更好地支持大规模参数和复杂计算结构的机器学习模型的高效执行,专门面向人工智能领域的处理器架构设计成为近几年计算机体系结构领域最活跃的研究方向之一。面对传统处理器在AI领域应用的瓶颈,设计专用的AI处理器架构已是大势所趋。由此,作者团队撰写了本书,对AI处理器硬件架构设计进行了全方位的系统阐述。
本书所呈现的内容基于工业界当下实际的产品和应用技术,在不侵犯商用知识产权的前提下,尽力为读者呈现“是什么(What)”“为什么这样设计(Why)”,以及“如何设计,如何分析(How)”。在本书的写作过程中,作者相对弱化了对计算机体系结构基础知识的阐述,将更多的篇幅有针对性地聚焦于处理器架构/微架构设计的内容,最大限度地为读者呈现硬件架构/微架构的全貌,以及如何设计一款AI处理器。
无论是产品还是工程经验,都会存在自身的局限性。每个成熟的商业公司都有其特有研发体系,工程师也往往在体系之内选择自己认为适宜的方式去做设计以及思考,这本身就带有一定的惯性和片面性。因此,作者通过一家之言抛砖引玉,希望能够引发读者对设计的思考;或者,根据作者的视角和工程经验,启发读者的思路。如果本书能够帮助读者解决实际的工程问题,或者帮助读者弥合了课堂与工业界的差距,那么作者将甚感荣幸。
《AI处理器硬件架构设计》分为9章,各章内容如下。
第1章为基础知识概述,简要介绍了神经网络和硬件加速平台的相关基础知识,便于读者理解后续内容。
第2章和第3章从宏观角度分别介绍了AI处理器指令集与硬件架构的设计。其中第2章为读者介绍了一套通用的AI处理器指令集的详细规格,包括标量指令、向量指令、矩阵运算指令等。第3章为架构设计总述,介绍了当前典型的AI处理器架构实现(包括VLIW/超标量 SIMD和SIMT),计算核心向量运算单元、矩阵处理单元,以及标量处理单元三者的架构设计、流水线分配,以及运算融合。
AI处理器硬件架构设计第4章介绍了向量处理单元的详细微架构设计,涉及从整体微架构到各个功能单元的设计,包括浮点运算单元、各种向量类指令和超越函数类指令的硬件实现。
第5章介绍了矩阵处理单元的详细微架构设计,重点阐述了数据流设计、脉动阵列的设计和优化,以及乘累加单元的硬件实现。
第6章介绍了标量处理单元的详细微架构设计,对应于标量指令的生命周期,基于AI处理器与通用CPU在应用场景与设计考量上的差异,根据流水线设计的次序,依次讲解了指令提取单元、分支预测单元、指令译码单元与指令发射单元、执行单元,以及访存单元的微架构设计。
第7章介绍了数据搬运单元的设计,包括数据传输和在线处理,以及总线接口单元设计。
第8章介绍了AI处理器中存储系统的设计,包括存储器中Bank的划分、Gather/Scatter引擎的设计,以及进行相应的物理实现时需要关注的问题。
第9章对西安交通大学人工智能与机器人研究所研发的HiPU微架构进行了深度剖析,包括从指令集设计到硬件架构的实现。通过对流水线和各功能单元微架构的介绍,读者可对第2~8章中介绍的内容进行相互印证并将所学知识融会贯通。
感谢西安交通大学赵文哲副教授和大洋彼岸的同学Howard Wong在本书策划与编写过程中提供的指导及帮助;感谢机械工业出版社编辑李培培一如既往的关照和支持。
天下事,在局外呐喊议论,总是无益。必须躬身入局,挺膺负责,方有成事之可冀。最后以此句话与各位业界同仁共勉。
李东声

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.