新書推薦:
《
疯狂树屋第4辑91层上下全2册 漫画桥梁书The Treehouse中英文双语版
》
售價:NT$
500.0
《
疯狂树屋第4辑104层上下全2册 漫画桥梁书The Treehouse中英文双语版
》
售價:NT$
500.0
《
甲骨文丛书· “安国之道”:英国的殖民情报系统及其在亚洲的扩张
》
售價:NT$
403.0
《
台北人(2024版)
》
售價:NT$
398.0
《
万千心理·成人情绪障碍跨诊断治疗的统一方案:应用实例
》
售價:NT$
602.0
《
让孩子更有力量:赋权型家庭教育指南
》
售價:NT$
305.0
《
白夜追凶(上下)
》
售價:NT$
500.0
《
财富、战争与智慧——二战股市风云录
》
售價:NT$
602.0
|
編輯推薦: |
内容翔实:本书不是单单从某一种芯片、某一家公司或某一种体系结构出发,而是从AI芯片多个相关领域出发,介绍AI芯片当今主流模块是什么、哪些重要技术可以用于AI芯片、光刻机技术与芯片制造的技术分析等。
知识点全面:涉及的知识点包括电子、半导体、芯片制造、光刻机、接口通信、底层驱动、操作系统、系统软件、应用软件、AI算法、算子理论、AI框架、汇编语言、编译部署与C/C /Python语言等。
实践性强:重点介绍如何动手开发,如何优化性能,并介绍了很多典型开发示例。
|
內容簡介: |
本书力求将芯片基础知识理论与案例实践融合在一起进行详细介绍。帮助读者理解芯片相关多个模块开发工作原理,同时兼顾了应用开发的技术分析与实践。本书包含大量翔实的示例和代码片段,以帮助读者平稳、顺利的掌握芯片开发技术。
全书共10章,包括RISC-V技术分析;PCIE,存储控制,以及总线技术分析;NPU开发技术分析;CUDA原理与开发示例分析;GPU渲染架构与优化技术分析;U-Boot开发分析;Linux开发分析;光刻机技术分析;芯片制造技术分析;卷积与矩阵相乘编译部署分析。
本书适合从事硬件设计、微电子技术、软件开发、编译器开发、人工智能,以及算法等方向的企业工程技术人员,也适合高校师生、科研工作人员、技术管理人员参考阅读。
|
關於作者: |
吴建明,毕业于上海交通大学,专业方向是模式识别与智能系统。长期从事人工智能芯片设计、TVM/LLVM编译器、AI框架、自动驾驶、计算机视觉、图像识别、深度学习、摄像头/相机算法、机器学习、人工智能、视频编解码、芯片制造、嵌入式系统、计算机软件等领域的研发工作。主持或参与过30多项产品研发;参与了国家自然基金、上海市科委项目,并在核心期刊以上发表过11篇论文,其中8篇是第一作者。出版图书《TVM编译器原理与实践》《LLVM编译器原理与实践》。
|
目錄:
|
本书源码
第1章RISCV技术分析
1.1初识RISCV
1.1.1什么是RISCV
1.1.2指令集架构ISA
1.1.3开源指令集RISCV
1.1.4RISCV概述
1.1.5RISCV处理器及Roadmap
1.1.6RISCV相关背景
1.2MCU构成及其运行原理
1.2.1MCU概念
1.2.2MCU构成
1.2.3模拟MCU运行
1.2.4MCU模拟运行
1.3RISCV编译过程分析
1.3.1预处理
1.3.2编译
1.3.3汇编
1.3.4连接
1.3.5ELF、HEX、BIN文件说明
1.4RISCV启动文件分析
1.5RISCV的LD连接脚本说明
1.5.1LD连接脚本
1.5.2LD连接脚本的主要内容
1.5.3常用关键字及命令
1.5.4示例: 完整LD连接脚本
1.5.5示例: 从C文件中读取LD中的全局变量
1.6RISCV MCU栈机制
1.6.1栈
1.6.2栈的作用
1.6.3栈大小定义
1.6.4压栈出栈过程
1.6.5malloc使用注意事项
1.7RISCV全局指针寄存器说明
1.8最易变的关键字volatile
1.8.1volatile关键字
1.8.2Demo
1.9RISCV将常量定义到Flash地址
1.9.1编辑LD连接文件,添加SECTIONS段
1.9.2函数中使用__attribute__((section(”.xxx”)))定义常量
第2章GPU渲染架构与优化技术
2.1渲染架构及GPU优化技巧
2.1.1GPU图渲染概述
2.1.2即时模式架构
2.1.3基于平铺的渲染
2.1.4两种渲染架构对比
2.2IMR与TBR的对比
2.2.1IMR渲染的优势
2.2.2IMR渲染的劣势
2.2.3TBR解决带宽功耗问题
2.2.4TBR渲染的劣势
2.2.5前向像素消除
2.3传统延迟渲染和TBDR
2.3.1延迟渲染
2.3.2延迟渲染原理介绍
2.3.3传统延迟渲染
2.3.4单着色器延迟渲染
2.3.5TBDR架构原理
2.4光栅顺序组
2.4.1光栅顺序组的作用
2.4.2多倍光栅顺序组
2.4.3图像块
2.5延迟渲染源码分析
2.6示例: 图渲染
2.6.1图分割示例
2.6.2几何深度学习示例
2.7小结
第3章NPU开发技术分析
3.1NPU加速器建模设计
3.1.1NPU加速器建模概述
3.1.2加速器架构的设计空间探索
3.2异构系统: 向量体系结构
3.2.1异构稀疏向量加速器的总体架构
3.2.2稀疏矩阵
3.2.3示例: 异构感知调度算法
3.2.4外部内存访问调度
3.2.5仿真框架
3.2.6位片跳转架构与数据管理方面的硬件挑战
3.2.7有符号位片表示及其编码单元
3.2.8用于输入和输出跳转的零数据跳转单元
3.2.9片上异构网络
3.2.10指令集体系结构
3.2.11广义深度学习的架构式编排、变换和布局
3.3示例: NPU开发
3.3.1NPU硬件概述
3.3.2gxDNN概述
3.3.3编译器使用
3.3.4编译模型
3.3.5调用API流程与MCU API代码
3.3.6NPU使用示例
3.4TPU2机器学习集群
3.4.1TPU2概述
3.4.2TPU2设计方案
第4章CUDA原理与开发示例
4.1CUDA平台的GPU硬件架构
4.1.1CPU内核组成
4.1.2GPU内核组成
4.1.3GPU组成示例
4.2CUDA原理概述
4.2.1异构计算
4.2.2CUDA程序编写
4.2.3CUDA程序编译
4.2.4NVPROF
4.3CUDA线程结构
4.3.1CUDA线程索引
4.3.2线程分配
4.4CUDA存储单元及矩阵乘法
4.4.1GPU的存储单元
4.4.2GPU存储单元的分配与释放
4.4.3矩阵相乘样例
4.5CUDA错误检测与事件
4.5.1CUDA运行时的错误检测函数
4.5.2CUDA中的事件
4.6多种CUDA存储单元
4.7CUDA流技术
4.7.1CUDA流概念
4.7.2CUDA流详解
4.8CUDA矩阵乘法算法分析
4.8.1CUDA矩阵乘法概述
4.8.2示例: CUDA中矩阵乘法的优化
4.9通用GPU架构及基础知识
4.9.1常用芯片架构概述
4.9.2GPU体系结构
4.9.3英伟达CUDA通用并行计算
4.9.4AMD GPU
4.9.5GPU与显存(VRAM)的关系
4.9.6GPGPU特定架构的汇编
第5章PCIE、存储控制与总线的技术分析
5.1PCIE开发技术分析
5.1.1PCIE开发简介
5.1.2TLP包的组装
5.1.3PCIE开发TLP类型
5.1.4PCIE开发的TLP路由
5.1.5PCIE开发系统配置和设备枚举
5.2PCIE开发设备热插拔
5.2.1PCIE设备的热插拔功能
5.2.2热插拔软件部分与硬件部分
5.2.3热插拔的两种状态
5.2.4热插拔关闭和打开插槽的具体流程
5.2.5热插拔移除和插入设备的具体流程
5.3PCIE寄存器与关系图
5.3.1PCIE寄存器
5.3.2PCIE架构关系图
5.4示例: 芯片存储器与控制器测试
5.4.1存储器的分类
5.4.2DDR总线的设计、调试和验证
5.4.3DDR4信号特性
5.4.4MPHY物理层的主要特点
5.5系统总线技术与示例
5.5.1总线的基本概念
5.5.2英特尔体系结构中特指的系统总线
5.5.3系统总线的组成
5.5.4总线设计要素
5.5.5总线仲裁分类
5.5.6菊花链总线仲裁
5.5.7计数器定时查询仲裁
5.5.8三种仲裁方式
5.5.9三种总线通信方式
5.5.10特定总线通信方式
5.6拆分总线事务
5.6.1拆分总线事务简介
5.6.2拆分总线事务分类
5.7示例: 总线开发
5.8关于I/O总线标准
5.8.1I/O总线概述
5.8.2PCI总线标准的信号线与PCI命令
5.8.3I/O总线、I/O控制器与I/O设备的关系
5.9PC组成: I/O操作、I/O总线和I/O接口
5.9.1I/O操作
5.9.2I/O总线的各个模块
5.9.3I/O接口
5.9.4I/O总线、I/O控制器、I/O接口与I/O设备的关系
5.9.5系统总线小结
第6章UBoot开发分析
6.1UBoot开发基础介绍
6.1.1UBoot运行环境
6.1.2Image镜像
6.1.3Image使用
6.1.4设备树
6.2移植过程
6.2.1存储映射
6.2.2未为时钟索引4实现set_rate
6.3UBoot调试修改
6.3.1开启调试选项
6.3.2配置Kconfig
6.3.3Kbuild&&Kconfig
6.4构建过程
6.5一些重要的构建模块
6.5.1Kconfig内核配置
6.5.2Kbuild编译过程
6.6启动阶段
6.6.1启动入口
6.6.2架构特定初始化
6.7重定位
6.7.1为什么要重定位
6.7.2重定位到哪里
6.7.3实现技术
6.7.4通用初始化
6.7.5对比其他架构
第7章Linux开发分析
7.1嵌入式Linux环境
7.1.1完整的嵌入式Linux环境模块
7.1.2Linux构建过程
7.1.3CPU体系架构
7.1.4(交叉)编译工具链
7.1.5(交叉)编译工具链组成部分
7.1.6构建工具
7.2Linux内核Yocto、OpenEmbedded、BitBake详解
7.2.1构建过程
7.2.2Yocto项目
7.2.3Poky项目
7.2.4Yocto项目源码
7.2.5Poky文档
7.2.6使用方法
7.2.7关于source命令
7.2.8其他工具
7.2.9OpenEmbedded
7.2.10BitBake
第8章卷积与矩阵相乘编译部署分析
8.1深度学习中的各种卷积
8.1.1卷积与互相关
8.1.2深度学习中的卷积
8.1.33D卷积
8.1.41×1卷积
8.1.52D卷积算法
8.1.6转置卷积
8.1.7扩展卷积
8.1.8可分离卷积
8.2LLVM中矩阵的实现分析
8.2.1背景说明
8.2.2功能实现
8.2.3举例说明
第9章光刻机技术分析
9.1光刻机基本原理
9.2光刻机核心设备
9.2.1光刻机整机
9.2.2光刻机发展历程
9.2.3光刻机系统架构
9.2.4光刻机三大巨头市场格局
9.2.5上海微电子产品管线
9.3掩模版光刻过程的核心耗材
9.3.1掩模版微电子制造的图形转移母版
9.3.2光刻技术是掩模版制造的重要环节
9.3.3光刻机材料与掩模版结构
9.3.4光刻机掩模版厂商市场格局
9.3.5EUV光刻机
9.4光刻是芯片制造最核心环节
9.4.1光刻设备工艺流程
9.4.2光刻技术: 从接触式到接近式
9.4.3光刻技术: 从接近式到投影式
9.4.4光刻技术: 干法光刻和浸润式光刻
9.4.5光刻机的技术决定集成电路的发展
9.4.6多重曝光亦可实现更小线宽,但工艺难度大
9.5光刻机是人类科技之巅
9.5.1光刻机结构
9.5.2光刻机分辨率由光源波长、数值孔径、光刻工艺因子决定
9.6光源系统: 能量的来源,光刻工艺的首要决定项
9.6.1光源波长与可见光谱
9.6.2EUV光源
9.6.3EUV光源参数
9.7曝光系统: 照明系统 投影物镜
9.7.1照明系统: 光源高质量加工的关键
9.7.2衍射光与环形光成像
9.7.3衍射与微反射镜的光瞳整型技术
9.8投影物镜系统: 精准成像,对线宽起重要作用
9.8.1像差与光刻机成像过程
9.8.2从双腰到单腰、引入非球面镜片与反射式镜片
9.8.3工艺精密要求
9.9双工作台系统: 精确对准 光刻机产能的关键
9.10芯片制造核心设备应用概述: 光刻机
9.10.1EUV光刻机工作原理分析
9.10.2EUV光刻机制造工艺难点与优势
9.10.3前道制程光刻机主流产品分析对比
9.11部分光刻机配套设备
9.11.1光刻胶
9.11.2EUV反射: 原子级平整度
9.12自研光刻机与光刻机技术分析
9.12.1自研光刻机背景分析
9.12.2自研光刻机技术分析
第10章芯片制造技术分析
10.1芯片制造系列全流程: 设计、制造、封测
10.1.1芯片制造全流程概述
10.1.2芯片设计
10.1.3芯片制造
10.1.4封装测试
10.2半导体全景
10.2.1芯片简介
10.2.2半导体简介
10.2.3芯片产业链
10.3芯片封测技术
10.3.12.5D/3D集成技术
10.3.2晶圆级封装技术
10.3.3系统级封装技术
10.3.4倒装封装技术
10.3.5焊线封装技术
10.3.6MEMS与传感器
10.4FinFET存储器的设计、测试和修复方法
10.4.1FinFET存储器介绍
10.4.2STAR存储器系统
10.4.3生成测试序列
10.4.4使用STAR存储器系统检测并修复故障
10.4.5维修故障
10.4.63D SoC/IC
10.4.7STAR层次化系统
10.4.8小结
10.5基于FinFET的设计: 机遇与挑战
10.5.1FinFET器件的拓扑结构
10.5.2FinFET: 器件
10.5.3制造FinFET结构的关键阶段
10.5.4FinFET设计挑战
10.5.5TCAD和EDA工具的就绪程度
10.5.6小结
10.6光刻的基本原理
10.6.1光刻过程概述
10.6.2核心的光源系统
10.6.3光刻机与制程流程
10.6.4什么是芯片
参考文献
|
內容試閱:
|
芯片已应用到社会生活的各个领域,不仅计算机设备,就连生活中不可或缺的手机、汽车、家用电器以及各种机器设备等也离不开芯片。
以大数据、云计算为支撑,人们正在逐步实现各种机器的智能化。这些机器具有人的感知,能收集、加工各种信息,主动地进行某种目的的操作,经过学习训练(机器学习)还能从事技术含量更高的工作等,而这一切都是以各种芯片为基础的。
芯片产业正在日新月异地发展。尽管目前已有减速的迹象,但信息化、多媒体化、数字化、智能化的进程仍在继续。所有这些都有赖于电子技术及作为其核心的芯片技术的持续进展。
芯片是信息革命的核心技术和主要推动力,可以说,信息产业的进步离不开芯片的发展。特别是目前的移动互联网和人工智能时代,表面上看是智能手机、人工智能(AI)、互联网公司App大行其道,但其背后都是许多芯片在支撑海量数据的计算、处理、传输和通信。
目前,一方面芯片技术正日益广泛、深入和快速地应用到现代社会的各个领域; 另一方面,很多人对芯片技术的了解、对其本质的认识却一知半解,人云亦云。由于芯片涉及大量尖端技术,设计与制造难度极高,即使专业人士也很难了解其中的奥妙。同时,由于多学科交叉,即使某一学科的专家,也难以做到一专百通。面对涉及面广、发展快、内容新而又相当深奥的半导体技术和芯片技术,迫切需要一本深入浅出、通俗易懂、内容广泛、学科交叉,既考虑专业深度,又兼顾通俗性,同时,照顾到实际开发应用的书提供帮助。
本书正是基于以上目的编写,其主要特点如下:
(1) 非常重要。在多年的工作中,笔者深感芯片技术的重要性。本书不是单单从某一种芯片、某一家公司或某一种体系结构出发,而是考虑AI芯片应用的多个领域,介绍当今AI芯片的主流、可以用于AI芯片的重要模块、芯片制造工艺、芯片设备光刻机的技术分析等。
(2) 内容全面。芯片涉及的知识非常庞杂,需要非常深厚的理论基础与实践经验,因此很多技术人员对芯片望而生畏。本书涉及的知识点包括电子、半导体、芯片制造、光刻机、接口通信、底层驱动、操作系统、系统软件、应用软件、AI算法、算子理论、AI框架、汇编预言、C/C 、Python语言等。
(3) 以引领入门与动手开发为宗旨。很多工程师对芯片设计无从下手,也不知道从哪里学起,更不清楚如何开发芯片。本书重点介绍如何学习芯片设计、制造与应用技术的知识点,如何动手开发,如何优化性能,并介绍了很多典型开发示例。
资源下载提示
素材(源码)等资源: 扫描目录上方的二维码下载。
在本书的写作过程中得到了家人的全力支持,在此,对他们表示深深的感谢。也感谢清华大学出版社的编辑们,因为有了他们的辛勤劳作和付出,本书才得以顺利出版。
由于编者技术能力有限,书中难免存在疏漏,还望广大读者不吝赐教。
编者
2024年8月
|
|