电子书 计算机硬件

面向新兴应用的领域专用计算机体系结构 (英文版电子书)

¥2.90 已售 0
✓ 自动发货 ✓ 永久有效 ✓ 售后保障

资源介绍

电子书格式: epub 在摩尔定律逐渐走向终结的背景下,领域专用体系结构(DSA)已成为实现未来计算体系结构的关键模式。《面向新兴应用的领域专用计算机体系结构 —— 机器学习与神经网络》一书,聚焦这一核心趋势,系统阐述了 DSA 的系统级设计方法及其应用,构建了一套能保证目标应用功能、性能、能效与实时响应性的统一设计流程。 该书的核心逻辑始于领域专用算法或应用,通过深入分析算法应用的计算、内存访问、通信等特征,针对性地提出适用于特定应用的异构加速器体系结构。内容上重点覆盖机器学习、数据挖掘、神经网络、图算法等新兴应用的加速器硬件平台与分布式系统,同时纳入 RISC-V 开源指令集相关内容,既简述了基于 DSA 的系统设计方法,也呈现了学术界在领域专用加速体系结构领域的最新研究成果。 全书结构清晰,共 13 个章节,形成了完整的知识体系。开篇章节概述领域专用计算的背景、现状、加速手段、平台及效果衡量指标,为后续内容奠定基础。随后章节分别围绕机器学习算法与硬件加速器定制、数据挖掘推荐算法的硬件加速器定制、推荐算法的分布式计算系统定制与优化、聚类算法的硬件定制、图算法的硬件加速器定制技术、神经网络算法的硬件加速方法概述等核心主题展开深入探讨。每个主题均结合具体算法细节、硬件部署方案、加速定制相关工作及实验结果,实现了宏观理论与具体案例的有机结合。 在机器学习算法加速方面,书中详细分析了监督学习、无监督学习等不同类型算法的特点,总结了从算法计算核心加速、共性特征抽象、算法并行化、数据通信传输优化四个维度的加速思路,并探讨了基于 FPGA 的机器学习加速器设计的四种实现方式。对于数据挖掘推荐算法,重点研究了基于协同过滤的推荐算法,设计了对应的训练加速器和预测加速器,同时开发了 Linux 操作系统环境下的设备驱动程序与用户层接口。 分布式计算系统定制部分以 Spark 为开发平台,提出了高精度、高效、多样化、可扩展的混合推荐系统实现方案,通过改进权重计算方法提升推荐准确性,优化系统效率。聚类算法硬件定制则针对 K-Means、K-Medoid、SLINK、DBSCAN 四种典型算法,设计了支持多种相似度度量的定制化硬件加速平台,平衡了加速器的通用性与性能。 图算法与神经网络算法的硬件加速章节,全面覆盖了传统图计算算法与图神经网络算法的模型实现、硬件部署方案,以及 ASIC、GPU、FPGA 等不同类型硬件加速器的体系结构与优化方法,还探讨了并行编程模型与中间件的相关内容。此外,书中还涉及深度信念网络、循环神经网络、脉冲神经网络等特定神经网络的 FPGA 硬件加速器定制,以及大数据基因组测序加速器、RISC-V 开源指令集与体系结构、可重构加速器定制中的编译优化方法等前沿主题。