智能计算系统PDF发布时间: 2023-10-02 来源:智能计算领域

  智能计算系统 课程编号: 课程中文名称:智能计算系统 课程英文名称:Intelligent Computing Systems 开课学期:秋季 学分/学时:2/32 先修课程:计算机组成原理,操作系统、机器学习等 建议后续课程: 适用专业/开课对象:计算机学院、高等理工学院/大三本科生 团队负责人:杨建磊 责任教授: 执笔人:杨建磊、王锐 核准院长:高小鹏 一、课程的性质、目的和任务 本课程是面向计算机相关专业三年级本科生开设的专业选修课程,为 《计算机组成原理和实 验》、《智能计算导论》与 《操作系统》等课程的后续延伸,尝试将智能计算系统领域的最新研究 前沿技术引入课堂。本课程涉及到的理论基础比较广泛,包括智能计算领域(人工智能、机器学 习、数据挖掘、图像处理、计算机视觉等)与计算机系统领域(计算机组成原理、操作系统、编 译原理、分布式系统等)的基本知识。同时,本课程亦需要较为扎实的系统工程技术实践能力(算 法实现、系统模块设计、系统调试与优化等),因此是一门注重系统能力培养且重于研究探索的实践课 程。 本课程以智能计算领域几个典型应用为研究对象,讲述智能计算系统从软件算法到专用架构 实现所涉及的指令集、编译器与软件栈等基础原理与系统优化方法,使学生理解从系统的角度实 现智能计算的整个工作过程,培育学生在专用的智能计算架构基础上设计和使用相关编译器和软 件栈以及系统优化方法的基本技能。本课程要求学生理解目前智能计算系统模块设计的基本思路,采 用现有的智能计算架构、编译器与软件栈对主流的智能算法进行计算效率的量化分析、系统优化 等,使其掌握智能计算系统模块设计与优化的工程化方法,并具备软硬件异构协同设计的基本素养和 学术视野,为今后更深入的理论学习和研究实践奠定良好基础。 本课程是学院规划和建设的“本科前沿课程”之一, 实践性较强,课程教学目标高,知识内 容前沿、知识面宽、知识运用综合,实验体系具备极高的难度与强度。本课程适合渴望学习前沿 技术与敢于面对挑战的学生,选修本课程的学生应有充分心理上的准备。具体的教学目标可分解为以 下几点: 1 (1)了解智能计算领域中包括机器学习、图计算、机器视觉等方向的几类基本模型和算法; 了解智能计算系统的工程问题、实验技术、工具资源以及该领域最新的研究前沿; (2 )了解几类主流智能计算专用架构特征与原理,包括寒武纪架构、谷歌TPU 架构、华为 达芬奇架构、MIT Eeyriss 架构等; (3 )掌握智能计算系统软件栈的基础原理、使用的过程和相关研究方法,注重工程思维与创 新思维的培养,尤其是面向专用架构将智能算法从系统层面来优化的思维能力,并 通过现有软件栈进行系统层面的性能测试、分析及优化等; (4 )具备利用寒武纪Bang 语言等工具设计智能算法运行在专用平台系统上的能力,具备利 用AutoTVM 进行软件栈开发调试的能力,具备利用Intel Distiller 进行模型轻量化的能 力,具备NAS 进行网络架构搜索的能力,具备利用SparkMLib 进行分布式深度学习开 发的能力,以及进行有关性能分析和系统优化等方面的能力; (5 )具有获取和利用标准、规范、手册、图册等有关技术资料的能力; (6 )掌握智能计算机系统模块设计与性能测试以及系统优化的工程化实验方法,获得实验技能 的基本训练; (7 )掌握智能计算系统模型建立、分析求解和设计的具体方案论证的理论和方法,培育学生分析 和解决智能计算系统应用等工程实践问题的创新设计能力。 课程目标对毕业要求的支撑关系 课程目标对毕 毕业要求 业要求的支撑 关系 毕业要求1:工程知识 课程目标:2、 能够将数学、自然科学、工程基础和专业相关知识用于解决复杂计算机工程问题。 3、4、5 毕业要求2 :问题分析 课程目标:3、 能够应用数学、自然科学基础原理,并通过文献研究,识别、表达、分析复 4、6 杂计算机工程问题,以获得有效结论。 2 课程目标对毕 毕业要求 业要求的支撑 关系 毕业要求3 :设计/开发解决方案 能够设计针对复杂计算机工程问题的解决方案,设计满足特定需求的计算机 课程目标:3、 系统,并能够在设计环节中体现创新意识,考虑法律、健康、安全、文化、 4、6、7 社会以及环境等因素。 毕业要求4 :研究 课程目标:4、 能够基于科学原理并采用科学方法对复杂计算机工程问题进行研究,包括设 6、7 计实验、分析与解释数据、并通过信息综合得到合理有效的结论。 毕业要求5:使用现代工具 课程目标:4、 能够在计算机工程实践中开发、选择与使用合理有效的技术、资源、现代工 6 程工具和信息技术工具,并了解其局限性。 毕业要求6:工程与社会 具有追求创新的态度和意识,掌握基本的创新方法,及综合运用理论和技 课程目标:1 术手段设计复杂计算机系统与过程的能力;设计过程中能够考虑社会、 经济、文化、环境、法律、安全、健康、伦理等制约因素。 毕业要求7:环境和可持续发展 了解与本专业相关的职业和行业的生产、设计、研究与开发、环境保护和可 持续发展等方面的方针、政策和法津、法规;能够正确认识专业工程实践对 课程目标:1 环境和社会可持续发展的影响,合理评价专业工程实践和复杂工程问题解决 方案对社会、健康、安全、法律及文化的影响。 毕业要求8:职业规范 具有坚定正确的政治方向,良好的思想品德、社会公德和职业道德;具有人 课程目标:5、 文社会科学素养、社会责任感;拥有非常良好的体质和心理素质,能履行建 6、7 设祖国和保卫祖国的神圣义务。 3 课程目标对毕 毕业要求 业要求的支撑 关系 毕业要求9 :个人和团队 课程目标:4 具有在多学科团队中发挥及其重要的作用的能力。 毕业要求10:沟通 能够就复杂计算机工程问题与业界同行及社会公众进行相对有效沟通与交流,包 课程目标:4 括撰写报告和设计文稿、陈述发言、清晰表达个人见解等,并具备一定的国 际视野,能够在跨文化背景下做沟通和交流。 毕业要求11:项目管理 具有一定的组织与工程管理能力、表达与人际交往能力及在多学科背景下 课程目标:4 的团队中发挥作用的能力。 毕业要求12:终身学习 课程目标:5、 具有自主学习和终身学习的意识,有不断学习和适应发展的能力。 6、7 二、课程内容、基础要求及学时分配 本课程介绍智能计算系统领域的知识和工程实践方法,最重要的包含算法原理、硬件架构、软硬 件协同、软件栈适配等问题。 对应的 支持毕业 序 学 教学 教学内容 基础要求及重点和难点 教学目 要求指标 号 时 方式 标 点 基本要求:了解智能计算系 统所涉及到的软硬件架构。 智能计算前沿概述 重点:进行充分的文献调研 课堂讲 深度学习系统; 和阅读,理解软硬件协同的 授+课 1 硬件层基本架构; 2 1 6,7 原理与重要性。 后调研 软件栈基本架构; 难点:理解新型智能计算系 +答疑 计算效率优化原理等。 统怎么样提高计算效率、解决 系统性能瓶颈等问题。 4 对应的 支持毕业 序 学 教学 教学内容 基础要求及重点和难点 教学目 要求指标 号 时 方式 标 点 基本要求:掌握智能计算所 涉及主流算法的数学模型和 理论分析方法。 课堂讲 智能计算原理与算法 重点:理解并掌握深度学习 授+课 1,2 ,3, 2 深度学习、图计算、机 4 1,3 领域等相关算法。 后作业 4 器视觉等。 难点:编程实现及调试,理 +答疑 解如何从系统层面优化算法 的效率。 基本要求:了解目前主流基 于 GPU/FPGA/ASIC 等平台 专用硬件架构 的专用架构与指令集,掌握 基于GPU/FPGA/ASIC 计算效率分析与优化的基本 课堂讲 等架构的智能计算专 思路。 授+课 1,2 ,3, 3 用平台;架构特点与指 6 2 ,4 ,5 重点:理解如何通过专用的 后作业 4 令集;计算效率分析与 架构设计来提升智能算法运 +答疑 优化途径;基本的设计 行的效率。 与工程化开发方法等。 难点:采用量化分析方法对 架构性能与效率做评估。 基本要求:了解面向专用架 构指令集的编译器基础原理 适配软件栈 和方法流程,并掌握目前主 专用计算架构编译器; 课堂讲 流成熟的软件栈使用方法。 系统建模与分析工具; 授+课 1,2 ,3, 4 重点:理解编译器与调度器 6 3,5,6 数据流映射、调度与优 后实践 4 的原理以及算子优化技巧。 化工具;异构平台算法 +答疑 难点:以智能计算专用架构 部署方法等。 平台为对象,采取了专用编译 器与软件栈优化智能算法计 5 对应的 支持毕业 序 学 教学 教学内容 基础要求及重点和难点 教学目 要求指标 号 时 方式 标 点 算效率,具有一定挑战性。 基本要求:掌握基本的模型 压缩、量化方法,并在计算 资源受限情况下对计算效率 模型轻量化方法 和精度进行折衷。 课堂讲 智能计算模型(尤其是 重点:掌握模型轻量化方法, 授+课 4 ,5,6, 1,2 ,3, 5 深度神经网络)压缩、 4 在嵌入式移动平台上进行模 后作业 7 4 稀疏化、量化等轻量化 型部署与优化。 +答疑 方法。 难点:模型轻量化处理后在 端侧进行实测,考查系统调 试与优化等动手能力。 基本要求:了解模型架构搜 索 (NAS )基本原理,掌握 模型架构搜索方法 主流的NAS 方法。 智能计算模型(尤其是 课堂讲 重点:面向特定硬件平台, 深度神经网络)架构自 授+课 4 ,5,6, 1,2 ,3, 6 采用NAS 方法对典型神经网 4 动搜索方法;考虑硬件 后作业 7 4 络进行结构搜索与优化。 计算与软件调度开销 +答疑 难点:如何量化建模硬件平 的模型搜索方法等。 台的约束是有效采用NAS 优 化网络结构的主体问题。 6 对应的 支持毕业 序 学 教学 教学内容 基础要求及重点和难点 教学目 要求指标 号 时 方式 标 点 基本要求:了解分布式深度 分布式学习方法 学习模型部署基本原理,掌 大规模高性能智能计 握主流分布式学习框架。 课堂讲 算分布式平台部署方 重点:掌握分布式学习效率 授+课 4 ,5,6, 1,2 ,3, 7 2 法;通信开销与模型同 与系统优化思路。 后实践 7 4 步代价优化;负载平衡 难点:如何寻求分布式学习 +答疑 与数据一致性问题等。 效率与成本的均衡方案,需 要进行实践探索。 基本要求:了解目前主流且 相对成熟的AI 专用计算平台 实践驱动案例 与系统,包括软硬件与相关 华为昇腾AI 芯片全栈 课堂讲 适配环境、工具。 5,6,7, 平台;寒武纪AI 芯片 授+课 3,4 ,5, 8 重点:掌握一套完整的AI 专 4 8,9,10, 平台;树莓派ARM 计 后实践 6,7 用计算系统,并付诸实践。 11,12 算平台;AutoTVM 系 +答疑 难点:实践涉及诸多新架构 统等。 思维、新平台环境等因素, 要一直探索、调试与优化。 三、课内外教学环节及基本要求 在教学过程中体现“学生主体、教师主导”的教学思想,提倡启发式、讨论式教学,突出对学 生逻辑思维、工程创新及实践能力的培养。在讲授过程中做到由浅入深、由表及里、循序渐进, 同时注重举例和类比,并加入该领域最新研究进展,活跃课堂,使课堂讲授生动有趣。 本课程课堂授课32 学时,周学时为2 学时,教育学生的方式包括课内教学和课外教学两部分,授课 语言为中文。课内教学采用多媒体讲义,包括课堂讲授、课堂讨论、课堂展示等。课外教学包括 课下自学、课外作业、系统开发、实验报告等环节。 部分教学内容采用项目式教学模式,注重学生实践动手能力,为学生提供丰富的软硬件实验 开发平台及实验指导书,提高学生利用现代工具解决工程实践问题的能力,并将前沿研究带入课 7 堂,给学生提供接触最新研究成果的机会,以及亲自参与最新科技进展的实践活动中来,培养其 浓厚的学术兴趣和优良的科研素养。 四、考核方式及成绩评定 本课程以平时成绩与项目实践相结合的方式来进行考核,总分为100 分。 平时成绩占50%:包含课程作业与交流讨论等。这中间还包括3 次作业与1 次文献调研: 作业1:深度学习算法设计与部署,基于主流模型与框架,占10 分; 作业2 :智能计算专用架构性能建模与评估,基于NVDLA 平台,占10 分; 作业3 :深度学习模型轻量化,基于Intel Distiller 工具,占10 分; 作业4 :模型架构搜索方法,基于NAS 工具,占10 分; 文献调研:阅读该领域相关优秀论文,展示PPT 进行交流讨论,占 10 分。 项目实践占50%:包含算法、系统实现、测试及报告、展示等。这中间还包括3 次课程实践: 项目1:基于AutoTVM 软件栈部署深度学习算法到树莓派平台,占15 分; 项目2 :基于寒武纪芯片平台利用Bang 语言设计机器学习算法,占15 分; 项目3 :基于基于AutoTVM 与Spark MLib 部署深度学习算法到分布式异构平台,占20 分。 五、教材和参考资料 参考资料: [1] 昇腾AI 处理器:架构与编程,梁晓峣著,清华大学出版社,2019 年。 [2] 当计算机体系结构遇到深度学习,杨海龙、王锐译,机械工业出版社,2019 年。 [3] AI For Systems and Systems For AI ,UCB CS294 课程,2019 年。 [4] System for ML,华盛顿大学CSE 599W 课程,2019 年。 [5] 智能计算系统,陈云霁,中科院大学课程,2019 年。 [6] Computer Architecture: A Quantitative Approach ,John L. Hennessy 著,Morgan Kaufmann Publishers ,2011 年。 [7] 深入理解计算机系统,Randal E. Bryant 和David OHallaron 著,机械工业出版社,2011 年。 [8] 机器学习,周志华著,清华大学出版社,2016 年。 [9] Learning Deep Architectures for AI ,Yoshua Bengio 著,Now Publishers Inc.,2009 年。 [10] 统计学习方法,李航著,清华大学出版社,2012 年。 [11] Machine Learning in Silicon ,UIUC ECE 598 NS 课程,Naresh R Shanbhag ,2016 年。 8 [12] Hardware acceleration for machine learning and big data analytics ,哥伦比亚大学E6895 Advanced Big Data Analytics 课程,Ching-Yung Lin ,2015 年。 [13] High Performance Computing with a Focus on Hardware Acceleration Technologies , University of Western Ontario 大学CS4435b-CS9624b 课程,Marc Moreno Maza ,2010 年。 [14] High-Performance Hardware for Machine Learning ,NIPS Tutorial ,William Dally,Stanford University & NVIDIA Corporation ,2015 年。 六、其它 本课程提供寒武纪、华为昇腾、树莓派等软硬件开发平台,包括深度学习GPU 服务器,以及 深度学习框架等工具环境支持。 9

  原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者