为落实《国家中长期科学和技术发展规划纲要( 2006-2020年)》,以及国务院《关于促进云计算创新发展,培育信息产业新业态的意见》和《关于印发促进大数据发展行动纲要的通知》等提出的任务,国家重点研发计划启动实施“云计算和大数据”重点专项。 根据本重点专项实施方案的部署, 现发布 2018 年度项目申报指南。
本重点专项总体目标是:形成自主可控的云计算和大数据技术体系、标准规范和解决方案;在云计算与大数据的重大设备、核心软件、支撑平台等方面突破一批关键技术;基本形成以云计算与大数据骨干企业为主体的产业生态体系和具有全球竞争优势的云计算与大数据产业集群;提升资源汇聚、数据收集、存储管理、分析挖掘、安全保障、按需服务等能力,实现核心关键技术自主可控。
本重点专项按照云计算和大数据基础设施、基于云模式和数据驱动的新型软件、大数据分析应用与类人智能、云端融合的感知认知与人机交互等 4 个创新链(技术方向),共部署 31 个重点研究任务。专项实施周期为 5 年( 2016—2020 年)。
2016 年,本重点专项在 4 个技术方向已启动 12 个研究任务的 15 个项目。 2017 年,在 4 个技术方向已启动 15 个研究任务的15 个项目。 2018 年,在 4 个技术方向启动 20 个研究任务,拟支持 20-40 个项目,拟安排国拨经费总概算为 6.25 亿元。凡企业牵头的项目须自筹配套经费,配套经费总额与国拨经费总额比例不低于1:1。
项目统一按指南二级标题(如 1.1)的研究方向组织申报。除特殊说明外,拟支持项目数均为 1-2 项。项目实施周期不超过 3年。申报项目的研究内容须涵盖该二级标题下指南所列的全部考核指标。项目下设课题数原则上不超过 5 个,每个课题参研单位原则上不超过 5 个。项目设 1 名项目负责人,项目中每个课题设1 名课题负责人。
指南中“拟支持项目数为 1-2 项”是指:在同一研究方向下,当出现申报项目评审结果前两位评价相近、技术路线明显不同的情况时,可同时支持这 2 个项目。 2 个项目将采取分两个阶段支持的方式。第一阶段完成后将对 2 个项目执行情况进行评估,根据评估结果确定后续支持方式。
1. 云计算和大数据基础设施
1.1 数据科学的若干基础理论(基础研究类)
研究内容:研究大数据的统一表示和有效度量;研究大数据的新型计算复杂性理论;研究高通量计算理论与算法;研究近似
计算理论与算法;研究数据副本一致性理论、数据压缩与摘要理论;研究数据数据权属理论等。
考核指标:形成有国际性影响的数据科学理论体系,研制可验证其理论和算法有效性的原型系统,发表一批高水平学术论文和若干专著。在关键技术上申请系列专利,形成专利群。
1.2 基于非易失存储器( NVM)的 TB 级持久性内存存储技术与系统(共性关键技术类)
研究内容:研究基于持久性内存的混合主存系统 I/O 栈与存储管理策略;研究分布式持久性内存文件系统;研究基于远程直接数据存取( RDMA)的分布式持久性共享内存新型编程模型及其应用编程接口; 构建分布式持久性内存存储系统; 研制基于 TB级内存系统的典型大数据应用系统扩展并示范应用。
考核指标:研制不少于 8 节点的内存存储系统,每节点均包含 TB 级非易失性内存;分布式内存系统中节点间通信延迟不超过 1µs,高负载通信延迟不超过 10µs,带宽可扩展, 8 节点带宽不低于 40GB/s;读操作 ops 不低于 5000 万/s,写操作 ops 不低于1000 万/s;在 ZB 级大数据场景下应用于 1-3 个典型领域。在关键技术上申请系列专利, 形成专利群, 发表一批高水平学术论文。
1.3 面向异构体系结构的高性能分布式数据处理技术与系统(共性关键技术类)
研究内容:面向分布式异构体系结构,研究基于数据流的编程模型、性能分析方法、同步与通信技术和运行时系统,并实现高通量视频等典型应用示范。具体内容:支持异构体系结构上的数据流编程模型与软件工具链;异构体系结构上的运行时系统,支持 CPU 与加速器之间的高效率混合执行,支持加速器上的细粒度流水线并行; 性能分析技术和优化调度技术, 优化分配 CPU 与加速器上的运行资源;分布式异构系统数据处理技术,包括数据与计算的高效划分技术、负载平衡以及高性能同步与通信技术。
考核指标:支持 CPU-GPU 异构体系结构,并支持单机多加速器和多机多加速器。性能分析工具支持多种程序执行模式的优化选取,并可给出混合模式时的 CPU-GPU 执行比例。支持单个GPU SM 上部署多个核( kernel)的细粒度任务调度,以及以此为基础的流水线并行模式。单机和多机(不低于 8 台服务器 16 块GPU)上 CPU/GPU 细粒度混合执行的应用性能是当前通用 CPU的 5 倍以上,是仅实现粗粒度并行性的 GPU 的 2 倍以上。在关键技术上申请系列专利, 形成专利群, 发表一批高水平学术论文。
1.4 面向图计算的通用计算机技术与系统(共性关键技术类)
研究内容:研究图计算众核处理器和异构图计算机体系结构;研制支撑异构图计算机的系统软件;研究面向异构图计算机系统的分布式处理技术;研究基于异构图计算机的数据管理与处理系统;研制基于异构的图计算机的通用计算机系统,开展应用示范。
考核指标:研制面向图计算的众核处理器芯片原型;研制基于已有加速器的低功耗异构的图计算系统,单节点图计算机总体性能达到 GTEPS,性能功耗比提升 10 倍;在浮点运算能力不大于 1TFlops 的条件下,每秒处理的边数大于 10GTEPS,静态图计算可获得 2-3 倍加速比; 单节点支持 50 亿条边的图数据存储和查询,平均查询响应时间为秒级,支持每秒 10 万边的图流数据分析;针对金融等领域 2 个以上典型应用开展应用验证。在关键技术上申请系列专利,形成专利群。发表一批高水平学术论文。
1.5 面向国产处理器的虚拟化技术与系统(共性关键技术类)
研究内容:研究面向国产单核/多核/众核处理器的虚拟化架构、虚拟化技术、容器技术等;研究虚拟执行环境的构建与优化技术、虚拟计算环境下应用驱动的软件栈设计/构造的理论和方法;研究轻量级虚拟机镜像定制、应用定制的虚拟机优化等方法和技术,构造面向特定领域/应用的轻量级虚拟机;研究虚拟化和虚拟机的性能评价方法与基准测试、性能调优工具;研制采用国产单核/多核/众核处理器的云服务器原型,在云计算系统中应用验证。
考核指标:研发面向国产处理器的虚拟化、虚拟机监控器、虚拟机三类核心技术,支持多核、众核异构计算资源的虚拟化,支持虚拟资源的统一调度和分配,基于多核的国产服务器虚拟机数量不小于 256,每虚拟机内存最大 2TB,处理器和内存虚拟化开销小于百分之三;采用国产处理器的云服务器原型在关键行业的云计算系统中开展应用验证,在典型云计算应用负载下,与采用 X86 处理器的云服务器对应指标相当, 提升基于国产处理器的云装备在云计算行业的应用能力。申请系列专利,发表一批高水平学术论文。
1.6 数据驱动的云数据中心智能管理技术与平台(共性关键技术类)
研究内容:研究超大规模云数据中心运行数据的管理方法;研究基于运行数据的云数据中心运行评估与预测技术,实现数据驱动的云数据中心运行精准化评估与预测;研究数据驱动的大规模云数据中心资源智能调度与管理技术;面向典型领域,研究应用导向的云工作流智能管理与调度技术,提供高能效、高服务质量的云工作流应用服务;研制云数据中心智能部署、运维管理与服务能力保障系统,并开展示范应用。
考核指标:形成智能化的云数据中心系统运行评估、行为预测、资源调度、工作流管理与系统运维的关键技术体系;云工作流和云服务请求的接受率比当前主流水平提升 20%以上,满足用户在时间和成本等多方面的差异化需求;研制的云数据中心智能管理系统在数十万台量级服务器规模的云数据中心开展示范应用;申请系列专利,发表一批高水平学术论文,并完成若干国家标准(送审稿)或国际标准提案。
2. 基于云模式和数据驱动的新型软件
2.1 群智化生态化软件开发方法与环境(基础研究类)
研究内容:研究基于互联网的群体智能的形成机理、软件生态系统中的群体协作规律、社区组织模式、社会化特性和最佳实践;研究软件生态系统的多维度度量和评估方法、软件生态系统形成和演化的微过程模型等;研究基于大规模群体协同的在线需求获取与建模、软件设计与建模、软件构造与测试、个体信息融合与个性化信息推荐等群智软件开发模式与方法;研制基于群体智能的协作式软件开发、管理和维护支撑工具集及平台,形成支持智能化群体协作的软件开发环境,并进行示范应用。
考核指标:建立基于群智协作的软件开发模型与机制,形成覆盖软件生命全周期的群智软件开发方法、工具、环境和最佳实践,支持单一项目数千名开发者规模;形成兼容国际主流、符合中国特色的群智化软件开发生态系统建设方案,实际应用于 10个以上项目合计 1000 名以上开发者;发表一批高水平学术论文,申请系列知识产权。