各有关单位:
根据《国务院关于改进加强中央财政科研项目和资金管理的若干意见》(国发〔2014〕11号)、《国务院关于深化中央财政科技计划(专项、基金等)管理改革方案的通知》(国发〔2014〕64号)、《科技部关于印发〈新一代人工智能重大科技项目实施方案〉的通知》(国科发高〔2017〕344号)等文件要求,现将科技创新2030—“新一代人工智能”重大项目2020年度第一批项目申报指南(征求意见稿,见附件)向社会征求意见和建议。征求意见时间为2020年1月3日至2020年1月9日。
“新一代人工智能”重大项目的凝练布局和任务部署已经战略咨询与综合评审特邀委员会咨询评议,并报国务院批准实施。本次征求意见重点针对指南方向提出的目标指标和相关内容的合理性、科学性、先进性等方面听取各方意见。科技部将认真研究反馈意见,修改完善重大项目的项目申报指南。征集到的意见将不再反馈和回复。
相关意见请于1月9日17:00之前发至电子邮箱:gxs_xxc@most.cn。
科技处高新司
2020年1月3日
附件:科技创新2030—”新一代人工智能“重大项目2020年度第一批项目申报指南征求意见稿.pdf
2020 年度第一批项目申报指南
为落实《新一代人工智能发展规划》,启动实施科技创新2030—“ 新一代人工智能” 重大项目( 以下简称“ 本重大项目”)。根据本重大项目实施方案的部署,现提出2020 年度第一批项目申报指南。
本重大项目的总体目标是: 以推动人工智能技术持续创新和与经济社会深度融合为主线,按照并跑、领跑两步走战略,围绕大数据智能、跨媒体智能、群体智能、混合增强智能、自主智能系统等五大方向持续攻关,从基础理论、支撑体系、关键技术、创新应用四个层面构筑知识群、技术群和产品群的生态环境,抢占人工智能技术制高点,妥善应对可能带来的新问题和新挑战,促进大众创业万众创新,使人工智能成为智能经济社会发展的强大引擎。
1. 新一代人工智能基础理论
1.1 脑结构和功能启发的新型神经网络模型
研究内容:针对当前神经网络计算模型依赖大量标注样本、鲁棒性和适应性差、可解释性不足、能效比低等固有局限,研究分析海量大脑皮层范围内的高分辨率响应数据,解析反演神经回路工作机理;受特定神经环路启发,发展具有记忆、稀疏编码等特征的新一代神经网络模型;研究大规模复杂网络的高效学习和计算方法,发展复杂网络泛化性理论;设计具有自纠错能力的神经网络结构,突破自学习、小样本学习、可解释性等智能新理论与新方法。
考核指标: 构建具备学习、记忆等认知能力的神经网络计算模型,模型规模不少于百万量级神经元;具备自纠错、可迁移能力,噪声环境下的模型性能有数量级提升;设计自学习、小样本学习方法, 相同性能条件下所需标注数据数量级减少;通过知识归纳和迁移,对模型结果和性能提升具备可解释性;开源新型神经网络计算数据、模型和代码等。
1.2 基于脉冲神经网络的感知-学习-决策神经网络模型
研究内容:构建以神经系统可塑性为核心的多脑区协同脉冲神经网络计算模型,建立具备生物合理性和生物可解释性的多尺度脉冲神经网络学习算法,突破多脑区协同视听觉感知-学习-决策等复杂环路神经网络模型,以无人机、机器人等为载体探索自主智能实现途径。
考核指标:学习与决策神经网络可塑性计算模型要求具备生物合理性与生物可解释性;模拟多个脑区的自主感知-学习-决策协同计算模型,能够支持基于复杂视、听觉感知的类脑自主学习与决策,支持反转学习与决策等;开源类脑学习与决策脉冲神经网络数据、模型和代码等。
1.3 认知计算基础理论与方法研究
研究内容:聚焦开放、动态、真实环境下推理与决策重大问题,开展常识学习、直觉推理、自主演化、因果分析等理论和方法研究,重点突破刻画环境自适应、不完全推理、自主学习、对抗学习、智能体协同优化等特点的认知计算理论和算法,在自主智能、群体智能或混合增强智能等智能形态方面实现应用验证。
考核指标:形成能适应多种智能形态的认知计算框架,构建大规模、共享开放的跨媒体常识知识库,提出并实现通用认知测试方法;在对抗决策、人机混合或自主学习中形成和常识结合的认知理论,显著提升现有算法在开放环境下的鲁棒性;建立具有国际影响力的开源开放认知智能水平国际评测体系。
1.4 以自然语言为核心的语义理解研究
研究内容:针对从互联网海量文本、自然标注大数据和多模态关联数据获取开放域知识等问题,研究基于知识图谱、事理图谱等大规模多元知识的自然语言语义分析方法,研究兼具逻辑性和艺术表现力的可理解、可解释文本生成方法,研究通过与环境和社会跨模态交互的语言进化计算模型,突破层次深、鲁棒性强、对稀缺语料适应能力好的中文自然语言理解技术,为认知智能提供通用语言模型和基本工具支撑。
考核指标:从互联网海量文本中自动获取知识和语义分析能力得到可验证的数量级提高;提出若干语言文本分析和生成任务,达到与人类可比的认知水平;形成跨模态表达的语言理解基本工具,形成具有国际影响力的跨模态实体、事件理解、对话理解基准测试集;开源基准学习和测试集合、模型和语言理解基本工具等。
1.5 高级机器学习理论研究
研究内容:研究具有自组织、自学习、自适应、自涌现等特点的机器学习新理论;研究不完全信息下推理决策与演化完善的学习理论;研究具有可解释性的机器学习理论和方法;研究小样本学习、深度强化学习、无监督学习、半监督学习、迁移学习、表征学习等理论和模型;研究量子机器学习、对偶学习、分布式学习、元学习及其它高级机器学习基础理论和方法等。
考核指标:围绕上述研究内容和具体需求场景,形成从数据、模型到算法的理论成果,建立可验证的系统、开源数据、模型和代码等。
申报说明:本任务为开放性研究项目,不下设课题,申请者可就上述涉及的部分研究内容进行申报,提出明确的任务目标和具体的考核指标。项目负责人需为1980 年1 月1 日后出生的青年研究人员。
1.6 人工智能安全基础理论及验证模型
研究内容:针对深度学习等模型,研究可信度量方法和安全形式化验证方法,支持复杂智能系统内在结构与行为功能的一致性、可达性、安全性判定;研究包含智能组件的软件系统的模型化开发和验证技术以及基于动态数据收集的安全认证模型与方法,研制建模、开发与验证一体化工具;在黑盒与白盒不同场景下,研究基于差分测试、变异测试、动态符号执行测试等软件测试技术的智能系统测试方法和测试样本的自动生成等关键技术;针对恶意样本等攻击手段,研究具有可扩展性的可认证鲁棒学习模型,研究新型的对抗实例训练策略及验证问题关系,提高测量防御技术的有效性;研究软硬件一体的安全攸关复杂智能系统的安全验证技术、优化技术和硬件架构安全适配。研究基于验证与测试技术的智能系统全周期安全评估、鲁棒性验证和性能保障技术与方法。
考核指标:建立多领域技术融合、支持大规模人工智能系统自主安全防御的理论体系;提出至少三种具有群体智能鲁棒性构造、恶意攻击自动识别的安全自动化攻防技术;建立支持主流大数据集上亿级神经网络参数的智能安全防御与性能验证平台,实现准实时运行响应;突破安全关键复杂智能系统的可信验证技术,支持不少于3 种常见深度学习模型的安全结构度量和形式化验证,参数规模不低于百万级;突破软硬件一体验证与优化技术,支持FPGA 、GPU 、ARM 等不少于3 种硬件环境。
2. 新一代人工智能共性关键技术
2.1 以中文为核心的多语种自动翻译研究
研究内容:聚焦语言大互通的需要,研发以中文为核心的多语种、多模态口语自动翻译技术,重点突破面向数据和专家资源稀缺的小语种语音及语言技术研发的无监督/ 弱监督学习、迁移学习、端到端语音翻译等技术,突破具备场景感知能力的图像光学字符识别、翻译、和图像生成技术,实现高可用近远场口语语音识别和语音合成技术,以及相关语种到汉语之间的双向互译技术,并完成相应的语音翻译和图片翻译的云服务在智能终端上的应用,实现政务、教育、媒体、商务、旅游、就医等典型场景的口语自动翻译服务。
考核指标:在即时和近远场翻译场景下,实现维吾尔语、哈萨克语、阿拉伯语、俄语、泰语、马来语、越南语、印尼语等多个小语种到汉语之间的双向语音翻译和图片翻译,形成面向多种应用场景的自动翻译系统和验证应用;小语种近场口语翻译可达到人类同传水平;近距离、少噪声条件下,印刷品识别准确率达到98% 以上,翻译准确率超过90%;远距离、多噪声条件下,非印刷品识别准确率达到90% 以上,翻译准确率超过80% 。
2.2 鲁棒安全的人机共驾系统
研究内容:针对动态、开放的真实交通环境下无人驾驶车辆适应性差、安全性弱等问题,研究人类驾驶员和智能驾驶系统同时在环共享驾驶权的人机共驾方法,实现人在回路的数据、信息、语义及知识等多层次的人机交互与协同;建立人机协同的多模态感知、交互意图理解的计算模型,实现人机一致性的情境理解与预测、决策与控制;研究可解释的自主决策与可解译的决策过程模型与算法,形成人机冲突机理分析及人机混合决策的在线评估理论与方法;构建人机共驾的云学习平台和支撑环境,实现安全、舒适、敏捷灵活的智能驾驶。
考核指标:提出并验证针对系统对驾驶人行为感知准确率、对驾驶人状态估计与意图预测准确率、常规工况下驾驶行为的动态约束及反馈频率、紧急工况下控制权分配与失效安全策略计算周期等关键指标;人机共驾系统中驾驶人对控制系统的预见性以及满意度的主观评分在8 分以上(10 分制);搭建分析人车耦合与人机共驾机理的软件虚拟仿真平台1 套、硬件在环半实物仿真平台1 套、人机共驾云学习平台1 套,核心技术在权威国际评测中达到先进水平。
2.3 无人集群系统自主协同关键技术研究及验证
研究内容:针对高动态、不确定、资源受限等复杂环境,面向协同区域搜索、集群优化调度等多任务应用需求,研究无人集群系统的通用/ 开放式体系架构和建模方法,提升无人集群系统的场景适应能力和异构无人自主系统间的互操作能力;研究不确定和资源受限条件下高质量传感数据处理、共享及多源信息融合技术,提升无人集群系统的分布式态势感知与认知能力;研究可引导、可信任、可进化的集群无人系统规划、决策与控制技术,提升无人集群系统的鲁棒性和智能化水平;面向灾害救援、环境监测、区域物流、应急处理等应用场景,进行基于无人集群自主协同的验证。
考核指标:建立开放式的无人集群系统架构,支持集群节点数量不少于100 个,支持不少于3 种复杂动态任务场景,并具备节点数量和任务场景的可扩展能力;实现由至少2 种异构无人自主平台组成的集群任务验证;能够适应强干扰、变通信拓扑等挑战环境下的态势感知和认知任务要求;实现不依赖于群体规模的任务规划、自主决策与控制算法,实现通用计算平台下实时规划和决策,并建立群体智能的自主学习与进化模式,形成可快速进行大规模应用复制的应用验证。
2.4 具有自主学习能力的超级品质检验关键技术
研究内容:以具有产品型号多样、材质透明反光、尺寸大小不一、质检岗位劳动力密集等特点的典型制造领域为验证场景,研制具有人眼仿生机理的成像系统,针对复杂背景下高效率、高精度、弱对比、多种类的缺陷检测要求,研究小样本、弱监督条件下具备强适应能力的外观缺陷技能学习关键技术;研究海量工业外观数据的快速重塑映射管理方法,实现若干典型工业外观数据库的构建;研究知识增长型的学习模型建立方法,实现甄别技能的在线学习与增强;研究技能迁移学习方法,实现多类别外观的技能高效传授,解决制造行业外观检测环节用工难的行业痛点。
考核指标:构建不少于3 类的符合指南特点的工业外观缺陷大规模数据库,指标具有行业领先性;开发可在线学习与增强的甄别学习技能平台软件,形成任务迁移学习能力,实现不同质检任务迁移单次不超过0.5 小时;在典型场景下达到并超过人工检测能力,召回率大于97%,准确率大于95%;可面向不同质检场景进行自主学习,形成具有适应能力的通用型品质检验关键技术,在不少于2 个行业的龙头企业形成代表性应用。
2.5 复杂社会信息网络下的风险感知与智能决策研究
研究内容:面向多源、异构和跨模态复杂社会信息,研究语义融合、网络表征和动态演化的理论框架;提出面向多维度、多尺度社会信息网络的风险感知、智能分析和群体决策的社会计算范式,研究和构建融合全球多语种、跨模态大数据驱动的社会风险机理和分析模型与方法;研究信息网络的实体及关联知识联合提取方法,构建支撑风险评估与智能决策的时序知识图谱,研究复杂社会网络图表征学习框架,提出领域知识与数据驱动的智能群体决策方法,支持智能决策的自主评价与推演;构建面向重大需求的风险预警、智能分析、群体决策的软硬件一体化大数据计算平台。
考核指标:具备融合全球二十个以上语种、十万家公开信息源的大规模社会信息的获取和融合能力;构建面向社会信息风险与决策的千万级结点、亿级边的知识图谱,研制不少于100 种社会风险感知与智能决策算法模型;具备在百亿级条边规模的社会复杂网络上进行分析和决策的能力,实现千万级节点规模网络上的分钟级搜索响应和分钟级挖掘与推荐计算能力;在不少于2 个面向重大社会风险预警和智能决策的典型领域进行规模化应用验证。
2.6 亿级节点时序图谱实时智能分析关键技术与系统
研究内容:聚焦海量金融交易数据实时风险防控重大问题,研究建立多领域( 股票、期货、债券、上市公司、金融人物等) 金融知识图谱技术;构建实时、动态、可追溯的超大规模时序关联图及实时智能分析研究,突破面向时序关联图的快速构建、查询语言设计、动态分析以及实时智能决策等关键技术;研究时序关联图的挖掘、推理与归纳以及可解释规则自动生成,重点突破金融实时风控场景下的数据与知识混合驱动的风险预测研究并开展应用验证。通过对互联网金融用户十亿节点级别规模网络构建,并融合相关领域知识图谱,以及复杂异构网络上金融舆情/ 黑天鹅事件传播预测及关键节点辨识、推理和控制,达到风险预警及防范目的。
考核指标:构建面向金融领域的千万级知识图谱,涵盖不少于5 个领域,实现多个领域知识图谱的关联与融合;时序图谱支持金融风险防范领域常用的时序复杂边,具备单节点10 万tps 、集群200 万tps 关联图构建能力,每笔处理平均延时在10 毫秒以内;亿级节点量级下实现多层关系的实时查询;支持基于时序关联图的金融实时风控场景高级认知模型研究,具备可解释性,并在不少于5 家金融机构进行风险防控的应用验证。
2.7 复杂版面手写图文识别及理解关键技术研究
研究内容:聚焦千万教师日常担负大量试卷和作业阅卷工作的减负迫切需求,开展多学科多题型纸笔考试和作业的智能阅卷技术研发,基于教育大数据、跨媒体分析及自然语言理解等,突破面向纸笔考试及作业的复杂版面分析、手写图文及公式识别、作文自动评分、文科答案语义理解评分、理科解题步骤分析评分及抄袭检测等智能阅卷关键技术,实现和教师阅卷能力协作的增强型高可用智能阅卷系统研发。
考核指标:复杂版面分析的正确率达到99% 以上,手写图文及公式识别正确率达到96% 以上,中英文作文自动评分及文科简答题评分性能达到人工专家99% 水平,理科解题步骤分析评分能力达到人工专家95% 水平,抄袭检测的正确率达到98% 以上,智能阅卷技术在语文、数学等学科以及100 所以上学校实现常态化应用。
2.8 拟人化人机交互服务关键技术与系统
研究内容:面向电话、在线文本客服及面对面咨询、销售及服务等复杂场景,研究口语化语音识别、拟人语音合成和口语化处理技术;研究基于场景知识图谱的上下文语义解析和检索技术、基于对话管理和知识驱动的多轮对话技术、基于用户画像的个性化反馈对话技术,以及基于对话状态监测的自动反馈应答技术等;研究突破高噪声服务环境下的视听觉环境感知技术,基于语音、五官、表情、手势、肢体语言等多模态用户意图识别技术,基于语言及视觉的多模态知识表达与推理技术,突破真实场景下跨模态的多媒体及语义理解;研究用户情感感知与个性化智能服务技术,以用户体验为中心的人机协同智能用户服务技术;研究低资源场景下的迁移学习技术,研究解决对新场景系统冷启动等问题;构建具备反馈式学习能力的开放式智能客服平台,实现面向全领域可定制的对话理解。
考核指标:智能客服平台实现口语语音识别率超过95% 、口语语音合成MOS 得分接近人类水平、对话正确响应率不低于95% 的领域效果,提出能够有效体现机器对话智能的图灵测试方案,并在至少3 个领域通过测试验证;规模为千万级别的大数据用户行为视频理解,情感分析和行为理解正确率超过90%;能够进行多种复杂任务的领域迁移,具备支撑亿级用户规模应用的能力,给定任务完成率不低于90%;对研究者授权开放带标注的真实场景多轮对话不少于100 万段。
2.9 混合增强在线教育关键技术与系统研究
研究内容:针对在线教育存在情境多变难感知、用户体验难适配、认知过载易迷航等难题,研究虚实结合的体验式、沉浸化学习环境。研究学习行为分析、意图理解、认知状态追踪等学习认知模型,实现学习认知过程的多维度、跨学科跟踪;综合多模态人机交互、知识图谱、强化学习等方法,研究面向个性化伴学的智能导学方法,打通学习规划-内容推荐-辅导答疑等环节,构造因材施教的虚拟智能助教和导师;研究基于人机混合智能的群体化学习组织、激励、评测、辅导和优化方法,建立支撑群体化课程学习和在线实践的智能平台; 研究混合增强在线教学质量综合分析和优化方法。

