机器世界新技术:视频编码前沿技术探索和标准化发展路线 | CNCC论坛分享
2022年12月10日CNCC2022论坛“机器世界新技术:视频编码前沿技术探索和标准化发展路线”线上举办。点击文末左下角“阅读原文”,可观看论坛视频回放。
本次论坛由CCF主办,中国科学院计算技术研究所联合中国电信研究院共同承办,中国科学院计算技术研究所纪雯研究员和中国电信研究院大数据与人工智能研究所副所长张园共同主持了论坛。论坛邀请了浙江大学虞露教授、中国科学技术大学教授陈志波、中国电信研究院大数据与人工智能研究所所长杨明川、中国航天五院503所高级工程师贺广均、西北工业大学无人机研究所高级工程师王健,瑞士联邦理工学院EPFL教授Ebrahimi Touradj等多位专家参与。深入探讨了视频编码的革新技术和标准化发展路线,分析了我国视频编码标准20年发展历程,系统阐述我国视频编码技术和标准的突破性进展,然后研讨面向机器视觉编码VCM和DCM的新标准体系,为我国视频编码技术和标准研究占据国际新高点提供交流平台。
论坛主席纪雯研究员致辞
论坛主席张园副所长致辞
浙江大学虞露教授以“图像视频编码标准演进——从面向人类视觉到服务机器智能”为题,介绍了面向机器视觉的编码技术在标准层面的进展情况。报告重点分享了近几年在DCM、VCM标准活动中所涌现的典型的编码新技术,并分析了该方向的发展趋势和潜力。首先,回顾了中国团队在AVS标准化二十年的技术积累、管理经验和人才储备基础,介绍了在国际上面向机器智能的图像视频编码标准化新方向以及新成立的DCM、VCM标准组织。然后还介绍了图像视频编码中的学术研究和标准发展新方向情况。在数字经济社会,智能机器正在广泛领域取代人类“观看”海量的图像视频数据,机器智能编码既可以节省大量人力资源、又可以提高有效信息的获取精度和速度。
浙江大学虞露教授作报告
中国电信研究院大数据与人工智能研究所所长、CCSA TC1副主席杨明川做了题为“机器视觉标准与应用”的特邀报告。以机器视觉为切入点,介绍了机器视觉系统组成、相关标准组织及工作进展、典型应用场景及产业化,包括ISO/IEC JTC1、ITU-T、SAC等机器视觉编码、应用、系统测试等相关标准组织的工作及最新进展,智慧工业、智慧安防、智慧交通等产业应用。此外,杨明川所长还与大家共同探讨了未来技术路径和标准化工作方向,以及对垂直行业与通信产业的价值和意义。
中国电信研究院大数据与人工智能研究所杨明川所长作报告
中国科学院计算技术研究所纪雯研究员以“机器视觉编码:基本原理、核心技术和标准化路线”为题,从机器视觉的重大应用场景展开分析,诠释了机器视觉的基本范围,介绍了面向机器视觉信号的编码设计基本原理,给出了将机器视觉编码核心问题归纳为编码三大本质问题R-Q-C的方法。系统地给出了机器视觉编码的基本原理,并通过对比机器视觉和人类视觉编码的区别和难点分析出编码潜在的突破点,并分析了机器视觉编码研发及应用中存在的瓶颈。然后分享了已研发出的机器视觉编码核心技术的进展,包括框架、方法以及解决思路,同时阐述了多个利用机器视觉编码技术的具体应用;通过典型的编码构造方法,给出机器视觉编码未来的发展方向。在标准化方面,给出了机器视觉编码标准化的现有路线及其未来的标准化发展方向。特别介绍了自主研发完成的新型机器视觉处理硬件“龙眼派”,为国产化的机器视觉产业提供专用开发和应用平台。
中国科学院计算技术研究所纪雯研究员作报告
航天五院503所贺广均高级工程师以“遥感通用视觉基础模型研究与应用”为题,介绍了机器视觉编码技术在航天遥感领域的迫切需求相关应用,报告通过机器视觉编码与遥感大数据、遥感通用视觉基础模型构建、试验验证与应用三个部分,指出了人工智能算法的快速发展促进了遥感图像解译精度和效率的显著提升,为卫星遥感信息实时获取与应用开辟了新途径,但是卫星遥感数据时空域多尺度特性导致遥感图像存在不适定,数据偏移等问题,因此以遥感通用视觉基础模型构建与应用为导向,结合大规模遥感数据无监督和弱监督协同训练理论,介绍了遥感视觉基础大模型构建与应用方法。相关技术的进步将对我国航天、社会和经济发展做出巨大贡献。
中国航天五院503所贺广均高级工程师作报告
瑞士洛桑联邦理工学院(EPFL)教授Ebrahimi Touradj做了题为“AI-based Visual Information Coding in JPEG”的报告。Ebrahimi Touradj教授在报告中展示了现今利用AI提升编码效果的三类主流方法,并对JPEG在AI方面探索的提案进行介绍,其不仅考虑到了传统针对人类主观视觉的图像压缩技术,对于如超分、降噪、颜色矫正和去水印等图像处理任务,以及图像分类、目标检测、语义分割等相关机器视觉任务的性能提升也有所涉猎。报告介绍了JPEG应对不同视觉处理任务挑战的各类优秀技术,为相关领域研究者开展系统深入的研究提供了宝贵的思路和方向。
瑞士联邦理工学院EPFL的Ebrahimi Touradj教授作报告
论坛的Panel环节,各位与会专家就视频编码标准差异、编码标准落地、国际合作、异构数据的机器视觉编码方法等关键问题提出相应的观点并展开讨论。西北工业大学无人机研究所王健高级工程师还给出了机器视觉编码技术在无人机方面的应用方向。与会专家探讨分析了机器视觉编码的相关产业需求以及当前相关领域国内外发展现状,对今后视频编码和机器视觉行业的发展具有很好的借鉴意义。
圆桌论坛讨论
在本次论坛中,多位行业专家交流碰撞了视频编码以及面向机器视角新计算等学科建设和标准发展交叉创新中的最新进展及未来潜力,同时通过线上微信交流,与会者也参与了热烈讨论,在愉快的交流中,论坛圆满成功。视频编码新标准长风破浪会有时,期待明年山花烂漫季、万象更新时与各位同仁再聚首!