崂山论剑:寻找人工智能跨媒体杀手级应用

什么是跨媒体?为什么在人工智能时代下要讨论“跨媒体”?跨媒体智能又该如何做?

4月19日,AI Tech跨媒体智能主题分论坛成功举办,来自学界与产业界的大拿共聚一堂,共同探讨了“跨媒体智能”这个前沿话题。

浙江大学信息学部主任、之江实验室副主任鲍虎军近期研究的课题是云端结合与增强现实技术与平台。他介绍道,目前由于移动端计算能力、功耗等资源的限制,计算主要还是在云端进行,而未来发展的趋势一定是云端结合。

其中,前端就涉及三个核心技术,一个是定位跟踪和三维注册,第二个是如何实现虚实融合,第三是需要大规模的对尺度很大的时候场景数据进行有效的管理。另一方面,在云端也要有相应的技术与前端进行有机结合。这其中就涉及几个关键技术,第一是定位跟踪与三维注册,第二是三维重建,第三是虚实融合。

鲍虎军还谈到,目前VR缺乏一个应用系统定制的工具链,另外如何在更广域的范围上实现高精度跟踪、把物体的鲁棒性与跟踪信息融为一体、云端之间如何更高效地进行协同计算,都是未来需要解决的问题。最后,鲍虎军提到,自动驾驶与实景导航和工业生产制造是AI未来两个非常重要的应用。

崂山论剑:寻找人工智能跨媒体杀手级应用

△鲍虎军

华为首席科学家田奇则介绍了计算机视觉的新发展。首先,田奇介绍了目前计算机视觉发展的三个改变。一是传统二维视觉向三维视觉的改变,二是涉及深度学习模型时希望做到软硬件涉及一体化,三是在采用自动化或半自动化的方法收集、清洗、标注数据以及设计、训练深度学习模型。

崂山论剑:寻找人工智能跨媒体杀手级应用

△田奇

北京航空航天大学研究生院副院长李波分享了《面向公共安全的天空地网大数据一体化处理》的主题演讲。他提到,现在的世界是“三元世界”,即人、机、物融合的世界,在这个世界中谈公共安全,就需要考虑到世界中各个维度的信息处理,即要从物理世界和网络世界两个方面综合考虑。

在物理世界,如何获取天地空的数据,以及获取到不同空间尺度和成像质量的数据,如何解决影像信息的关联检查不准确等问题,都仍需要技术突破去改变。在网络世界,如何在海量数据中挖掘有用信息,是目前的一大挑战。此外,要将物理和网络世界的信息综合利用,也是目前面临的一大难题。“因此我们要把物理空间和网络空间的数据有机结合起来,真正达到我们希望的用途,其实挺困难的。”李波说。

那么,要如何解决这样跨媒体融合的问题?李波提到,在做时间分析的时候,首先要有典型的事件行为,定义一个模型,然后把过往形成的知识图谱里按照事件模型一一找出,再按照我们的事件模型把事件聚合后再串联,最后就可以做到把物理、网络空间结合起来。

崂山论剑:寻找人工智能跨媒体杀手级应用

北京大学教授彭宇新从跨媒体智能的表征、分析和应用三个方面分享了见解。他提到了人工智能1.0、2.0及3.0的概念。人工智能1.0是文本信息,也有部分图像信息;2.0中的关键特征就是跨媒体,此外2.0时代还特别强调推理,这是2.0与1.0的主要区别。

彭宇新还分享道,跨媒体智能在中国工程院定义了七个任务:一是跨媒体统一表征理论和模型,二是观念理解和深度挖掘,三是跨媒体知识图谱的构建与学习,四是推理,五是跨媒体表述与生成,六跨媒体智能引擎,七是应用落地。

崂山论剑:寻找人工智能跨媒体杀手级应用

△彭宇新

上海交通大学未来媒体网络协同创新中心教授张娅分享了主题为《资源受限下的机器学习及其在图像理解领域的应用》。现在的机器学习主要还是基于有监督的学习,所以现在人工智能大量以来人工的标注数据,但这样的方式十分费时费力。如何解决这个问题?张娅认为可以从三个方面进行探索,一是用更少的标注样本达到同样的学习效果;二是用粗粒度的标注达到同样学习的目的;三是让学习对噪声能有一定的容忍度。

张娅还提到,人工智能现在有非常广泛的应用,但是我们量的应用都是需要依赖有监督的学习,必须要构建一个海量的标注数据集才能取得一个可用的模型。她认为,可能对于下一步的人工智能来说,为了提高模型的可用性和可泛化性,资源受限下的学习是非常重要的手段,来增加人工智能的普遍性。

崂山论剑:寻找人工智能跨媒体杀手级应用

△张娅