数据要素产业
人工智能技术提取复杂图表信息 中国实力获国际认可
光明网讯近日,国际模式识别大会(ICPR2020)在意大利落下帷幕,在图表信息提取(ICPR 2020-CHART-Infographics)国际竞赛中,人工智能及大数据科技企业合合信息联合华南理工大学、联想研究院共同组队,斩获所有七个赛道14个子任务中的11个冠军。
ICPR 大会是模式识别领域的顶级国际会议,已有50年历史,涵盖了计算机视觉、图标、声音、机器智能等多个领域。大会吸引了来自全球56个国家和地区的科研人员和机构,包括科大讯飞、搜狗、深兰科技、美团视觉中心、印度理工学院Ropar研究院、布法罗大学等国内外的高校、企业和科研机构参与。
图表信息提取竞赛在本次大会中倍受瞩目,复杂图表信息提取是人工智能领域内一个很新的研究领域,其目标是将各式各样的图表(见图1)自动的提取转化成原始的表格数据(见图2),以利于做进一步的深入分析和挖掘。由于整个任务场景复杂难度大,举办方将整个任务划分为6个子任务以及1个端到端任务,涵盖图表分类、图表文本识别、文本功能分类、轴分析、图例分析、图元素提取等。
图1 各种类型的图表数据举例
图2 图表信息提取任务最终结果可视化
合合科技相关负责人表示,“端到端任务需要整合所有的技术,是最难,但也是最有实用价值的任务,是综合实力的体现。我们所在的队伍是唯一一支完成端到端任务的团队。”
据了解,图表作为一种广泛使用的交流和展示工具,在很多应用场景具有广泛的商业应用价值,具有极大的社会意义。但复杂、多场景的图表识别与理解一直是一个全球性技术难题。合合信息利用自主研发的AI深度学习识别及计算机视觉等人工智能技术,提出了一系列领先的解决方案,并将这些方案落实到实际应用中。(记者 战钊)
来源:光明网