数据要素产业

阿里安全图灵实验室发布新技术：用AI检索多层次商品图像

12-06 09:08

DoNews2月23日消息（翟继茹）23日，阿里安全图灵实验室透露，其与中国科学技术大学、浙江大学、华中科技大学等高校研究人员合作，研发包括“内容安全、文本反垃圾、AI模型鲁棒性、营商环境治理”4项新一代安全架构核心AI安全技术成果，均被国际会议ICASSP（International Conference on Acoustics, Speech and Signal Processing）2021收录。

例如，在具体的在线零售场景中，如何通过文字搜索找到最符合要求的图像，看似简单却不然。目前，电商平台的各种模态商品数据迅速增长，文本到商品图像的跨模态检索任务也在加剧，比如单是商品图像中的一类“服饰”就表现出巨大的差异性，服饰可以穿在模特身上，也可以单独摆放，还可折叠起来展示，服饰图像背景往往也很复杂。此外，就整体来看，黑灰产还可能利用看似合规的图片来宣传“禁限售”商品。

一直以来，业界的传统方法是，模型结构、相似度函数、损失函数等方面进行了大量的研究。据介绍，阿里安全图灵实验室此次采用了一种基于多层次编码、多粒度相似性学习的跨模态检索模型，在融合多层次特征的基础上，结合物体、图像两种不同粒度的跨模态相似性，来提升跨模态检索模型在商品图像检索任务上的表现。

阿里安全图灵实验室介绍，多层次的编码模型HSL(Hierarchical Similarity Learning)，可以增强跨模态特征的表达性。进而提出两种不同粒度的相似度度量方式，以实现对商品图像复杂内容的表达。在每一个层级上，通过物体粒度、图像粒度两种不同粒度的相似度度量同层级的文本-图像间的相关性。最终对各层级的相关性进行融合得到最终的相关性打分。

阿里安全图灵实验室资深算法专家华棠表示，这种新研究不仅可以于提升用户搜索体验，也会用在平台内容治理上，谨防黑灰产“钻空子”。“我们希望通过新一代安全架构核心AI技术来守护网络内容安全，净化网络环境，也通过AI来保护数字资产的知识产权，优化营商环境。”

更多>数据要素产业相关信息

最新发布

点击排行

Select Language

AI社区

今日排行

本月搜索

Dataset Category

数据要素产业

阿里安全图灵实验室发布新技术：用AI检索多层次商品图像