2016-11-08 15:18:17
2016-11-08 15:18:17
阿里妈妈智能图象识别技术如何查询违规商家?细心的消费者肯定知道手淘的“拍立淘”功能,手机对着商品拍照,即可搜索相似商品,这个功能实际上利用了智能图像识别即技术。
而在以往,有不良商家将违规信息藏匿到图片里,以为这样就能逃过淘宝的搜查,现在,这一招也不管用了,同样的,智能图像识别技术在其中扮演了重要角色。
那么,智能图像识别技术具体如何识别纷繁复杂的图片信息呢?阿里妈妈高级算法专家镜宇向记者介绍了阿里妈妈在这方面的技术突破。据悉,依托该技术,阿里妈妈每周打击各类违规可达上万次,而相应的图象技术也已应用于阿里巴巴全集团。
以下是镜宇的分享
图像展示成趋势
打开购物网站,占据篇幅最大的无疑是图片。
对于用户而言,商品的图片有着文字描述无法表现的真实感、可信度,可以说,图片已成为展示商品的最佳方式。而图片在展示商品的同时,也成了违规内容诱骗消费者的主要庇护所。原因在于,图片识别难度太大了。
但是,阿里妈妈作为营销推广平台,对图片内容的审核有着极高的要求。
首先,借助图片识别能力,阿里妈妈能够获取完整的图片信息,进而提升CPR预估的准确性,提升推广投放效果。其次,随着打击的深入,违规推广语逐渐迁移到图片上,同时,存在商家违规使用著名商标的情况。
为此,阿里妈妈投入了大量的工作来完善图片识别算法,经过数年的积累,目前已上线两个重要技术来应对上述问题,分别是“图片文字识别”及“商标检测系统”。
依托这两个算法的图像智能识别技术已全面覆盖智能审核这样的应用场景,每周可打击各类违规一万多次,相应的图象技术也已应用于阿里巴巴全集团。
图像文字识别
文字识别顾名思义就是从图片上识别文字,这并不陌生,扫描书籍、扫描文件、车牌识别就是这种技术。但是,这些技术通常都要限定场景,一个技术只能被用于某个特定场景。
阿里妈妈面对的目标图片则完全不一样,它具有非特定性、不确定性等特点。举个例子,字体非常丰富,同时还存在变形、搭配布局等复杂情形,外加背景,可以说识别的算法难度极高。国际上甚至有一个叫ICDAR的学术会议,专门讨论这一类问题。
怎么办?阿里妈妈最终提出了“场景图片文字识别技术”。
场景图片识别发展历程
2014年8月,OCR(图中文字识别)项目启动,2014年的11月第一版算法上线。实现的功能是将商品图片中的文字描述提取出来,作为推广素材投放给最终用户,补充此前推广标题或文本数据不足的情况。
2015年4月,图片文字识别在阿里妈妈的审核场景下全面上线,审核工作从全靠人工步入到半自动化审核阶段,审核时间为T+1天。2015年的10月技术优化后审核只需几秒钟。
也就是说,商家上传推广创意图片几秒后,阿里妈妈就能给出识别结果,通过运营部门的预定义规则,快速对图片进行预处理和判断,如有可疑的违规行为,也能立刻处理。
你们一定很好奇,怎么办到的呢? 这里面有一套完整的智能算法迭代方案。传统的OCR(图中文字识别)技术可以分成定位、分割、识别等部分,每一个部分会涉及大量人工设计的特征工程或者人工规则,这会耗费大量精力去观察文字的特点,我们发现这种思路识别率很低。
阿里妈妈采用的方法依赖于深度学习技术,即让模型通过对大量数据进行学习,如此得到的“知识”比人工识别能力更强。这里面就需要使用大规模数据去完成训练和识别。摒弃特定工程和人工规则的逻辑使得阿里妈妈的算法在迭代和更新上得到了显著提高。
今年6月,阿里妈妈图像团队的OCR技术刷新了ICDAR Robust Reading竞赛数据集的全球最好成绩,并大幅超越第二名。借助这一领先的OCR技术,阿里妈妈图像团队能够以95%的超高准确率识别图中违规文字信息,有效过滤商家恶意推广,维护消费者权益。2015年,阿里妈妈累计屏蔽了4600万条恶意推广。
商标检测系统
在淘宝或天猫,一些商家会刻意在标题、详情页、商品属性等地方隐藏商品品牌信息,意图再明显不过,侵权著名商品品牌。以往,阿里妈妈的运营人员很难发现这种基于图片侵权行为。
为此,阿里妈妈研发了LGOG(商标)检测系统,在减少品牌侵权的同时,这套系统还能统计平台上所有的商品品牌,进而做一个统计归类。
识别样例
这里有一个非常大的挑战,阿里平台的品牌种类数以亿计,这就对系统的工作效率提出了严苛挑战。其次,商标识别涉及到的场景具有多样性特征。第三是商标本身客观上存在倾斜、行变,或者遮挡、面积小等问题,算法识别易受干扰。
2014年,商标检测系统上马,后经多轮迭代优化,阿里妈妈已基本形成了一套品牌可管理,在线和离线相结合的完整算法解决方案。效果很突出,比如1秒内可识别上万种商标,支持品牌库随时配置与扩展,准确率已达95%。
不要用不正当的竞争,存在侥幸心理,技术的不断迭代更新,让交易生态更加健康完善。
推荐阅读:《淘宝盗图处罚规则 被投诉盗图如何处理 如何申诉?》
>> 查看更多相似文章