数据要素产业
Pinterest凭什么拥有那么多用户:机器学习是答案
目前,Pinterest月平均活跃用户量达到1亿,这家以图片为主的公司是如何留住用户并盈利的呢?Pinterest的主要目标是向用户推荐相关的图片或内容,推荐的内容足够精确才能提高用户黏性。近期,《快公司》发文表示,Pinterest 正从机器学习切入,向用户推荐更精准的内容,并拓展新的在线业务。
在Pinterest 平台上,人们可以搜索、下载全网范围内的图片和文章,找到与自己喜好契合的内容自然能够增加他们的用户忠诚度。Pinterest 推荐的相关内容提高了30% 的参与度和 25% 的购买度。这些精准推荐都是依托尖端的数据驱动技术和大量实验的结果。
用户可以通过Pinterest 台的虚拟钉板收藏全网范围的在线商品、帖子、图片,就是说这个平台完全是基于用户兴趣偏好建立的。Pinterest 无需像其他社交网络一样,根据用户的点击模式或者特定页面停留时间来猜测其兴趣。这也意味着它的算法能推测到 750亿个收藏的内容数据库中相互关联的信息,因为相似的内容更容易被固定在同一个钉板上,从而轻易识别用户偏好。
Pinterest 可以说是一个社交图,由数十亿相互联系的用户、被不同用户收藏的同一个项目、收藏类似项目的虚拟钉板三部分构成,这样的组成结构同时决定了其用户量将会不断增长。
Pinterest 的高级发现科学工程师 Mohammad Shahangian 说,“我们通过数百次的实验对我们的算法做出微小修正,确定发现问题的方向“。简单地根据用户关注人群决定为其推荐内容的模型是不理想的,假设一个用户正在策划自己的婚礼,她的虚拟钉板添加了很多礼服款式的图片,而她的关注者并不一定需要这类服饰,为他们推荐礼服可能造成无意义的重复。而 Pinterest 所有的数据可以让 Pinterest 的用户获得 。
Shahangian 表示,“ 如果你的虚拟钉板收藏了一个厨房水槽的链接,我们是否需要向你推送一万多款厨房水槽,或启发你怎么能整体设计你的厨房呢?” 为了在这样的情况下做出正确判断,该公司的工程师们测试了多种机器学习算法,来研究不同公式如何执行对相似或不同的测试集的收藏,以及他们最终如何影响现实世界的用户的参与度。
然而,事实上,Pinterest 的技术研发缺乏实例测试,研究员无法通过给某个特定的用户付钱来测试他是否会接受一组新的推荐。虽然后面的测试过程无法进行,目前的算法已经基本可以实现通过用户的收藏内容来判定此人是否愿意担任人工测试者。Pintesrest 从自身的一路发展中收获了不少启发,个性化一直是提高用户参与度最大的影响因素之一。与此同时,该公司也一直致力于提高视觉搜索功能,帮助用户获取与目标图片相似的内容。 今年早些时候,Pinterest 的工程师们与来自伯克利加利福尼亚大学视觉与学习中心的研究人员一起开发了可自动检测图像内容的深度学习技术。
Pinterest 的高级视觉搜索工程师 Dmitry Kislyuk 说,当我们试图去分辩图片内容是一只猫还是一条狗时,这并不算一个分类任务,关键在于保证实时性的前提下寻找图像之间的视觉相似性。可视化搜索工具尤其适合收集家居装饰和时尚类商品的信息。未来,公司希望提高将目标内容映射到其类别的能力,举例来讲,当用户想找同一种食材的新食谱时,就不要只提供这种食材的类似照片。
高级视觉搜索工程师 Andrew Zhai 指出, “我认为我们的模型可以更语义化,有效地将深度学习应用于映射更加概念化的图像。与此同时,Pinterest 的的工程师们正在专注于完善目标的检测和搜索开发一款应用程序,让智能手机用户通过给现实世界中需求物品拍照,上传到平台后,得到相关的推荐。