“他很兴奋,一直给这个看,给那个看,非常大力地推广”,李昊回忆起将Demo交给主管时的场景。就这样,团队争取到一次向时任淘宝 CEO 展示的机会,这次是直接在手机端演示——手机拍照,实拍图和库里已有图片做比对检索,找到和相似的照片显示——相比传统算法提升了一倍。
很快,“图像搜索”项目在 2014 年正式启动,目标是落地到手淘(手机淘宝应用)平台。
刚来阿里三个月的潘攀被任命为负责人,兼顾算法、工程、产品的统筹,团队力量充沛。潘攀毕业于美国伊利诺伊大学芝加哥分校博士,此前在美国三菱波士顿研究院、北京富士通研发中心从事视觉领域的研发工作。
延续此前团队推动的技术路径,“图搜”采用深度学习技术,随之成为阿里历史上最早采用深度学习技术并上线的 C 端应用产品。
项目早期,数据量少,还需要人工标注,所以研究为之匹配的小模型的系统和算法;随后训练数据解放,团队尝试通过用户行为的三类数据(查询数据、点击数据、未点击数据)分析出数据与排序间的逻辑关系,三元组的 Deep Ranking 框架生成,与之对应的训练框架、系统升级迭代;去年,图搜开始接入超大规模并行处理平台,释放数十亿级数据的训练能力。