点击上方 “机器学习研究会” 可以订阅哦 摘要 吆喝科技 主题简介 机器学习排序(Learning to Rank)利用机器学习技术进行自动化精准排序,已被广泛应用于搜索、推荐和广告等众多场景
演讲人将结合在美国微软、美国eBay和国美在线电商的项目经验,介绍机器学习排序的框架与实践经验
演讲主题 机器学习排序框架和实践 第一个部分介绍一下机器学习排序的框架
排序问题无处不在大型电商网站都有搜索、推荐和广告,这三者核心都都是排序问题
不同之处在于,搜索有显示的关键词输入,推荐与广告一般只有隐式输入:用户背景喜好、历史行为、当前浏览的商品或文档的属性等等
排序问题是最佳匹配问题,根据用户的信息,找出与该用户最匹配的商品或文档返回给用户
最直接最简单排序方法是人工定一些规则,如电商网站按销量排名、按价格排名、或人工定个公式组合几个重要指标做个综合排序
那么,怎么把排序的问题转化成机器学习的问题呢下面结合下图以一个例子说明一种简单方法
假如要从头开始做一个搜索引擎,那么可以任意选择一些关键词,随机筛选一些相关网页,然后让人工评判员标注<关键词,网页>的二元对
根据网页与关键词的匹配程度,一般可以分为五类:Perfect,Excellent,Good,Fair,Bad
然后提取<关键词,网页>二元对的特征,这样就形成了一个大表这个大表有人工标注,有相关的特征
于是一个排序问题就转化成了一个根据特征预测匹配度的分类问题:拿着这个表,利用机器学习的开源工具,就可以很方便地训练出分类器
给定一个查询和包含该查询的一组文档,该分类器对每个文档预测出匹配度,是Excellent还是Bad等等
然后根据预测的匹配度及其概率进行排序
原文链接: http://mp.weixin.qq.com/s?__biz=MzAxMjYyNDQxMQ==&mid=2649976292&idx=1&sn=c46868dd01d063160b1adb327880bff0&scene=2&srcid=0815rj2R4Rnbv5HLLc46gRr8&from=timeline&isappinstalled=0#wechat_redirect “完整内容”请点击【阅读原文】 ↓↓↓