【学习】 机器学习排序框架和实践@大数据与人工智能博士邱宝军pdf,txt教程

点击上方 “机器学习研究会” 可以订阅哦 摘要 吆喝科技 主题简介 机器学习排序(Learning to Rank)利用机器学习技术进行自动化精准排序,已被广泛应用于搜索、推荐和广告等众多场景


演讲人将结合在美国微软、美国eBay和国美在线电商的项目经验,介绍机器学习排序的框架与实践经验

演讲主题 机器学习排序框架和实践 第一个部分介绍一下机器学习排序的框架

排序问题无处不在
大型电商网站都有搜索、推荐和广告,这三者核心都都是排序问题

不同之处在于,搜索有显示的关键词输入,推荐与广告一般只有隐式输入:用户背景喜好、历史行为、当前浏览的商品或文档的属性等等

排序问题是最佳匹配问题,根据用户的信息,找出与该用户最匹配的商品或文档返回给用户

最直接最简单排序方法是人工定一些规则,如电商网站按销量排名、按价格排名、或人工定个公式组合几个重要指标做个综合排序

那么,怎么把排序的问题转化成机器学习的问题呢
下面结合下图以一个例子说明一种简单方法

假如要从头开始做一个搜索引擎,那么可以任意选择一些关键词,随机筛选一些相关网页,然后让人工评判员标注<关键词,网页>的二元对

根据网页与关键词的匹配程度,一般可以分为五类:Perfect,Excellent,Good,Fair,Bad

然后提取<关键词,网页>二元对的特征,这样就形成了一个大表
这个大表有人工标注,有相关的特征

于是一个排序问题就转化成了一个根据特征预测匹配度的分类问题:拿着这个表,利用机器学习的开源工具,就可以很方便地训练出分类器

给定一个查询和包含该查询的一组文档,该分类器对每个文档预测出匹配度,是Excellent还是Bad等等

然后根据预测的匹配度及其概率进行排序

原文链接: http://mp.weixin.qq.com/s?__biz=MzAxMjYyNDQxMQ==&mid=2649976292&idx=1&sn=c46868dd01d063160b1adb327880bff0&scene=2&srcid=0815rj2R4Rnbv5HLLc46gRr8&from=timeline&isappinstalled=0#wechat_redirect “完整内容”请点击【阅读原文】 ↓↓↓


发表回复