编辑导读:像搜索推荐这种策略性产品,离线评估是一项必须要做的事情。通过离线评估的方法,发现当前策略中存在的问题点,对于优先级比较高的问题以需求和项目的方式推荐,这是策略产品经理主要工作之一。本文作者推荐了几种系统场景的离线评估指标,与你分享。
像搜索推荐这种策略性产品,离线评估是一项必须要做的事情。通过离线评估的方法,发现当前策略中存在的问题点,对于优先级比较高的问题以需求和项目的方式推荐,这是策略产品经理主要工作之一。
今天主要聊聊对于推荐系统的常见离线评估指标。
在之前的文章当中,我不止一次提到过策略是业务的策略,撇开业务谈策略都是耍流氓,因此对于推荐策略的评估也需要区分不同的业务场景。
01内容类场景
内容是一种比较常见的推荐结果形式,我们常说的内容不仅仅是指文字,还包括像音频,短视频,直播等新型的内容形态。
除了像今日头条,抖音,腾讯新闻这类应用存在大量的内容推荐策略,其实诸如淘宝,京东等电商业务也有很多的内容个性化应用。最新改版的淘宝,首页推荐feed流里面就包含了大量的内容推荐结果,而且还把“逛逛”内容社区搬到了第二个TAB上。无一例外,这些内容的背后都是无数个性化内容推荐策略运作的结果。
一般我们在评估类似这种内容场景下的推荐策略的时候,相比转化,我们更注重用户对内容信息的消费效率。因此对于这类型场景下的推荐效果我们更应该采用信息维度的指标去进行评估。通常包括如下几个:
点击数:内容被点击的人数和次数CTR:内容的曝光点击率停留时长:用户在内容feed,内容详情页的停留时长阅读深度:用户对内容的浏览层级,通常通过单次浏览页面的个数来衡量上面这些指标通常是对内容类推荐场景下的策略效果进行离线评估使用的指标。
02交易类场景
交易类场景则比较好理解,典型的比如淘宝,京东首页的猜你喜欢,为你推荐中的商品feed。因为推荐的结果就是商品,所以此时推荐系统的目标就是让用户在该商品上进行下单,转化。
很明显的一个流程就是:商品推荐位-商品列表页/详情页-购物车-提交订单页-支付完成页。
相比内容类场景下,推荐系统注重对内容信息的消费效率,在交易类场景下,推荐系统则更