首页 >>  正文

为啥独立事件概率相乘

来源:baiyundou.net   日期:2024-08-13

在推荐系统当中,一旦策略产品经理和算法工程师在商量与构建优化目标不够准确,这会带来的后果就是和实际期望的效果南辕北辙、大相径庭,甚至给整个公司业务目标、商业收入带来致命的影响。有一句话说的很好:如果一项技术本身是新颖并且先进的,但是应用的方向和实际需求的方向有很大的偏差,那么这项技术的成果不可能是显著的。

做策略产品在构建你的目标的时候,一定要像毛主席说的那样“战术上藐视敌人战略上重视敌人”。切忌不能用战术上的勤奋掩盖战略上的懒惰,所以合理设定与构建推荐系统业务目标建模应该是推荐策略产品经理需要再构建推荐系统业务目标排序的时候应该首要考虑的问题,这也是Arthur在这里着重强调业务建模的重要性。这里以抖音短视频、京东作为推荐系统的两个案例,来讲讲内容推荐场域、电商推荐场域下构建优化目标建模的差异。

一、抖音短视频以构建有效观看时长为优化目标的合理性

1.1 抖音短视频现状与背景

抖音短视频的主要商业模式是通过免费视频播放带来的广告收入(此处仅说明巨量广告,非巨量千川广告,CPM计费),其视频广告会在自然推荐的媒体视频之间进行穿插,因此抖音本身的广告收入适合用户的观看时长、下拉短视频数量呈现正比关系的。因此为了达成抖音短视频的商业目标,其优化核心建模不是围绕点击率CTR、等传统推荐系统意义上的CTR预估优化目标,而是用户的有效播放时长

图1-1 抖音推荐系统

如上图所示,我们逻辑推演与猜想下来看,用户的点击率CTR在数据分布上会与用户的短视频播放时长有一定的正相关性,但是两者还是存在“用户、物料特征”以及“优化动机”上存在一定的差异。

图1-2 抖音夸张式吸睛内容

如果推荐系统是优化点击率来看的话,那么推荐系统模型侧重就会以优化——创意优选/生成部分,推荐“标题党”、“吸睛眼球一跳”等虚假、色情类吸引眼球的短视频,这一类短视频的特点就是点击率CTR贼高,但是用户一旦发现虚假宣传就会跳失,客户观看时长较短,对劣质内容缺少观看下去的耐心。

图1-3 抖音优质内容

如果推荐系统是优化观看时长来看的话,更多的就需要考虑视频本身的质量、内容的兴趣度,用户视频的互动、好评以及视频本身的长短特征内容,此时推荐 优质的内容 > 吸睛的内容。

所以综上述来看推荐目标建模的差异其实就直接导致了推荐系统倾向性、特征工程等细节策略工作的不同,进而就直接影响了“增加用户播放时长”这个集团商业化目标。

1.2 Youtube在推荐系统排序模型设计

我们借助Youtube在推荐系统模型来距离推演一下(抖音与youtube在优化视频优化目标上有一定的相似性,因此可以作为借鉴),引入播放时长作为优化目标。其本质还是把推荐视频的问题看做是一个分类问题对待,也就是预测用户是否点击某个视频。

这一点大家肯定会比较好奇,Arhtur的老粉应该知道,预测短视频的播放时长应该是个回归问题(预测离散数值),而不是个分类问题。Youtube巧妙就在于其把播放时长转化成了正样本的权重,输出层再利用加权的逻辑回归进行训练,预测过程中利用算式来计算样本的概率,这个概率就是模型对播放时长的预测,这就完美的把逻辑回归输出的结果映射成了对于观看时长的预测。

图1-4 Youtube推荐模型框架设计

从左往右的部分用的是依次是视频观看的低维稠密embedding向量,包括历史看过的视频id,曝光视频id、互动行为下的视频id等等然后做平均池化。第二个是语言Embedding,主要是用户语言以及视频语言。第三个是对上次观看时间进行归一化。第四个是对已经曝光次数进行归一化。

由此而看,视频对于播放时长的预测是符合抖音、Youtube视频类型广告盈利模式和商业价值的,制定一个合理的优化目标对于推荐系统实现商业目标是关键而且非常有必要的。

二、淘宝、京东电商推荐系统以构建点击转化率为优化目标的合理性

2.1 电商场域构建点击转化率优化目标的难点

在淘宝等电商类网站做推荐,用户从登陆到购买的过程可以划分为两步:

第一步,商品发生曝光行为,用户点击后进入商品详情落地页。

第二步,用户在商品内页发生成交、下单行为。

电商网站推荐系统的商业目标是通过推荐使用用户产生更多的点击、购买行为。所以如果按照这个商业建模目标来说应该是一个CVR预估模型。

图1-5 淘宝、京东推荐系统

但是大家应该有所发现,下单成交的行为其实是发生在了第二步,故推荐CVR模型在进行训练的时候光训练点击后的成交转化行为样本其实是脱节的——客户并不是登陆电商APP就直接到了商品详情页,一定是曝光一跳页面点击发生之后预估转化CVR模型才会有效。如果直接在一跳创意信息流情形暴力预估转化率CVR,肯定会有预估偏差,导致效果与目标的不一致问题。

图1-6 训练空间和预测空间不一致问题

如1-6所示,点击Click点击 -> Conversion转化Impression展现 -> Click点击,存在样本空间衔接,但是本身是相互独立的,两者没有完全的正相关关系,所需要的样本、模型需要的特征、属性都是不一样的。例如点击可能只是看用的兴趣,可以用比较吸引眼球的创意 99%的人都在卖,100%好评,70%的都在回购等。但是成交考虑的特征可能更多的就是物品的优惠程度、用户的消费力等特征。

所以,最佳的思路方法还是分两步来构建模型,第一步构建CTR点击率预估模型,第二步构建点击转化的CVR预估模型。这个方法有个缺陷就在于第一步CTR模型预估其实和最终的优化目标是脱节的,因为问题的最终是希望优化下单成交而不是点击,在第一步只考虑点击数据显然不是全局最优。

2.2 阿里的多目标优化模型ESSM

为了同时达到电商场景的上述两阶段目标,阿里提出了多目标ESSMM模型(Entire Space Multi-task Model)。其同时模拟优化CTR、CVR两个阶段。

图1-7 ESSM优化模型架构图

上述为阿里的ESSM模型,最下层分别是CVR预估模型用户域、商品域EmbeddingCTR预估模型用户域、商品域Embedding,两者中间的Shared Lookup Table是通过标的形式共享Embedding的内容,目的就是为了解决CVR因为正样本系数的问题,利用CTR数据生成更加准确的用户和物品的特征向量表达。

中间的神经网络域感知池化层、多层感知机,两个目标的模型各自独立完全隔离,去拟合各自的优化目标pCVR和pCTR,最终在最上部分预估点击率pCTR预估转化率pCVR相乘得到最后的结果预估点击转化率pCTCVR,两者之间的关系如下图所示。

pCTCVR是左侧,指代一个条件概率事件,首先必须要发生曝光点击行为,即p(y = 1 | x),再来计算CVR转化概率。ESSM即同时将pCVR、pCTR以及pCTCVR三个目标统一融入到一个模型当中,可以得出三个优化目标的值,可以根据对应的目标场景预测对应的值,一个多目标优化的模型即解决前面说的“训练样本的空间和模型预估优化空间不一致”的问题,同时也实现了曝光点击和点击转化的全局优化效果。

三、关于推荐系统构建优化目标因地制宜的一些思考与总结

所以从上述的例子可以看出来,无论是抖音、YouTube,还是淘宝、京东,推荐系统的应用场景和真正的商业目标其实是有差异的,并不是推荐系统可以“一招鲜吃遍天”的方式进行优化,所有的推荐系统都按照一个优化目标方向都采用统一的模型去优化

很多策略产品、算法工程师都是直接调研照抄行业最领先的模型,表示“阿里用的就是这个,你别管做完实验推全就行了”,这是典型的没有将实际业务场景和策略目标相结合。

为什么一直鼓励大家一定要距离业务更近一点?对业务目标建模后面才是我们运用“策略”这个工具帮助我们高效去实现业务目标的达成,每一个策略产品首要遵循的原则就是结合公司业务发展的阶段与场景,来实现优化目标的落地,这不是一个纯粹的系统性技术问题,而是多方协调一致的结果,需要产品、运营,前台内容团队共同协商达成的结果,只有确定好优化目标,技术团队才可以转型的致力于模型的改进和调整,上下同心去解决公司的也目标,避免战略性的错误和失败,提高各方效率。

最后,还是一句建议给到策略产品经理的小伙伴们:战术上藐视敌人战略上重视敌人,切忌不能用战术上的勤奋掩盖战略上的懒惰。如果有帮助大家希望大家帮忙点赞、评论与收藏,这个对我很重要。

本文由 @策略产品Arthur 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

","gnid":"9223abe2830607cc9","img_data":[{"flag":2,"img":[{"desc":"","height":"420","title":"","url":"https://p0.ssl.img.360kuai.com/t01ad31c2c2b609f1b4.jpg","width":"900"},{"desc":"","height":"1558","title":"","url":"https://p0.ssl.img.360kuai.com/t01addd5a7ecfcdb475.jpg","width":"720"},{"desc":"","height":"428","title":"","url":"https://p0.ssl.img.360kuai.com/t01aa2a20a108bfdd7e.jpg","width":"720"},{"desc":"","height":"1435","title":"","url":"https://p0.ssl.img.360kuai.com/t01e94e7d2dfb4209e6.jpg","width":"700"},{"desc":"","height":"469","title":"","url":"https://p0.ssl.img.360kuai.com/t01c9557315f851acb5.jpg","width":"720"},{"desc":"","height":"560","title":"","url":"https://p0.ssl.img.360kuai.com/t01a26c254e69f98d0a.jpg","width":"526"},{"desc":"","height":"315","title":"","url":"https://p0.ssl.img.360kuai.com/t01ecaa0f2cedda4e20.jpg","width":"720"},{"desc":"","height":"593","title":"","url":"https://p0.ssl.img.360kuai.com/t0189051bef3333df5f.jpg","width":"720"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"pika","pub_time":1705456560000,"pure":"","rawurl":"http://zm.news.so.com/2d676382dbfc1d924dac1c239d2e8137","redirect":0,"rptid":"e28b3cfa1e726643","rss_ext":[],"s":"t","src":"人人都是产品经理","tag":[],"title":"如何构建推荐系统的优化目标

牛司彼3887谁给我讲讲独立的概率是怎么回事 -
雷庆诚18916986567 ______ 你说的是有放回的事件,就是说,第一次,你抓到白球是50%,然后你再抓球,是在你第一次抓了白球为前提的条件下的,然后这个白球又被放回了箱子里,再抓就又是50%,第二次抽取到白球是在第一次白球已经抽取到手的情况下发生的,而第一次抽取的概率你不能不算,两次抽取是“且”的关系,并不是“或”,所以要相乘

牛司彼3887关于生物的基因题乘法与加法 -
雷庆诚18916986567 ______ 1、互斥相加(加法定理):若两个事件是非此即彼的或互相排斥的,则出现这一事件或另一事件的概率是两个事件的各自概率之和.如事件A与B互斥,A的概率为p,B的概率为q,则A与B中任何一事件出现的概率为:P(A+B)=p+q.推论:两对立事件(必有一个发生的两个互斥事件)的概率之和为1.如生男概率+生女概率=1;正常概率+患病概率=1. 2、独立相乘(乘法定理):两个或两个以上独立事件同时出现的概率是它们各自概率的乘积.如A事件的概率为p,B事件的概率为q,则A、B事件同时或相继发生的概率为:P(A·B)=p·q.

牛司彼3887概率集合中两件事情公共部分为什么是用乘法 -
雷庆诚18916986567 ______ 两件事情的公共部分,说明这两件事情都发生了,所以就把两个事情发生的概率相乘喽.

牛司彼3887有放回抽取与无放回抽取请问不是说两个相互独立事件A、B同时发生的概率为:P(A*B)=P(A)*P(B)相互独立事件是 事件A对事件B所发生的概率是没有影响... -
雷庆诚18916986567 ______[答案] 分两次抽取,所以要乘. 26/52是第一次抽取概率, 25/51是第二次,51是52第一次抽走一张剩下的.

牛司彼3887两个或两个以上相对独立的时间同时出现的概率应该怎么算? -
雷庆诚18916986567 ______ 既然是相互独立的,也就是说一个事件是否发生并不会影响另一个事件发生的概率. 所以独立事件同时发生的概率等于各事件概率的乘积.

牛司彼3887有关概率的问题 -
雷庆诚18916986567 ______ 1.概率论里面独立主要是针对两个事件A,B,如果事件A的发生完全不受事件B的影响,事件B的发生完全不受事件A的影响,那么我们说事件A和B是相互独立的.如果有影响就是不独立.有无影响可以靠常识判断 若P(A∩B)=P(A)*P(B),那么我...

牛司彼3887概率 相乘设两个独立事件A,B都不发生的概率为1/9,A发生B不发生的概率与B发生但A不发生的概率相同,则A事件发生的概率为?*y=1/9 (1 - x)*y=x*(1 - y) ==> ... -
雷庆诚18916986567 ______[答案] 这是分步问题,分类相加,分步相乘,看课本,基本计数原理

牛司彼3887概率相乘表示事情同时发生,那这个事情是不是只能是相互独立事件?4个白球,3个黑球,甲乙依次取一个,不放回,直到取到白球终止,若取球次数为2,... -
雷庆诚18916986567 ______[答案] 1是的 相互独立的充要条件就是p(AB)=P(A)*p(B) 2.C72是组合 意思是顺序对结果不产生影响 而题目要求一定是先黑后白 对顺序有要求所以是排列用A72

牛司彼3887相互独立事件怎样求,把每件事的概率相乘吗? -
雷庆诚18916986567 ______ 是的,相互独立,就是分别做每件事的概率与其他不相干

牛司彼3887相互独立事件的概率和为1吗?为什么?想不通,两个没有联系的事件,概率和为什么为1? -
雷庆诚18916986567 ______[答案] 相互独立事件,事件A(或B)是否发生对事件B(A)发生的概率没有影响,这样的两个事件叫做相互独立事件. 相互独立事件其实没有明确的相交与互斥关系相互独立事件同时发生的概率P(A*B) =P(A) *P(B) 相互独立事件的概率和不为1

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024