品牌主在互联网的广告平台精准投放广告时,可以根据平台提供的年龄、地域、性别、地域、商业兴趣标签圈定目标人群。即使广告主对自己的用户非常了解,人工设定标签的方式也不可能非常精确,所以就有了另一种更精准的做法:Look-alike相似人群扩展。除了广告平台,Look-alike也可以应用在企业内部的营销平台,比如电信运营上根据某次活动获得的优质用户的数据,进行二次扩展后进行活动推广。Look-alike是为客户量身定制的定向方式。
什么是Look-alike
Look-alike中文叫相似人群扩展,利用品牌提供的种子用户数据,通过模型算法在广告平台的用户大数据库中找到和种子用户相似的用户群。 品牌的种子用户群体往往量比较小,基于种子用户进行广告投放,广告覆盖面小,达不到预期的流量,所以就借助Look-alike能够把投放覆盖的人群放大,同时保证精准定向效果。
种子用户是品牌方的核心用户,或者是广告平台历史投放数据中对品牌有兴趣而产生点击、下载、安装、激活等行为的用户。用户ID通常有Cookie、IDFA/IMEI、手机号、QQ号、微信号等,用户ID用于和DMP中的用户做匹配,把种子用户匹配成平台用户,以便利用平台积累的用户数据做建模和预测。
三种不同实现方式
用户画像标签
利用广告主和平台的用户数据,给用户打标签,然后使用用户画像标签找到目标人群。来看个来自有米广告的案例。
美的豆浆机通过Youmi DSP进行了Look-alike人群扩展投放。有米广告取得美的豆浆机的第一方消费者数据,涵盖浏览、购买行为、用户ID等信息。通过导入Youmi DMP进行全库记录匹配,找到个体的在线历史大数据。根据标签模型,得出种子用户具有较多且重合的“健康” “时尚” “亲子” “女性” “中高收入” “一二线城市” “30-40岁”等人群画像标签。那么对于一个标签为:上班族,30-40岁、已婚,亲子,健康,女性的用户就是其目标人群。
实际中很少这样做,一方面是广告主很难收集到比较全面的用户数据,无法做用户画像分析,各家的数据差异大很难把用户画像模型算法产品化;一方面基于标签的扩展人群,不会计算每个用户和种子用户群的相似度,精度不高;另一种情况,如果广告主数据丰富,有自己的DMP,可以自行分析种子用户群的标签,然后在广告平台按标签做定向投放即可。这种做法对所有客户不具有普适性。
分类或预测模型
广告主提交一批种子用户ID,匹配之后把它作为机器学习的正样本。有了正样本还需要负样本,负样本可以从非种子用户,或者是平台积累历史的一些相似的广告的非点击非下载用户作为负样本,这个问题就转化为一个二分类的模型,正负样本组成学习的样本,训练模型之后,利用模型结果对广告平台的活跃用户进行分类,最后得到广告主需要的扩展后的目标人群。
对于特征和模型算法,不同的广告平台各有差异,特征取决于其有哪些数据;在模型算法上,Facebook 和Google对外公布的说法就是一个预测模型,Yahoo发表过几篇论文,详细介绍过它的算法,比如LR、Linear SVM、GBDT都有尝试,论文里面提到的是GBDT的效果比较好。下图列出了不同公司的做法,供大家参考。
基于社交网络的人群扩展
社交平台天然有丰富的用户关系数据,是否可以挖掘用户关系挖掘相似用户?社交关系数据的两个核心价值,也就是社交同质性和社交影响力。同质性说得更容易理解一点,就是相似性,我们跟好友可能会有兴趣的相似,或者我们是同一个行业我们有相似的行业背景,我们才会形成好友。如果进行广告投放,广告主给了我客户名单即种子用户,是不是种子用户的好友也会喜欢这个广告?另一个维度就是影响力,影响力是说我的行为会受到好友的影响。投放到朋友圈广告,我可以看到朋友对广告的反馈,会受到他的影响。下面来看看微信朋友圈的做法。
基于广告主给出的用户名单,是不是可以做一个这样的尝试:找这批广告主的好友作为潜在用户,一就是社交相似性,二在微信朋友圈这样一个投放平台,同用户之间的行为会因为社会影响而形成传播,即微信社交Lookalike的基本思想。
通过历史投放的广告采集到学习样本,比如说我的好友有400多个,对于有一部分好友我跟他历史上有同时曝光到一些广告,这些好友可以计算出我跟他的广告相似度,就等于共同点击的广告数除以共同曝光的广告数。而剩余的好友,历史上没有共同曝光过广告。再利用微信其它领域的数据,比如说我跟他的亲密关系,浏览或者阅读文章等兴趣相同点,通过这些社交的行为数据预测到我跟他在广告上的喜好度。
社交关系就是一张大的网络,利用基于网络节点的算法node2vec可以挖掘用户的相似度,node2vec对于网络中的特征学习是一种高效的可扩展算法。