编者按:本文来自微信大众号“鸟哥笔记”(ID:niaoge8),作者姜頔。36氪经授权转载。
作为易车网的新代言人,沈腾拍照的易车网新广告在各栋大楼的电梯里循环播映播映,反复强调易车“价格全知道,买车不吃亏”的新Slogan。当你看完易车的洗脑广告,你记住了易车这个品牌,还记住了一个买车都会重视的要害点——易车价格全知道,买车不吃亏。
你知道易车的这句Slogan是怎样发作的吗?
本文收拾自鸟哥笔记北京线下公开课,讲演人:姜頔,易车网数据剖析专家,讲演主题:《添加的常用模型》。
咱们好,我是易车网的姜頔,今日我给咱们带来的共享主题是《添加的常用模型》。
今日的共享首要分为以下六个部分:
01.毛遂自荐
我在早稻田大学读完硕士后,在日本的一家地震研讨所做地震剖析员。在此期间,我用过一些土木工程类的软件,也用过一些数学剖析的软件,像现在咱们都用的MySQL,Excel,还有VBA这些。
现在,我在易车做数据剖析专家,咱们往常涉及到的事务除了一般的数据提取、剖析陈述,还有便是模型,比方途径评价模型、易车作者评分模型、用户等级模型、召回模型等等。接下来我也会挑几个咱们用得比较好的模型跟咱们共享。
先说一下我阅历的添加阅历。
榜首个是合作途径投进,到达DAU同比添加300%。咱们现在的途径是百万量级的DAU,这阐明什么状况呢?添加300%,这阐明咱们花钱了,肯定是花钱才干添加。
可是花的钱值不值得?花没花在刀刃上?这便是第二个,新增用户30日同比留存进步了3个百分点,这阐明咱们花钱真的是花对了。
第三个是结构成交模型,这个成交同比添加了9倍。
这便是我首要的一些添加数据。
02.易车的现状与应战
关于易车,咱们今日首要共享这四个词:老、新、惨,还有应战。
榜首个为什么是老呢?
咱们的老程序员写东西都是用.net,但现在.net如同现已不时兴了。现在咱们出厂全都自带的JAVA,大部分新人看不懂本来.net那些东西,以致于许多东西都得推翻,再拿JAVA重构一遍,从这个视点你也能够看出易车的老。
“新”又是什么呢?
上一年易车开端阅历品牌换新:
新的面孔,从各个范畴吸纳了新的大咖;
产品的快速更新,自杨永峰总就任今后,最慢两周更新一个版别,在这个版别的更新期间还不断的做 AB test;
还有一些新技能的开发运用,像机器的写作,智能聊天等,这都是新技能的开发运用。
然后是“惨”。
金融惨咱们都知道,都没钱了。互联网早就进入下半场了,不像上半场“人傻钱多”。现在咱们都在重视转化率、曝光率等等,拿方针去查核,这也阐明互联网现已进入了精细化运营的阶段了。
而轿车职业的“惨”要怎样说呢?
也是方针等的一些原因。我自己有个比方:我11年10月份去的日本,我父亲在11年9月份把咱们家榜首辆车卖了,后来紧接着11年12月份开端摇号,11年那辆车连车带牌卖了6万,现在你买一个车方针15到20万,这便是方针的影响。
几个要素叠加之后一起限制,互联网轿车就更惨了,但这便是现在的状况。咱们都在收紧,都在说轿车隆冬到了,这便是“惨”。
最终一个是应战。
这个职业前有轿车之家,后有新进的懂车帝,咱们怎样在这个圈里构成自己的壁垒,还能发明新的玩法?刘晓科总说过一句话,战役拼的不是人数,而是战略,要以“奇”招取胜,你烧我粮仓,我炸你军火库,这才叫交兵!
这便是今日的主题:添加的三大门户。
03.添加的三大门户
添加的三大门户是怎样回事?
黄地理教师在他的书里将市道的一切添加分为三大类,榜首类是商场营销派,第二类是试验添加派,第三类是技能派。
我在这三大门户里别离选了三个模型,别离是:商场营销派-途径评价模型,试验添加派-用户召回的模型,技能派-逻辑回归,促成交的模型。这三个模型又别离对应的是三个用户生命周期,别离是拉新、丢失与促活阶段。
途径评价模型便是花钱买流量,用这个模型买不到吃亏,买不到受骗。
用户召回模型是从发现问题、提出主意、预期效果、测验矩阵、复盘剖析这五步教你怎样上道。
至于最终一个逻辑回归,添加黑客真的是可遇不可求么?咱们别离来看。
04.商场营销派-途径评价模型
1.途径质量评价模型
我做了一个途径模型,老板常常会问某个途径质量怎样样,咱们该怎样去答复?什么是质量?是留存?本钱?仍是数量?其实这些东西都要考虑。
上图模型中的赤色总得分这一列是汇总总得分,周围蓝色的别离有数量、行为、商业、本钱还有质量,这五个是一级方针,上面是权限,经过规范化,咱们把这个得分再乘以它的权重,最终算出来是总得分,这个总得分便是反映这个途径的质量。
相当于咱们高考的语数外等等这些学科彼此独立的方针,一起限制着咱们最终的总得分,经过总得分反映出这个学生是否全面,便是这样一个模型。
权重怎样分配呢?权重分配有一个AHP层次剖析法十分好用,稍后我会要点去讲。
还有一个问题,在市道上常用的评价模型大体分为回归和规范化两种模型。为什么咱们在这儿要用规范化,而不是回归模型?
其实这两种模型我都做过,但规范化模型能够最快地去反映出咱们在不同阶段的方针。比方咱们在增量期,数量这个权重就比较高。假定在存量期,相关于它的质量,以及留存,还有商业转化的要求会比较高,在不同的时期咱们能够快速更改权重,完结战略的转化。
2 .建模进程
上图是建模的进程,分为七步。四、六、七会在后边要点去讲。
首先是模型的建立,方才现已给咱们说过,咱们选用规范化。
然后是入库规范,咱们这个模型什么样的途径才干去入库?是一切的付费途径仍是说一切的途径?咱们这儿挑选付费途径。
新增是否有阈值呢?是只需这个途径有新增就进入到模型里边,仍是说有100人、200人、500人的阈值呢?咱们挑选付费的途径只需有新增,咱们就会进入到模型傍边。
第三个是算法的建立。规范化的算法其实有最小、最大值,还有最规范化等等,咱们这儿选用最小值和最大值规范化。
第四个是权重核算,AHP层次剖析法。
第五个是方针挑选。这个涉及到降维、除掉还有整合变量,便是我方才说的,你这个方针要彼此独立,跟其他的方针相关性要十分低,能够彻底代表你这个途径。
我再举一个比方,假定说语数外三科能评判一个用户的好坏,然后十分全面。但假定你这个语数外三门换了,换成一个高等数学、线性代数、复变函数,你把这三门给加在一起了,这三门的总分,只能阐明这一个学生他数学学的好坏,你不能评判全体的。所以这个方针挑选也是十分重要的,是彼此独立,相关性十分低的方针。
第六和第七是BI展现和运营战略,这个后边我会详细去讲。
3. AHP层次剖析法
现在大多数的权重都是拍脑袋核算的,包含有些KPI的权重都很随意。其实这儿有一种十分好用的办法——AHP层次剖析法。这种办法怎样用呢?
AHP层次剖析法
标度尺1、3、5、7、9
上图有一个标度池1、3、5、7、9。这是什么意思呢?
咱们经过两两方针相比较,假定A:B相同重要便是1,略微重要是3,显着重要是5,激烈重要是7,极端重要是9,其次2、4、6、8是中心值,依此比照,数量和行为相同重要是1,数量比商业略微重要便是2,数量显着重要于本钱便是5.
依此类推,咱们把这个数字填到左上黄色倒三角的模型里边,这便是AHP层次剖析法里边矩阵模型,就能得到它的权重。这个(AHP层次剖析法)能够在网上下载。
经过两两比较,将你的层次定性和定量剖析,最终输出权重,就进入到下一步模型的骨架,就这个总得分。
一级方针设好了权重,相同这儿有二级方针,也类似于这个办法,把一切二级方针的权重设置好,有权重,有方针,最终进行规范化,取得一个得分。这也便是我方才说的,它在不同的时期权重不一样。
你看咱们现在在数量和行为的比是1,数量和商业是2,数量和本钱是5,数量比本钱,便是咱们以为本钱不是很重要,数量是最重要的时期,咱们的权重是这样。
假定在年末,要求数量添加的时分,权重能够这样分配,但假定在冷季时分要保量,求质的状况下,咱们关于商业得分就应该是比数量重要,依此类推依照不同时期,做出相应的权重调整。
4.BI展现和战略
BI展现其实特别重要,在正常的状况下,数据的提取,数据的ETL,以及数据的清洗这一部分,会占据咱们90%的时刻。可是它只要10%的价值,而领导看这个数据,只用10%的时刻,却会奉献90%的价值。
在承上启下的进程中最重要的一步便是BI展现,不要小瞧BI展现。
看一下上面这个途径评级明细,这便是途径评价后得出的总表,给boss看,要绝对值有绝对值,要权重有权重,然后它的一级方针、二级方针、上限值等等都在这张表里边能够汇总。
经过这张表老板们能够看出许多东西,像安卓的运用商场,比方vivo、OPPO、华为,他们有一个最大的特点,便是它们增量会有瓶颈。可是它们的质量特别好,不论是留存仍是用户共享动作都十分好。
像信息流途径,比方快手、抖音这样的,它们的量十分多,而且商业转化高,这取决于你要怎样投进资料。假定你投进的资料是鼓励用户去购买新车、二手车的,就会进步咱们的成交转化率,这些途径的不同特点都能够经过这张表表达出来。
看一下这张途径的总趋势图,在这个总趋势图里,咱们把一切途径的体现都汇总成一张图,它有一个总得分。
这个图其实就相当于咱们买基金、买股票时的沪深指数、大盘指数,咱们能够经过途径总得分来看产品。咱们的产品每周进行更迭的时分,需求知道是产品对它的影响比较大,仍是更简单受大盘的影响?
比方新年时期是洗车、买车的顶峰,你不必额定做什么,它的天然量就会涨上来,由于咱们逢年过节遍及有用车的需求,这便是大盘要素。
最终看一下天然&付费的画像。由此衍生出天然&付费画像的比照,天然用户很大程度来源于咱们的品牌宣扬,具有很高的不确定性,可是跟品牌宣扬是直接相关的。付费途径大多数便是途径拉新,经过这张表能够看出品宣和途径这两个用户的特点。
商场营销派模型讲完了,咱们再来看试验添加派模型。
05.试验添加派-用户召回模型
Sean Ellis在他写的《添加黑客》里边提及到最多的办法,便是这种试验添加派。我在他的添加派里边加了一些自己的观念和观点,总结出一个新的试验添加派的模型。
在这个模型中,咱们能够看到总共有六步,前五步是固定的,发现问题、提出主意、预期效果、测验矩阵,还有复盘剖析。而第六步则是12345、12345……将这个添加模型不断滚起来。
以丢失用户召回举例,先看上图:
图中红线代表新增和丢失比。由于新增有必要大于丢失,所以红线正常状况下应该大于100%,才干做到DAU的堆积。
图中蓝色代表的是丢失净添加。对“丢失”,不同公司的界说也不一样,或许是接连15天没登录APP,也或许是30天,又或许是没有出资,都是依据公司实践状况去界说的。
发现问题
能够看到,从2018年11月开端,红线急剧下降至100%以下,且蓝色的柱子净丢失的绝对值在添加,阐明这段时期处在途径的投进阶段,丢失用户大于新增,这个时分咱们就应去做丢失用户召回,这是榜首个问题。
第二个问题,咱们有没有必要做丢失用户召回?“应该”和“有必要”其实是两个问题。
金融公司的获客本钱大概在500左右,P2P乃至上千,这些途径在用户的拉新、促活、复购等预丢失阶段现已花费许多的金钱,到了丢失阶段,有些途径就或许挑选抛弃这些用户,不做再做丢失用户召回,这是“有没有必要”的状况。
以50-30的获客本钱,有没有必要去做其实没有那么严苛,是能够去做,而且有必要去做的。这就处理了前两个问题。
第三个问题,丢失用户的价格怎样去定?在发动这个项现在要有预估,这个价格怎样定?
假定途径的新增获客本钱是15元,那它召回用户下限便是3元。
为什么是3元呢?由于有一个魔法数字,叫保护一个老用户的本钱是新用户的1/5,所以它的下限是3元,上限是15元。
咱们能够这么了解,假定一个用户丢失的时刻过长,其实他就变成了一个新用户,现已对这个途径生疏了,所以它的价格定在3到15元之间是最为合理的。
最终一个问题是能确保成功吗?这个问题是老板问得最多的。
预期效果
咱们先来答复老板那个问题,能确保成功吗?
先给老板详细拆分数据。
假定用户在丢失30天后忽然回来,这个的概率是多少,召回率、次留,召回今后的下单率、收入等都能有一个预期的效果。
关于短信的召回、活动的召回等,咱们自己也需求有一个心思预期。从图中能够看到,紫色一列召回率的心思预期方针是8.1%,但我跟老板说的时分,肯定是说绿色那一列的召回率4.1%。
这便是我自己的一个小模型,叫8、9、10模型。即说8、做9、吹10。这种模型下,不说100%,也有95%的概率能确保8.1%的召回率。
召回今后,能够跟老板说“你看我这做得多好,比给你的方针超了一倍”,老板就会说“那持续做吧,挺好”。这个便是拆分给老板看的榜首个数据。
第二个叫小规模本钱可控测验一波,也称之为MVP(最小可行性试验),这是《添加黑客》里常常说到的办法。先挑少数的人 ,比方5万,挑的人是最有掌握能召回、丢失前质量十分好的一波用户。
不要一上来就给礼品、现金、车币等,先来一波短信看看效果怎样。能够来个苦肉计,告知老板一条短信3分钱,总共需求XX元,实在不可我就自己掏了吧,先试一下。
先拆数据,然后再小本钱可控地测验一波,用这两个数据跟老板说,老板应该都会赞同去做的。这个便是预期效果。
(2)提出主意和(4)测验是一一对应的。这是什么意思?
先来看测验矩阵(4)。在测验前先把一切用户进行矩阵分类,比方:
A列是用户质量;
B列是挑选触达的东西;
C列是案牍;
D列是礼品等。
在做这个矩阵之前,还要给矩阵进行评分,这就来到了ICE模型(2)。
ICE模型是什么呢?便是影响、决心和简易性这三个方针,也是《添加黑客》里最经典的ICE。
经过底下这个矩阵随机组合成上面的矩阵,进行排分以及降序摆放,咱们再去挑选。假定最大能够承当10组试验组,那就选前10,经过这样的挑选去进行试验。
假定计划1(A1+B1+C1+D1)是最高的,挑选push手法触达、案牍一、红包,主页(即落地页是短信的主页)这样去测验,然后依此类推。这便是咱们试验的预备期和做试验的过程。
最终一步也是最要害的一步,叫试验复盘。试验复盘能给咱们带来许多意想不到的东西,这也是试验添加派最重要的过程。
在试验复盘的基础上,能够知道这一波什么做得好,什么做得坏。比方说榜首周测的是案牍,案牍召回率最高的是什么样的案牍?是设问句。“想知道爱车的实在价格是多少吗?易车全知道”,这种设问是召回效果最好的。
下一周咱们在测落地页的时分,就沿用上一周最好的案牍去测落地页。每一次的试验堆集一小步的成功,堆积起来,最终便转化为大的成功,这个是试验复盘最中心的东西。
咱们在上图中能够看到,我习气的试验复盘做法是运用一个气泡图加上甘特图的方法。
横坐标是召回率,纵坐标是召回质量。每次做召回质量测验,还会分样本组和试验组,试验组的留存除以样本组的留存,这个数值就叫矢量。气泡图的圈代表ROI,即出资回报率,下面的图表是时刻的ICE、发作量、以及召回率的总览。
这便是我的试验添加派模型。
06.技能派-逻辑回归
最终一个给咱们共享技能派的逻辑回归模型
1. 魔法数字
咱们不要听到“技能”两个字就以为很难,实践上技能派咱们常常在用。
什么是技能派?技能派最经典的便是魔法数字,信任咱们都不生疏。
那什么是魔法数字?便是依据大数据剖析,对事务进行阅历性总结的量化成果。
比方金融界的二八规律,互金职业的一九规律,Push的魔法时刻是早十晚六,上文说到的保护老用户的本钱是新用户的1/5,还有一些国外的比方,比方Facebook发现10天添加7个老友的留存要比没能做到的高得多,twitter10天重视30个大V等等,这都是魔法数字。
可是这都是他人的魔法数字,自己的途径怎样用魔法数字呢?
上图中的魔法数字2和7阐明晰什么状况?是召回用户7天之后才开端断崖式下滑,而新增用户是在第2天就开端断崖式的下降,所以说2和7便是两个魔法数字。
再看上面的表格,魔法数字2和3。榜首行是否注册是2.9,接近于3,这表明注册的用户是没有注册用户下单概率的3倍。底下的红字以此类推,也是看过成交页价格的是没有看过成交页价格概率的2倍,所以这个便是魔法数字3和2。
介绍完魔法数字,就带来今日真实的技能派添加的硬核的东西,叫逻辑回归模型。
2. 什么是逻辑回归模型?
逻辑回归模型是什么原理?上图中那根横着的红线便是逻辑回归模型,它将上下两种用户分隔,上面是下单用户,下面是未下单用户。咱们经过前史用户的下单和未下单的状况进行建模,套用到新用户上,就能够判别新用户下单的或许性。
再看用户的行为模型,赤色“是否下单”那一列,0代表未下单,1代表下单,这是追寻用户的一切途径,比方说用户在下单和未下单前他都干了什么,以这个为样本数据去模仿模型。
逻辑回归模型在医学和经济猜测范畴运用更多,而且运用多年了,优势是精度高、时效性强、难度低一级。
这也是我跟一个互金类大咖聊地利遭到的启示,我问“为什么他人告贷借到10万,而我去告贷却只借2万,你是依据什么模型做出的判别?”
他告知我这个便是用逻辑回归模型做的。我因而遭到启示:在经济、医学这么谨慎的学科里,它都能运营这么多年,这个模型放到易车的事务中应当也是没有问题的。
这个模型在实践事务中的奉献价值是输出详细模型,经过把这根红线给标出来,来判别用户是否下单购买,以及还有哪些行为会对下单有影响。
3. 逻辑回归模型的效果
先看挑选用户行为。挑选用户行为这块有一个“完结使命”黄框,但在建模进程中,这个框就没了。这阐明什么?阐明用户完结的每日报到使命,对下单是没有任何影响的,明显程度十分低。这些用户或许是羊毛党,他是想拿那些积分去换东西,而不是真实想去买车的用户。
榜首个明显性给事务的警示便是咱们没有必要把过多的资金投入到每日报到这个环节,而是要把钱花在怎样转化用户下单上,这便是资源分配的问题,这是一个挑选用户行为。
第二个是魔法数字的行为影响联系,这能够给咱们输出信息:注册用户是未注册用户下单概率的3倍,看过成交价格是没有看过成交价格下单概率的2倍等等这些方针。
第三个是逻辑回归模型的方程式,最终输出的是0和1,判别用户是否下单。这便是它的三个效果,判别明显性、影响倍率,还有它的实践模型。
4. 逻辑回归模型的运用
最终说下逻辑回归的运用,我以为也是最重要的一块。
我常说:“不能把模型落地的数据需求便是在耍流氓”。
你说那个模型好用吗?好用。那你用吗?不必,不会。你没用,就没必要花那么多精力去输出,所以运用真的很重要。
运用分红懒人形式和应战形式两种。
什么是懒人形式?一些运营人或许看到数据剖析就觉得扎手,没有满意的建模阅历,这样他只需求去担任用户,了解哪些用户的行为是值得追寻的,把这些行为搜集给到技能或许数据剖析,让数据剖析去把模型完结,最终再转化到模型运用。
而应战形式其实便是咱们做的,经过自己清洗数据-搜集数据-建模-调试模型,再到最终的模型运用。
模型运用分为三个阶段:运营手法、产品手法,还有技能手法。
运营手法是什么意思?我把它分为全主动触达和半主动触达。
全主动触达便是前文所说的那个红线,它能判别出0和1,0是不购买,1是或许购买,主动给你发短信或礼品。
半主动便是咱们将这些魔法数字转化为阈值。比方是否注册,阅读新闻的视频数约为20个,APP逗留时刻大于10分钟等等都是阈值,对满意这些条件的用户运用红包、短信等进行触达。
再来看产品手法。方才反复强调魔法数字,注册是未注册的3倍,所以咱们要改动的是注册率,经过进步注册率来到达进步下单率的意图,这是一种曲线救国的方法,也是咱们不断优化探究的方向。
在咱们的新版别里,注册页面分红了三步,咱们称之为“分布式”。它比老版别的表单式进步了7%的转化。经过进步7个百分点的转化从而进步下单率的转化,这便是产品手法。
最终一个便是技能手法,它比运营手法的功率要高5到6倍,也很好用。
为什么呢?由于技能手法会在满意行为条件的时分,瞬间弹出弹窗发送红包。
假定我注册过,我在你的APP逗留的时刻也满意了,我也看过成交页的价格,等我再看车型页的时分,很或许是我购买愿望的最高点,这时立马弹出红包,转化率是最高的。
这比运营手法高效,由于运营手法触达的时分或许现已是T+1了,热心也凉得差不多了。所以说技能手法十分好用,引荐咱们多用这种即时弹窗,满意条件马上弹窗。