说说大全
心情说说 伤感说说 爱情说说 搞笑说说 个性说说 经典说说 过春节说说 国庆节说说 结婚的说说 劳动节说说 母亲节说说 下雨的说说 中秋节说说 清明节说说 励志说说 圣诞节说说 端午节说说 父亲节说说 过小年说说 腊八节说说 生日的说说 青年节说说 重阳节说说 妇女节说说 元旦节说说 情人节说说 植树节说说 愚人节说说 教师节说说 儿童节说说
放假安排
春节放假表 元旦节放假 清明节放假 劳动节放假 国庆节放假 中秋节放假 端午节放假 父亲节放假 母亲节放假 青年节放假 儿童节放假 妇女节放假 圣诞节放假 情人节放假 重阳节放假 愚人节放假 建军节放假 建党节放假 教师节放假 植树节放假 寒假放假 暑假放假 高速免费 放假游玩 加班工资 放假通知
节日祝福
端午节祝福 中秋节祝福 国庆节祝福 劳动节祝福 元旦节祝福 母亲节祝福 情人节祝福 感恩节祝福 圣诞节祝福 建军节祝福 儿童节祝福 父亲节祝福 新年祝福语 元宵节祝福 妇女节祝福 愚人节祝福 平安夜祝福 除夕夜祝福 教师节祝福 结婚祝福语 建党节祝福 护士节祝福 青年节祝福 植树节祝福 腊八节祝福 生日祝福语 乔迁祝福语 开业祝福语 考试祝福语 周末祝福语
句子大全
唯美的句子 好词和好句 骂人的句子 经典的句子 正能量句子 励志的句子 表白的句子 爱情的句子 幸福的句子 伤感的句子 失望的句子 抒情的句子 心酸的句子 心烦的句子 现实的句子 无奈的句子 回忆的句子 想家的句子 暗恋的句子 感人的句子
作文素材
小学作文 初中作文 高中作文 中考作文 高考作文 话题作文 陈述句 比喻句 拟人句 设问句 疑问句 夸张句 排比句 反问句 近义词 反义词 同义词 褒义词 贬义词 绕口令 歇后语 十万个为什么
职称考试
初级会计师 房产经纪人资格证 电气工程师 执业中药师 中西医执业医师 执业药师资格 成人高考专升本 法律职业资格 教师资格证 高级经济师 中级经济师 初级经济师 注册会计师 中级会计师 一级建造师 证券从业资格 期货从业资格 银行从业资格 基金从业资格 自学考试 二级造价工程师 护士资格证 监理工程师 安全工程师 二级建造师 一级造价工程师 一级消防工程师
范文大全
工作总结 毕业赠言 岗位职责 入党志愿 调研报告 活动策划 评语寄语 规章制度 入职培训 入党申请书 入团申请书 工作计划 合同范本 心得体会 思想汇报 活动总结 实习报告 毕业论文 转正申请 辞职报告 员工手册 行政公文 自我鉴定 自我介绍 检讨书 导游词 演讲稿 道歉信 慰问信 表扬信 辞职信 感谢信 介绍信 演讲口才 保证书 请假条 主持词 证明书 担保书 讲话稿
口号标语
节日习俗
端午节习俗 腊八节习俗 国庆节习俗 中秋节习俗 七夕节习俗 清明节习俗 寒食节习俗 元宵节习俗 春节的习俗 重阳节习俗 情人节由来 平安夜由来 龙头节由来 元旦节由来 圣诞节由来 下元节由来 寒衣节由来 感恩节由来 教师节由来 中元节由来 建军节由来 建党节由来 儿童节由来 母亲节由来 护士节由来 青年节由来 劳动节由来 愚人节由来 植树节由来 妇女节由来
网名大全
微信网名 情侣网名 游戏网名 男生网名 女生网名 搞笑网名 励志网名 快手网名 抖音网名 英文网名 一字网名 二字网名 三字网名 四字网名 五字网名 六字网名 七字网名 古风网名 微博网名 伤感网名
签名大全
伤感签名 微信签名 情侣签名 励志签名 英文签名 搞笑签名 暗恋签名 节日签名 分手签名 生日签名 经典签名 游戏签名 快手签名 抖音签名 霸气签名 古风签名 唯美签名 幸福签名 女生签名 男生签名
十二星座
白羊座 金牛座 双子座 巨蟹座 狮子座 处女座 天秤座 天蝎座 射手座 摩羯座 水瓶座 双鱼座
节气知识
霜降节气 谷雨节气 清明节气 春风节气 雨水节气 立春节气 夏至节气 小满节气 芒种节气 立夏节气 惊蛰节气 小暑节气 秋分节气 寒露节气 立冬节气 小雪节气 大雪节气 小寒节气 冬至节气 大寒节气 大暑节气 立秋节气 处暑节气 白露节气
经典台词
十二生肖
鼠的生肖 羊的生肖 牛的生肖 虎的生肖 兔的生肖 龙的生肖 蛇的生肖 马的生肖 猴的生肖 鸡的生肖 狗的生肖 猪的生肖
心语大全
对联大全
成语大全
古诗词句
经典语录

2020年双十一成交额是多少 淘宝2020年双11销售额预测

发表时间:2020-10-12 热度:

  2020年双十一成交额是多少 淘宝2020年双11销售额预测

  2020年天猫双11购物季活动即将到来,相信大家是否能刷新去年的成交额,2019年双11阿里报告了天猫双十一的全天销售额:2684亿。这个数字引发了一场关于统计学的有趣争执。

2020年双十一成交额是多少(淘宝2020年双11销售额预测)

  一位叫“尹立庆”的微博网友,在2019年4月24日发了一个贴,通过拟合2009-2018年的双11天猫数据,由于拟合度高达99.94%,他认为淘宝是在按公式假造成交数据。并且他还“预测”,天猫2019年双11成交额为2675.37亿(二次拟合)或者2689亿(三次拟合)。最终出来的数据是2684亿,与他预测的2689亿非常接近。

双11成交数据拟合神预测?——只是运气好而已

  这个“精准”的提前预测引发了不少人的关注,很多人确实相信淘宝是在凑成交额,不然怎么可能这么准?

双11成交数据拟合神预测?——只是运气好而已

  很多人翻出了这个“神预测”,暗示“阿里数字造假被抓现行”。这引发了一场风波,许多人在传,阿里双11销售数字造假。尹立庆在微博上的原贴已经被删除,但是网上截图还是很多。

  天猫的公关负责人也发了声明,驳斥了造假的说法。

双11成交数据拟合神预测?——只是运气好而已

  12日晚间,天猫再度发文回应称,“今早到现在,这则精心图文化设计的‘预测’开始被刻意传播”、“已就这则谣言启动司法流程”。估计尹立庆删微博是觉得不太对了。但是个人感觉天猫没有从数学上解释这些疑问。

  到底阿里有没有对双11天猫成交数据造假?如果没有造假,为什么统计拟合如此精准,尹立庆提前半年的预测又如此准确?我们来介绍一下相关的知识。

  首先说一下,这个预测涉及的“二次拟合”或者“三次拟合”不需要手算,其实是Excel等数据表格软件的功能。所以,不需要进行高深的数学推理和计算,会用Excel简单地制表就行了。

  首先是数据源,这个是有公开数据的,没有争议:

双11成交数据拟合神预测?——只是运气好而已

然后,对这两列数据制一个散点图表:

双11成交数据拟合神预测?——只是运气好而已

  然后是二次和三次多项式拟合曲线。

双11成交数据拟合神预测?——只是运气好而已

尹立庆的关键预测是下面这张图:

双11成交数据拟合神预测?——只是运气好而已

  以上这几个图都是引自尹立庆发的文章。我们要解释一下,预测里的二次、三次多项式拟合,以及R-squared是什么意思。不用急着去了解概念,看下面的操作流程自然就明白了。

  我自己用Excel可以复制这个二次拟合,截图如下:

双11成交数据拟合神预测?——只是运气好而已

  这个就是将年份与成交额两列数据,做成一个散点图表。然后鼠标点在一个数据点上,就会出来一个“趋势线”的选项。再把趋势线选择成“多项式”,选2次多项式。再让图表上显示公式、R平方值,左边的曲线拟合图就自动出来了。

  其实用国产免费软件WPS里面的表格,也一样可以做出这种趋势线的方程。为支持国产软件,我们用WPS来做。不难摸索出用WPS如何生成趋势线和方程。

双11成交数据拟合神预测?——只是运气好而已

  上图是WPS生成的2009-2019年11年的成交额数据的拟合曲线,可以看出,WPS和Excel生成的二次拟合方程参数是一样的。

  得出的拟合方程是一个二次的多项式:

  y= 30.237xx - 121529x + 1E+08,

  R平方 = 0.9996

  这个R平方就是“可决系数”,越接近1越好,有一个公式来计算的,后面会解释。公式里的1E+08是科学计数法写的常数项,数值太大了写不下,是一个数字。看样子曲线拟合得很好,但是为什么常数项都大到出不来了?哈哈,因为这个软件,把2009-2019当做数值,也就是说x的取值是2009到2019。它不知道是年份,也把这个拟合做出来了。

  我们弄聪明点,把年份用0-10代表,2009就是第0年,2019就是第10年,同样把图表和拟合方程做出来。用0开始的好处,是可以直接得到拟合的初值,其实用1-11也差不多。

双11成交数据拟合神预测?——只是运气好而已

这个方程就好多了:

  y= 30.237xx - 35.064x + 7.3632,

  R平方 = 0.9996

  我们把x = 10代进去算,得到的是:

  30.237* 10 * 10 - 35.064 * 10 + 7.3632 = 2680.423

  这个数值相当接近2019年天猫的实际成交额2684亿。画在图上这么点差距根本看不出来,点的中心就在趋势线上。看上去拟合得非常好,简直太漂亮了,天猫这11年怎么可能成交得这么准呢?

  到此我们可以看出来,所谓的“二次多项式拟合”,就是用一个方程:

  Y =A * xx + B * x + C

  去拟合一系列x值对应的原始y值,误差越小越好,“拟合度”越接近1越好。这个拟合度,就是用“R平方”来代表的。

  我们再把R平方的定义解释一下,

  R平方 = 1 - SSE/SST

  SSE就是和方差,每个点的拟合值与实际值有一个误差,对它平方,所有点的误差平方加起来,就是SSE。然后所有点原始y值,和平均值有一个差值,对这个差值平方,所有点的差值平方相加,就得到了SST,是个挺大的数。看不懂没关系,我们用下面的表格来解释。

双11成交数据拟合神预测?——只是运气好而已

  第一列年份0-10就是公式里的x值,分别对应2009-2019年。第二列就是实际的y值,是每年新闻报出的天猫成交额。这些实际成交值,有一个平均值890.35。拟合值,就是用公式“y = 30.237xx - 35.064x + 7.3632”算出来的每一年的值。误差,就是用“实际成交值”减去拟合的值。

双11成交数据拟合神预测?——只是运气好而已

  这个表是与上个图并排的,分开来看得清楚一些。误差平方就是对前面得到的误差值进行平方。所有的误差平方相加,就是误差平方和SSE,等于3183.18。

  每一年的实际成交值,和平均值890.35求出一个差异。然后对每个值平方,再求和。得到了“均值差平方和”SST,数值很大是8647639.7。

  然后就可以得到“可决系数”R平方,是 1 - 3183.18/8647639.7 = 0.9996。这个值就正好和WPS生成的R平方值相等。

  看这个表格,我们就忽然发现,这个拟合的“神奇感”好象下降了。你看第一年0.5的值,拟合值7.3632却是它的十多倍。第二年的拟合值2.5362,甚至不到第一年拟合值的一半。如果第二年业绩是这个鬼样,马云得把天猫负责人就地撤职。但是画成图,因为绝对坐标的关系,早期很大的拟合误差,与以后很大的成交值相比显得很小,画出来显得拟合得很好。

  我们发现,越是早期的小数据,误差相对越大。定义一个误差率,是误差值除以原值乘以100%。头四年的误差离谱地大,高的有1372%和72.9%,第四年差异仍然高达8.74%。后面随着原值的逐渐地大,误差率就逐渐减小,只有0.2%、0.1%了。

  也就是说,这个拟合的“秘诀”是:注意把每个点的误差的绝对值弄得小一些,顾头不顾腚,顾大不顾小。最后画出图来,因为坐标要跟比较大的数值的尺度,前面较大的相对误差就缩起来看不见了。

双11成交数据拟合神预测?——只是运气好而已

  另一点要注意的,不要迷信那个R平方值,以为多么接近1啊,真神奇啊。例如上图,假设2019年天猫成交额不是2684亿,而是跑到一个很歪的3000亿去了。那么我们新做一个二次多项式拟合,得出的R平方值仍然有0.9952,还是相当接近1。从图上看出来,后面两个点已经有点偏了,R平方值仍然漂亮得很。这是因为这个R平方值,分母SST是个特别大的数,怎么算最后总是接近于1。

  尹立庆的预测巧合在于,他对2019年的预测正好碰上这年天猫的增长是中规中矩的25.7%。二次多项式拟合的预测值2675,预期增长是25.3%,正好相差不大。天猫2019年成交增长25%,这个并不奇怪,不少人随口说个直觉也可能是这个数。

  但并不是每一年都如此,其实天猫的增长率也出过异常。

双11成交数据拟合神预测?——只是运气好而已

  看上图天猫历年的增长率,前面增长率高,后面增长率逐渐下滑,因为规模大了增长率下跌正常。但是2017年增长了39%,高于2016年的32%,这是一个数据异常。

  假设我们在2016年,看到8年的成交数据,搞了一个二次拟合,结果会是如何?

双11成交数据拟合神预测?——只是运气好而已

  我们用8个点,同样得到了一个相当漂亮的拟合曲线!R平方值也是0.9985,相当接近于1。方程是:

  y= 28.571xx - 25.295x + 0.1558

  如果用这个二次多项式方程,去算2017年的值,会是:

  y=28.571*8*8- 25.295*8 + 0.1558 = 1626.34

  2017年的实际成交额是1682亿,差了50多亿,就没有2019年只差几亿那么神了。

  有趣的是,这个公式对2017年的预测增长率是34.74%,也高于上年的32.35%。这是因为,2014、2015、2016三年的增长率分别是63%、59%、32%。这个32%降得有点多,在下一年就补回来一些。比如天猫管理团队认为,2016年增长率不尽如人意,要多想招,2017年的增长率就搞到了39.35%,发力过度,比拟合预测的还要高了。

  让我们来看8个点和11点得到的两个二次多项式拟合方程:

  2009-2016:y = 28.571xx -25.295x + 0.1558

  2009-2019:y = 30.237xx -35.064x + 7.3632

  注意,这两个方程对应的三个系数,差异已经非常大了。就算马云有一个“按公式操纵天猫每年双11成交额”的邪恶计划,我们也搞不清楚他最初设计的二次方程系数是如何的。

  所以,要么马云没有操纵天猫双11成交额的数学方程,要么马云在动态修正预测成交的方程。不太可能在某年就把这些系数定死了。

  其实,马云在动态修正预测成交的方程,这个倒是接近真相了。本来做生意就是这样的,上一年增长够高了,下一年的增长任务就轻一点,以免各种配套跟不上;上一年增长觉得低了,下一年就多努力做高,免得业绩增长不好看。但是都动态上了,本就无可厚非,是人家在搞数值化管理,谁管得着?

  等数值都出来了,再去回头把二次多项式的系数拟合出来,我们可以发现,很容易就拟合得不错,而且R平方相关系数可以做得很漂亮。前提条件是,这一系列数据增长率要比较大,前期的数据比较小,后期的数值大,就可以仅用二次多项式做出一个漂亮曲线了。

  如果增长率变动有点大,那就要用三次、四次多项式了。但原理是一样的,就不再分析了。

  总之,不要相信拟合的神奇,也不要相信“拟合度”接近1的神奇效果。这个在数学统计里,实在很平常。对搞过数据分析的人来说,这是最平常的手段,迷信拟合真是少见多怪,只会被内行笑掉大牙。

  这还只是二次多项式三个系数的拟合。要是用深度学习那上百万个系数来拟合,结果可以漂亮得让一些传统研发人员怀疑人生,转而去搞机器学习。

双11成交数据拟合神预测?——只是运气好而已

  最后,贴个经典拟合搞笑图:大象。吃瓜群众看看,数学公式拟合的威力有多大。这就是冯诺依曼说的,用四个参数我可以拟合出一头大象,而用五个参数我可以让它的鼻子晃。

猜你喜欢的文章
大家都在看