利澳彩票app

当前位置 > 首页 > 案例分析 > 阿里巴巴数据分析实战:超详细的母婴电商分析流程

阿里巴巴数据分析实战:超详细的母婴电商分析流程

来源:利澳彩票app下载行业网 | 时间:2020-05-21 | 作者:数据委

随着科技互联网的发展,电子商务在现代商务企业的发展中占有越来越重要的地位,而数据分析作为电商行业非常重要的一种运营手段,在营销管理、客户管理等环节都需要应用到数据分析的结果。本文以阿里巴巴天池的婴儿用品购买数据为例,进行相关分析并提出建议。

 

数据理解

1. 数据来源

笔者在阿里巴巴天池下载的数据,这部分帮大家整理好了,可以在文末添加客服领取。

 

2. 字段含义

 

 

 

分析思路

1. 问题
  • 年龄段的分布情况
  • 哪一类商品最受欢迎
  • 不同性别对商品的选择情况
  • 同一商品大类下不同分类的畅销程度
  • 用户购买商品的季节性偏好
2. 思路
产品、用户两个维度展开:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 数据清洗
1.在此次的数据分析中不需要用到表1的“物品编号”、“商品属性”列,隐藏该列。
2.修改列名,改成中文。
3.表1为用户购买记录,不能排除同一位用户在同一天重复购买相同商品的情况,所以不做重复值剔除,表2用户ID无重复值。
4.表1各列计数均为29972,表2各列计数均为954,未发现缺失值。
5.生日、购买日期通过分列功能转化成日期格式,性别通过if函数转换成文本“女、男、未知”,通过vlookup函数多表关联查询功能及datedif函数求得购买年龄。
6.通过排序和筛选功能,将购买年龄为28岁的数据进行异常值剔除。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 问题分析
1. 产品维度
(1)一级商品种类按季度汇总销量如下
发现2012年只有三、四季度的销量数据,2015年只有一季度的销量数据且并不完整。为了保持数据完整性,故选取2013、2014年进行分析。
从年度销量数据来看,28居销量第一,其次是50014815,但2014年50014815销量激增反超28夺得销量榜首,28增长率在品类中倒数第一。现通过假设检验分析方法进行具体分析。
假设一:少数客户购买销量巨大,对各品类商品总销量有明显影响
对购买量进行描述性分析,如下图:
大多数的订单购买量为1,最大单笔购买量为10000,标准差为63.99,说明存在少量客户大量购买导致销量剧增的情况,剔除与平均值偏差超过3倍标准差的异常值,即购买数量大于192的数据样本。
进行剔除前后年度销量数据比较如下:
由上图可以看出,2014年50008168的销量激增很大一部分原因来自个别客户的大量购买,剔除异常数据后,28依旧为用户最受欢迎的选择,假设一成立。
假设二:促销活动有带动作用
进行剔除前后季度销量数据比较如下:
由上图可以看出,122650008、50022520、38季度销量比较稳定,28、50008168和50014815销量最多主要在四季度,考虑到大客户订单对销量影响明显,提取这三个品类剔除异常值的四季度日销量进行分析。
可以看出28、50008168和50014815的销量峰值主要集中在11月11日和12月12日前后,推测为双十一和双十二促销活动带动销量的增长,假设二成立。
(2)对一级商品种类内销量前十的二级细分商品销量进行分析
由上图可知,50014815和38中二级商品细类销量排第一的分别是50018831、211122,都在60%以上,各商品销量差距大;而一级商品种类中28、50008168、50022520和122650008购买量排名前2的二级细类商品占比均在40%左右,各商品销量较为均衡。
(3)为了保证数据的完整性和排除个别客户大量订单对数据造成影响,选取2013-2014年异常修正后的数据进行分析。
商品销量在二季度、四季度有增长峰值,对这两个季度进行月销量分析。
二季度和四季度月销量最多的分别是5月和11月,对这两个月份进行日销量和细化一级种类商品销量分析。
由此可以得出,5月销量集中在11日之后和月底,查询当年节日正值母亲节之际和儿童节前期,而11月份销量主要集中在11日前后,为双十一购物狂欢节时期。除此之外,无论是5月还是11月,销量贡献主要集中在一级品类商品28、50008168、38。
(4)复购率
总用户数为29943人,重复购买的用户数一共25人,复购率为0.083%,不到千分之一可以忽略,可能原因有①产品不被客户认可,缺乏用户年度②产品为耐用型。这部分需要额外的数据支撑,这里不再研究。
2. 用户维度
(1)年龄分布情况如下:
提出假设:婴儿年龄越小用户购买需求越大
进行相关分析:
年龄与购买人数的相关系数为-0.86,高度负相关,证明假设成立。
其中,各年龄层偏爱的一级商品种类前三分别是50014815、50008168、28。
(2)性别比例
在总销量中,女婴购买量占52.75%,相比男婴购买量的47.25%高出5.5%,说明女婴的购买需求大于男婴。
由上图可知,50014815最受女婴用户欢迎,50008168最受男婴用户欢迎。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? 结论建议
1.用户的购买量相差大,少数客户下单量巨大对销量有明显影响,建议做好大客户的服务,保持长期合作关系。
2.节日性活动对销量提升有明显促进作用,重点关注母亲节、儿童节、双十一和双十二。
3.销量贡献主要集中在一级品类商品28、50008168、38,根据商品的过往销量情况做好库存管理。
4.5岁以内是购买主力,随年龄增长购买需求下降,而女婴消费比例略高于男婴,后续策划促销活动可侧重借鉴此类用户画像。
5.复购率极低,要重点了解原因,如不是因为商品本身特性如耐用品,会有很高的提升空间。