本项目主要内容为分析双十一天猫美妆产品的销售情况,通过数据信息挖掘出用户在购物节期间对于美妆产品的购物偏好,进一步分析美妆产品各品牌的优势和提升空间,更好的理解美妆市场的发展现状,对未来行业的发展提供合理建议。同时通过对各项产品的销售情况以及讨论热度,为消费者提供一个合理的购物推荐,帮助用户选择更合适的产品也是该项目的研究方向。
本项目数据集为beautymakeup.xls,部分字段含义说明如下:
字段名称
字段解释
update_time
更新时间
id
用户名称
title
商品名称
price
价格
sale_count
销量
comment_count
评论数量
sub_type
商品子类型
main_type
商品主类型
day
下单日期
首先导入数据。
运行结果:
表内共12个变量,27512条数据。下面检查数据是否有缺失值和重复值。
运行结果:
这说明该数据完整,不存在缺失值和重复值。
2.1各品牌产品销量与销售额
我选择了两种可视化各品牌产品销量的方法,一种为条形统计图,以销量降序排列,另一种为词云图的模式。两种方式都直观地给出双十一期间各品牌产品销售量的情况。根据可视化的结果,将各品牌在销量方面分为五个梯队:第一梯队有相宜本草,销售量超过6千万,以绝对性的销量远超其他品牌;第二梯队有美宝莲、悦诗风吟、妮维雅和欧莱雅,这四个品牌紧随相宜本草之后,销售量在3千万以上;第三梯队有自然堂、蜜丝佛陀和佰草集,销售量大于1千万;第四梯队有兰芝、美加净、倩碧、雅漾、雅诗兰黛、欧珀莱和兰蔻,销售量大于1百万;第五梯队有薇姿、雪花秀、资生堂和娇兰,销售量小于1百万。对于销售量为0的SKII、植村秀和玉兰油则不在本次数据分析之内。
梯队类别
品牌名称
销量情况
第一梯队
相宜本草
大于6千万
第二梯队
美宝莲
大于3千万
悦诗风吟
妮维雅
欧莱雅
第三梯队
自然堂
大于1千万
蜜丝佛陀
佰草集
第四梯队
兰芝
大于一百万
美加净
倩碧
雅漾
雅诗兰黛
欧珀莱
兰蔻
第五梯队
薇姿
小于1百万
雪花秀
资生堂
娇兰
下面对各品牌的产品销售额进行分析。
观察统计图,观察到在相宜本草在销售量和销售额上双第一,并且领先优势非常明显;产品销量处于第四梯队的雅诗兰黛在销售额上处于领先位置,我们可以猜测这是因为雅诗兰黛产品的平均价格较高于大部分产品,才使得虽然销量情况处于劣势,但销售额比较客观的局面。为了分析各品牌产品销量和销售额之间的关系,绘制出散点图,并添加趋势线辅助我们分析二者之间的关系。散点图如下所示:
观察图像可以明显看出相宜本草、蜜丝佛陀、欧珀莱以及雅漾的销售额与产品销量呈正比关系,有强相关性,意味着随着产品销量的增多,销售额也随之增多。除此之外,兰蔻、倩碧、美宝莲、自然堂和悦诗风吟的产品销量与销售额之间相关性较强。而像雅诗兰黛、佰草集、欧莱雅、妮维雅和美加净等产品的销售量与销售额相关性较弱,对于这种情况可以提出猜测:产品销量虽低,但产品的平均价格较高,导致产品销售额较客观。
2.2各产品类型销量与销售额
美妆产品在在主类型主要分为护肤品、化妆品和其他三类,更加细致地区分子类型包括底妆类、防晒类、精华类等12中小类别。下面来分析主类别和子类别的情况。
2.2.1主类型产品分析
首先绘制出主类型的销售情况,采用饼图的方式呈现:
在产品销量方面,护肤品和其他类的产品销量占比很高,化妆品仅占11.53%。
在销售额方面,与产品销量占比关系一致。
接下来绘制出各品牌主类别的产品销量和销售额:
观察条形图各品牌的主类别产品销售情况,能够看出妮维雅的护肤品在所有产品销量最大,其次是相宜本草,悦诗风吟、欧莱雅和自然堂,合理猜测这几个品牌的护肤品在用户当中的品质口碑较高。化妆品方面,美宝莲的销量居于第一,其次是悦诗风吟和蜜丝佛陀,而剩余品牌的化妆品销量情况很一般,合理猜测这三个品牌的美妆类产品广受用户好评。
2.2.2子类型产品分析
首先绘制出子类型的销售情况,采用饼图的方式呈现:
在产品销量方面,除了其他类产品,清洁类、化妆水、面霜类和底妆类销量占据前四,说明用户对这三类产品的需求量较大,而对于修容类、眼部护理和防晒类产品需求量较小,也或者收到价格的影响,导致产品销量不高。
在产品销售额方面,除了其他类产品,也是清洁类、化妆水、底妆类和面霜类排名靠前。
2.3各品牌评论数
从条形图可以看出悦诗风吟的评论数最多,娇兰、资生堂和雪花秀的评论数较少,下面对评论数和产品销量之间的关系进行探究,还是绘制散点图观察相关性。
观察图像,发现悦诗风吟的坐标点偏离趋势线,说明该产品的评论数与产品销量不成正比,意味着评论中有一部分会是差评,或者是刷评论,这类评论不能作为评判该商品品质的因素。而相宜本草的坐标点也远离趋势线,结合相宜本草的销售量多,但是评论数量少的特点,可以判断出并不是产品品质不好导致评论数较少。除此之外的其他产品的评论数和产品销量均贴近正比,说明用户在购买产品时会考虑产品评论的因素,并且这种因素占主要方面。
2.4每日销售情况
“双十一购物节”通常会在每年11月11日之前就进行活动预热,一些商家就会开始以“预售”或“先付定金后付尾款”的方式提前进行交易。从图像也能看出,11月4日(因为更新时间为5日零点,所以数据为4日的数据)为购物节的第一天日销量和日销售额都保持高涨状态,一直持续到9日。到了11月10日开始日销售量和销售额开始下降,即使后面几日稍有回升,但也没有10日之前的成果好。透过数据也能看出,用户对待购物节的态度前期高涨,后期随心,所以这也是越来越多的商家在购物节前期就做足商品预热,无论是价格还是优惠券还是额外福利都在前期吸引了大部分人的眼球。针对这一特点,购物平台可以在购物节进行到中期时开展新的活动赛道,让用户始终对购物节保持新鲜感,促进购物消费。
2.5男士专用商品统计
在分析数据时注意到有一个变量:是否为男士专用。往往大众都会认为女士是美妆产品的主要客户,忽略了男士这一购物群体。下面对男士用品的购物情况进行分析,挖掘一下美妆产品在男士用户的市场发展空间。
从图中可以直观地看到,在美妆市场中女性处于主导地位,男士也有一定的产品需求,主要集中在护肤品这一大类,而美妆类男士专用产品的销售量很少,仅占全部销量的0.03%,那么针对男性美妆市场,可以将主要的产品方向放在护肤品类别中。
在护肤品大类中,男士专用产品销量占比最高为清洁类产品。作为参考,商家可以加大男士专用洗面奶、男士专用清洁面膜、男士专用身体乳等产品的优惠力度,增加这些品类产品的宣传,进一步打开男士专用美妆产品的销路。
2.6各品牌价格分析
全品类的平均价格为404,有六个品牌的平均价格高于全品类平均价格,分别为:娇兰、SKII、雪花秀、雅诗兰黛、兰蔻和资生堂,这些都是国际一线大牌;兰芝、倩碧、玉兰油、植村秀、佰草集、薇姿和欧珀莱的平均价格介于200到400,国货品牌中佰草集价格最高;其余品牌平均价格在200元以下,美加净的价格最低,其次是妮维雅第二低。由此可见,和国际一线大牌相比,普通品牌价格更加亲民一些。
下面来探究各品牌的平均价格与其产品销量的关系。绘制各品牌价格与其对应产品销量散点图。
由趋势线走向可以判断出,大部分品牌的产品销量与平均价格成反比,随着平均价格的升高,其产品销量也在减少。也几乎很少会出现平均价格较高,产品销量也较高的情况。因此可以得出结论,价格定位会影响产品销量。
该项目的主要工作是对“双十一淘宝美妆数据”分析,了解用户购买行为和市场趋势。通过使用R语言对收集的数据进行预处理,使用Tableau实现数据的可视化处理。项目主要包括了数据的预处理、分析、可视化和结果解释。
首先,对数据进行了基本的清洗和预处理,以确保分析的准确性。这包括了处理缺失值和值,重复本项目数据完整,不存在缺失值和重复值。接下来,通过绘制条形图图、饼图、散点图等,从不同角度分析了数据,包括各品牌平均价格统计、产品销量与评论数的关系、产品销量随时间的变化等关系。通过以上这些图像带给我们的启发,可以从本项目中得到以下结论。
1.在本次购物节中,销量最好的品牌为相宜本草,销量达于6千万,其次为美宝莲、悦诗风吟、妮维雅和欧莱雅,销量大于3千万。这些品牌的产品平均价格均低于全品牌平均价格,价格亲民,是大多数用户的选择。
2.护肤品的销量远大于化妆品,护肤品中销量较高的是清洁类,面膜类,面霜类,化妆水;化妆品排名较高的是底妆类,口红类,眼部彩妆类等。
3.产品价格和评论数量会影响产品销量,产品销量与产品价格成反比,与评论数量成正比,用户更倾向于购买评论数较多的产品。
4.商家会在购物节之前进行活动预热,消费者在双十一前几天产品销量最高,双十一当天产品销量反而降低,双十一之后的三天,销量反而回暖。购物平台可以选择在购物节中期再开展相关的优惠活动或宣传活动,保证活动的热度和用户黏性。