现在关注,免费领取网站搭建教程 |
||||
网站 |
SEO |
建站 |
小程序 |
电商 |
网站建设学习:xyz_99499
# 对电商数据进行研究,先调包和设置图表,为接下来数据分析做好准备。
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
# 图表大小设置,不了解.set_option()及.rcParams()复制粘贴方法名,发送后台提问。
pd.set_option('expand_frame_repr', True)
plt.rcParams['figure.figsize'] = (15, 5)
pd.set_option('display.width', 5000)
pd.set_option('display.max_columns', 60)
本模块,我们将下载淘宝内的影音电器类目下的麦克风/话筒数据,并将其保存为CSV文件。
我们一次下载一个月的数据,然后对一个月内麦克风/话筒的流量和转化情况进行分析。
如果引入有交易的淘宝销售麦克风/话筒的商家数据,就可以预估如果你开店可以获得的平均流量和每天的平均营收。
下载一个月的电商数据
在处理电商数据时,我想对占电商市场58%市场份额的淘宝内卖麦克风和话筒这些数据进行分析。
通过对一个月内麦克风/话筒的流量,转化以及单价变化情况等数据的了解,来判断影音类电器类目是否值得切入。
所以我到闲鱼租了一个生意参谋影音类目专业版,到生意参谋的市场栏目下,用阿明工具下载了麦克风/话筒市场下一个月的交易数据。
下面是导入的电商数据,我们用dropna方法对CSV文件里面的空值进行丢弃。
我们先看看这一个月来,麦克风销售单价的变化情况。
处理过程中发现,所有数据为object类型,还没有转化为float类型。(转化中也发现,数据需要去除特殊字符“ ,”)。
在处理麦克风/话筒的数据时,我想通过比对一个月客单价的变化趋势,来判断一个月麦克风平均销售单价的变化。
小tips:在使用图表的时候,一定要注意刻度对数据对影响。
所有电商数据获取,是我租的生意参谋数据。如果想要这些电商类目数据,可以后台留言给我。
我们先对数据进行个梳理理解。
e_commerce.columnse_commerce.index
Index(['类目名', '日期', '搜索人数', '搜索次数',
'访客数', '浏览量', '收藏人数', '收藏次数', '加购人数',
'加购次数', '支付人数', '交易金额', '客单价', '支付转化率'],
dtype='object')RangeIndex(start=0, stop=33, step=1)
我们可以看到总共包含十四个列。分别包含固有属性数据标签、行为数据标签和再加工运算数据标签。
理解数据
我们试着来逐一理解。
类目名和日期,这是淘宝在影音类目下的麦克风/话筒这个二级类目一个月的交易数据。
当然,如果店家因为各种原因,它的商品在后台上架的时候没有挂到这个麦克风/话筒类目下,那么它的数据是没有记录在这里面的。
其实这样的情况较少出现,除非是一些新产品淘宝自己都归类不清晰,如车载音乐U盘,才会出现不同类目下都会有数据。
其他行为数据标签,可以根据电商万能公示拆解。
流量*转化*价格 = 收入
这个公式的局限性就是没有引入时间这个纬度,因为时间是有成本的。
也没有引入价值这个维度。因为价值决定着流量是否精准,转化人群对价值的主观判断决定着价格的高低。
搜索人数属于流量侧。重点考虑数据精度大小。麦克风这个类目搜索人数主要以目标人群搜索麦克风及麦克风相关词这类行为来确定,也有其他标签来确定搜索人数。(淘宝对每个用户打的个人标签有上万个)
搜索次数也属于流量侧。仔细观察会发现搜索次数大于搜索人数,这也间接证明一个用户会用好几个关键词搜索。所以搜索次数/搜索人数,可以近似估价为用户使用关键词平均个数。
在这里对数据进行了清洗,先清除特殊字符,然后转化为float格式。
然后看一下平均每个人使用关键词搜索次数。
查看交易金额变化情况及转化率
我们看看交易金额随着时间变化的情况,看是否有异常值。这里仅仅是为了体验一下pandas的神奇之处。
同时我们也计算了一下转化率,便于和其他产品的转化率做对比。
投放前准备
接下来,我们需要把日期转化为星期,然后对星期几的访客人数及付款人数做分析,确定投放关键词的时间。
全部完成!
这篇文章重点还是对电商数据的寻找和导入,并且了解一些基础清洗方法。更多关于电商的数据分析还需要业务的沉淀和思考。
想要获取完整代码,关注公众号,后台留言获取。