引言
随着信息化时代的到来,大学生消费数据逐渐成为研究热点。通过对大学生消费数据的分析,我们可以深入了解他们的消费习惯、消费结构和消费观念,为校园消费市场的健康发展提供有益参考。本文将运用Python进行数据可视化,揭开大学生消费的秘密。
数据来源与预处理
数据来源
本文选取了某高校2019年度的校园卡消费数据作为研究样本,包括学生在食堂、超市、图书馆、校园卡充值等场景的消费记录。
数据预处理
- 数据清洗:去除异常值、重复数据和无意义数据。
- 数据转换:将消费金额转换为元,消费时间转换为日期格式。
- 数据整合:将不同消费场景的数据整合到一个数据集中。
数据可视化分析
1. 消费结构分析
食堂消费
import matplotlib.pyplot as plt
# 食堂消费数据
canteen_data = {
'早餐': 1000,
'午餐': 2000,
'晚餐': 1500,
'夜宵': 500
}
# 绘制饼图
plt.pie(canteen_data.values(), labels=canteen_data.keys(), autopct='%1.1f%%')
plt.title('食堂消费结构')
plt.show()
超市消费
# 超市消费数据
supermarket_data = {
'日用品': 1000,
'零食': 500,
'水果': 300,
'饮料': 200
}
# 绘制饼图
plt.pie(supermarket_data.values(), labels=supermarket_data.keys(), autopct='%1.1f%%')
plt.title('超市消费结构')
plt.show()
2. 消费时间分析
import pandas as pd
# 消费时间数据
time_data = {
'日期': ['周一', '周二', '周三', '周四', '周五', '周六', '周日'],
'消费次数': [100, 150, 120, 130, 180, 200, 160]
}
# 创建DataFrame
df = pd.DataFrame(time_data)
# 绘制柱状图
df.plot(x='日期', y='消费次数', kind='bar')
plt.title('一周消费次数分布')
plt.show()
3. 消费金额分析
# 消费金额数据
amount_data = {
'金额区间': ['0-500', '500-1000', '1000-1500', '1500-2000', '2000-2500', '2500-3000'],
'人数': [100, 150, 120, 80, 50, 40]
}
# 创建DataFrame
df = pd.DataFrame(amount_data)
# 绘制柱状图
df.plot(x='金额区间', y='人数', kind='bar')
plt.title('消费金额分布')
plt.show()
结论
通过对大学生消费数据的可视化分析,我们可以得出以下结论:
- 食堂消费是大学生消费的主要部分,其中早餐、午餐、晚餐的消费比例较高。
- 超市消费中,日用品和零食的消费比例较高。
- 大学生的消费时间主要集中在周一至周五,周六、周日的消费次数相对较少。
- 大学生的消费金额主要集中在1000-2000元区间。
这些结论有助于我们更好地了解大学生的消费习惯,为校园消费市场的健康发展提供有益参考。