项目数据分析 14个超有趣的数据分析项目数据集都给你整理好啦

栏目：汽车 2021-10-07 21:00:23

分享到:

转载自大数据文摘

对于那些对数据、数据分析或数据科学感兴趣的人，请提供一份可以在业余时间完成的14个数据科学项目的清单！

有三种类型的项目:

可视化项目

探索性数据分析项目

预测建模

可视化项目

最容易做到的就是数据可视化。以下三个数据集可以用来创建一些有趣的可视化效果，并将其添加到您的简历中。

1.新冠肺炎可视化

了解如何使用Plotly构建动态可视化数据，并展示冠状病毒如何在全球传播。Plotly使用方便，可以做动态可视化，好看又容易操作。

难度:

数据集:

https://www . ka ggle . com/sudalairajkumar/new-corona-virus-2019-dataset

教程:

https://towards data sciences . com/visualizing-the-coronavirus-大流行-with-choropeth-maps-7f 30 fccaecof 5

2.澳大利亚火灾数据的可视化

2019-2020年丛林火灾季节，也被称为黑色夏天，由2019年6月开始的几次极端野火组成。根据维基百科，这场大火摧毁了大约1860万公顷的土地和5900多栋建筑。

这是一个有趣的项目，可以使用Plotly或Matplotlib数据可视化工具来可视化野火的规模及其对地理的影响。

难度:

数据集:

https://www . ka ggle . com/carlosparadis/fires-from-space-Australia-and-new-zeland

3.表面温度可视化

你曾经怀疑过全球变暖的想法吗？创建一些数据可视化效果来显示地球表面温度如何随时间变化，这可以通过创建折线图或其他动画Choropleth地图来实现！你也可以创建一个预测模型来预测未来50年的地球温度。

难度:

数据集:

https://www . ka ggle . com/berkelyeath/climate-change-earth-surface-temperature-data/kernel

探索性数据分析项目

探索性数据分析又称数据挖掘，是指在数据分析过程中运用各种技术来更好地理解数据。

1.纽约的Airbnb数据挖掘

自2008年以来，Airbnb让游客和房东更容易出行，并提出了更个性化的体验世界的方式。这个数据集包含了2019年纽约租金的信息，以及地理信息、价格、评论数量等等。

可以分析的角度如下:

哪些领域的业务最好，为什么？

哪些地区的交通流量比其他地区多，为什么？

价格、评论数和预订天数有关系吗？

难度:

数据集:

https://www . ka ggle . com/dgomonov/new-York-city-Airbnb-open-data

2.哪些因素与员工离职和绩效有关

IBM发布了一个全面的数据集，可以用来了解各种因素如何影响员工的离职率和满意度。一些变量包括教育水平、工作相关性、绩效评估和工作生活平衡。

分析这个数据集，找出任何真正影响员工满意度的变量。此外，还可以看看能否对变量进行重要性排序。

难度:

数据集:

https://www . ka ggle . com/pavansubhashht/IBM-HR-analytics-消耗战-数据集

3.世界大学排名

你认为你的国家有世界上最好的大学吗？成为“最好”大学的标准是什么？这个数据集包含三个全球大学排名。利用这些数据，你能回答以下问题吗:

顶尖大学在哪些国家？

决定世界排名的主要因素是什么？

难度:

数据集:

https://www . ka ggle . com/my lesneill/world-university-rankings

4.喝酒和学校表演

喝酒会影响学生成绩吗？如果没有，还会有什么其他影响？这个数据是从中学生用数学和葡萄牙语进行的一项调查中获得的。它包含几个变量，如饮酒量、家庭数量和参加课外活动。

利用这些数据，我们可以探索学校成绩和各种因素之间的关系。另外，看看能不能根据其他变量预测学生的成绩！

难度:

数据集:

https://www.kaggle.com/uciml/student-alcohol-consumption

5.宠物精灵的数据挖掘

对于所有游戏玩家来说，这是一个包含七代802个口袋妖怪的信息数据集。试着回答以下问题！

哪一代宠物精灵最强？哪一代最弱？

哪种类型的神奇宝贝最强？哪个最弱？

能否建立一个分类器来识别神奇宝贝？

身体特征和力量状态之间有相关性吗？

难度:

数据集:

https://www.kaggle.com/rounakbanik/pokemon

6.探索影响预期寿命的因素

世卫组织建立了一套一段时间内所有国家健康状况的数据集，包括预期寿命和成人死亡率的统计数据。利用这个数据集，探索各变量之间的关系，预测对预期寿命影响最大的因素是什么？

请尝试回答以下问题:

原来选择的各种预测因素真的会影响预期寿命吗？实际影响预期寿命的预测变量有哪些？

预期寿命值低于(

婴儿和成人死亡率如何影响预期寿命？

预期寿命与饮食习惯、生活方式、运动、吸烟和饮酒呈正相关还是负相关？

接受教育如何影响人类生活？

预期寿命与饮酒呈正相关还是负相关？

人口密集国家的预期寿命在减少吗？

免疫覆盖率对预期寿命有什么影响？

难度:

数据集:

https://www.kaggle.com/kumarajarshi/life-expectancy-who

预测模型

1.能源消耗的时间序列预测

该数据集由美国地区传输组织PJM网站上的功耗数据组成。利用这个数据集，我们可以看看是否可以建立一个时间序列模型来预测能源消耗。除此之外，还可以查看是否能找到一天中每个小时的趋势、假期用电量以及长期趋势！

难度:

数据集:

https://www.kaggle.com/robikscube/hourly-energy-consumption

2.贷款预测

该数据集取自分析公司Vidhya，包括615行13列关于已批准和未批准历史贷款的信息。你能建立一个模型来预测贷款是否会被批准吗？

难度:

数据集:

https://data hack . analyticsvidhya . com/contest/practice-problem-loan-prediction-iii/

3.二手车价格计算器

Craigslist是世界上最大的二手车经销商。该数据集由Craigslist捕获的数据组成，每隔几个月更新一次。使用这个数据集，看看你是否可以创建一个数据集来预测汽车价格是高估还是低估。

难度:

数据集:

https://www . ka ggle . com/austinreese/craigslist-cars trucks-data

4.信用卡欺诈检测

该数据集显示了两天内发生的交易，其中284，807笔交易中有492笔是欺诈性的。数据高度正态分布，欺诈占全部交易的0.172%。学习如何使用异常数据集，构建信用卡欺诈检测模型。

难度:

数据集:

https://www . ka ggle . com/janiobachman/credit-欺诈-处理不平衡数据集

5.皮肤癌图像检测

利用1万多张图像构建神经网络检测皮肤癌。这绝对是最难的项目，需要储备神经网络和图像识别方面的知识。

难度:

数据集:

https://www.kaggle.com/kmader/skin-cancer-mnist-ham10000

数据城堡

大s玻尿酸明星整容谈之色变大S公开称离不开玻尿酸秦岚称打针是敬业

明星整容谈的颜色变化？大s公开说离不开玻尿酸，秦岚说打针就是奉献文/ 女明星的皮肤状态一般都很好。有些女明星四五十岁了，皮肤看起来像二十多岁的小姑娘，完全看不出中年气息。我们最熟悉的是林驰——刘玲小青等人，他们堪

·21-10-07
常宝华常宝华收侯耀华为徒并未影响他和郭德纲的好交情

作为经常相声的代表人物，常一生收过不少徒弟，其中最著名的徒弟有、、、赵福玉等。其他几个人还是以相声出名的，而侯耀华很少表演相声，而且因为他这些年的种种行为，经常被人诟病。在业内享有良好声誉的常，至今仍收为徒弟。

·21-10-07
国5的车还能开多久国六实施倒计时国五车还能开多久专家给出正确答案

今年7月1日起，国家六项排放标准开始实施，不符合标准的不允许上市销售。大量的国五车堆积如山，即使是经销商抛出的最低价也不会打动消费者。他们都想知道国五车能撑多久。从国五到国六的过渡时间只有一年左右，大部分厂

·21-10-07
海澜飞马水城即将开园海澜飞马水城玛阑多儿童乐园7月11日隆重登场

说到江阴的蓝海飞马水城，很多小伙伴都很熟悉。是以马术体验、马术表演、马术赛事、马文化展示为核心的马文化、体育、旅游综合体，精通吃喝玩乐。在这里，就像身处一个欧洲水乡，白天的风景和晚上完全不一样，各有千秋。最重要

·21-10-07
曹丕称帝曹丕登基后自立称帝纵观他的一生曹操当时的选择正确吗

在三国历史上，曹丕并不是一个很重要的人物，因为他是当时曹操之后的接班人。那么曹丕在正史中是一个怎样的人呢？大力发展文学，巩固文学的主导地位在司马懿等曹丕派大臣的支持和帮助下，曹丕在建安二十二年成为曹操选中的接

·21-10-07
恒述法师费玉清的姐姐费贞绫：当艳星做小三出家后挥金如土大聊性事

对于大多数人来说，费凌镇这个名字可能是陌生的。但是一提到她的两个弟弟，总是被人听到。大哥昌飞是台湾省的大哥。小哥费玉清，人称“小哥”，是著名的男歌手。然而，如果我们仔细细数费凌镇的一生，就会发现她不仅因为有

·21-10-07
德国女总理全世界最有权势的女人之一执掌德国15年

如果你长时间看国际新闻，你很容易在各国领导人的照片中注意到她，她经常在一堆男人中脱颖而出。她连续九年被《福布斯》评为全球最具影响力的女性。她是德国总理安格拉·默克尔，也是欧盟事实上的领导人。日本伊势，七国集

·21-10-07
送钱送钱要就进来拿

前段时间，优酷前总裁杨伟东收受贿赂，索要855万余元。他被判7年，没收200多万元。此人颇有实力，使得“这！即《街舞》《白夜追梦》《欢乐喜剧》等作品。他养了一个小三，一开始给她四百万买房子。后来女主人觉得买房

·21-10-07

项目数据分析 14个超有趣的数据分析项目 数据集都给你整理好啦

项目数据分析 14个超有趣的数据分析项目数据集都给你整理好啦