技能开发 频道

Python剖析 谁是2018世界杯夺冠最大抢手?

  【IT168 技能】2018年,世界杯小组赛现已在如火如荼的进行中。在上篇文章的基础上【世界杯:用Python剖析抢手夺冠球队-(附源代码)】,咱们持续剖析世界杯32强的实力状况,以期能够更进一步剖析本次世界杯的夺冠抢手球队。

  文中有获取本文源代码的方法

  三十年河东三十年河西,关于世界杯而言,这个时刻或许4年就满足。

  前几场爆冷,使得露台上现已拥挤不堪,跳水的股市更是让露台一度紊乱。

  在文章开端之前,提示咱们:

  赌球有危险,看球须尽兴

  本文的重点是经过剖析32强之间的竞赛,透过前史数据来猜测夺冠抢手球队。

  本次剖析的数据来历于 Kaggle, 包括从 1872 年到本年的数据,包括世界杯竞赛、世界杯预选赛、亚洲杯、欧洲杯、国家之间的友谊赛等竞赛,总共大约 40000 场竞赛的状况。

  本次的环境为

  ·window 7 体系

  ·python 3.6

  ·Jupyter Notebook

  ·pandas version 0.22.0

  先来看看数据的状况:

Python剖析 谁是2018世界杯夺冠最大抢手?

  该数据集包括的数据列的信息如下:

  ·日期

  ·主队称号

  ·客队称号

  ·主队进球数 (不含点球)

  ·客队进球数 (不含点球)

  ·竞赛的类型

  ·竞赛地点城市

  ·竞赛地点国家

  ·是否中立

  成果如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  1、 获取一切世界杯竞赛的数据(含预选赛)

  创立一个新的列数据,包括取胜部队的信息,以及获取一切世界杯竞赛的数据,包括预选赛。

Python剖析 谁是2018世界杯夺冠最大抢手?

  成果如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  2、 世界杯战绩剖析 (含预选赛)

  从前文来看, 在世界杯前史上,实力最强的5支球队是 德国、阿根廷、巴西、法国、西班牙。

  接下来,咱们将竞赛的规模扩展至包括世界杯预选赛,经过5支球队之间的竞赛状况来进行剖析。

Python剖析 谁是2018世界杯夺冠最大抢手?

  在世界杯前史上,5支球队在共有43场竞赛相遇。

  经过这43场竞赛剖析后,5支球队的输赢场数排名如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  成果如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  下面,着重来剖析下这5支球队,在世界杯上,两两对阵时的输赢状况。

  首要自定义两个函数,别离取得两支球队取胜场数状况以及自定义绘图函数

Python剖析 谁是2018世界杯夺冠最大抢手?

  根据上述函数,剖析成果如下:

  2.1 世界杯战绩:巴西 vs 其他4支球队

Python剖析 谁是2018世界杯夺冠最大抢手?

  成果如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  计算现象1:

  在世界杯上的战绩,计算取胜场数如下(不含平局):

  巴西1:1德国,巴西6:3阿根廷,巴西1:2法国,巴西3:1西班牙

  巴西队,输赢欠好判别……

  2.2 世界杯战绩:德国 vs 其他3支球队

  代码跟2.1部分是相似的,成果如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  计算现象2:

  在世界杯上的战绩,计算取胜场数如下(不含平局):

  德国4:1阿根廷,德国2:1法国,德国2:1西班牙

  德国在这5支球队里,取胜的优势相比照较显着。

  2.3 世界杯战绩:阿根廷 vs 其他2支球队

  代码跟2.1部分是相似的,成果如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  计算现象3:

  在世界杯上的战绩,计算取胜场数如下(不含平局):

  阿根廷2:0法国,阿根廷1:0西班牙

  但阿根廷不敌巴西和德国

  2.4 世界杯战绩:西班牙 vs 法国

Python剖析 谁是2018世界杯夺冠最大抢手?

  归纳小定论:

  从历届世界杯上的体现状况来看,剖析5强之间两两对阵后,发现德国队的体现是最好的。其次巴西和阿根廷的体现也不错。

  考虑到,历届世界杯的数据,时刻跨度很大,许多球队其实现已发生了很大改变。

  球队实在的状况,或许挑选近几年的竞赛,以及包括不同等级的竞赛,或许剖析效果要更好些。

  文中有获取本文源代码的方法

  下面,重点来剖析2014年以来包括一切竞赛的状况。

  3、2014年以来,一切竞赛的战绩比照

  首要,时刻挑选2014年之后(含2014年),间隔现在的时刻比较近,相对来说,球队人员的组成改变小一些。

  当然,这儿的时刻挑选,关于成果是有影响的。 咱们能够讨论下这个要素带来的影响。

  3.1 2014年以来一切球队一切竞赛输赢状况概览

Python剖析 谁是2018世界杯夺冠最大抢手?

  2014年以来,共有3600多场竞赛。

  针对3600多场竞赛剖析后,输赢场数状况如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

Python剖析 谁是2018世界杯夺冠最大抢手?

  从上图来看,2014年以来,墨西哥,法国,德国、葡萄牙、巴西、比利时、韩国和西班牙体现相对较好。

  成果是不是跟幻想中的有些差异?

  6月17日的小组赛,德国不敌墨西哥,看来也不是全无理由的。

  可是,本次咱们首要仍是要考虑32强之间的对阵,这样更能反映现实状况。

  3.2 2014年以来32强相互之间在一切竞赛中的概览状况

Python剖析 谁是2018世界杯夺冠最大抢手?

Python剖析 谁是2018世界杯夺冠最大抢手?

  从上图来看,自2014年以来,巴西、法国、葡萄牙、阿根廷、墨西哥、比利时、德国、西班牙、英国为前9强。

  下面咱们来剖析top9之间的输赢状况。

Python剖析 谁是2018世界杯夺冠最大抢手?

  2014年以来,top 9 之间总共踢了44场竞赛(包括友谊赛)。

  整体来说,竞赛的场数不是太多,根据这些数据来剖析,或许对成果会有较大的影响。

  九强排名如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

Python剖析 谁是2018世界杯夺冠最大抢手?

  来查看下都计算了哪些类型的竞赛

Python剖析 谁是2018世界杯夺冠最大抢手?

Python剖析 谁是2018世界杯夺冠最大抢手?

  从上面来看,友谊赛占的份额较大。

  考虑到友谊赛在有些状况下或许不能比较精确的反映出球队的实在水平,且友谊赛站的场数份额较大,咱们除掉友谊赛再来看看成果状况。

  3.3 2014年以来32强除掉友谊赛后的输赢状况概览

Python剖析 谁是2018世界杯夺冠最大抢手?

  除掉友谊赛后,竞赛类型散布如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  除掉友谊赛后,Top 9 的状况如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  在概览中能够看出,是否除掉友谊赛(Friendly),对排名仍是有影响的。

  其他,除掉友谊赛后,总的竞赛场数更少了(只要13场),9强之间有些部队没有竞赛,或许没有赢过,这个数据用来剖析的效果更有限。

  当然,在剖析中 是否要除掉友谊赛,应该是值得商讨的。

  3.4 九强两两对阵的输赢状况概览

  这儿,咱们后续剖析选用包括友谊赛的数据,来别离剖析9强之间两两对阵的状况,看看哪支球队的胜率更高些。

  首要自定义几个函数,便利进行剖析。

  自定义获取球队某年至今取胜份额函数

Python剖析 谁是2018世界杯夺冠最大抢手?

  自定义获取两支球队前史取胜状况比照函数

Python剖析 谁是2018世界杯夺冠最大抢手?

  自定义两支球队前史取胜状况制图函数

Python剖析 谁是2018世界杯夺冠最大抢手?

  这些函数有什么用呢,首要咱们来剖析下 巴西 vs 德国 的状况,如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

Python剖析 谁是2018世界杯夺冠最大抢手?

  上述图中,x轴代表的意义是从某年至今(数据集含有部分2018年的竞赛数据),两支球队的输赢状况。

  例如 2012对应的是 德国跟巴西从2012年至今,两支球队的输赢状况。

  所以,时刻越早,两支球队的竞赛数量越多,数据曲线的动摇或许要小些。但由于球队的成员组成在不断的改变,会导致越早的数据,其剖析价值越弱。 因而,挑选适宜的年份进行剖析就显得很重要。

  有童鞋说,假如我要 一起剖析德国对阵其他8支球队呢?

  这儿,用上面的函数,也是很敏捷的,代码如下:

Python剖析 谁是2018世界杯夺冠最大抢手?

  运转上述代码后,将会制造8张图,下面只放上其间几张图。

  同理,假如你喜爱巴西队或许其他球队,也能够用上述代码进行剖析。

Python剖析 谁是2018世界杯夺冠最大抢手?

Python剖析 谁是2018世界杯夺冠最大抢手?

  用上述函数能够快速的剖析两支球队的前史输赢状况,当然,有些球队之间,相遇很少,或许近些年没有遭遇过,那剖析成果或许就欠好用了。

  当然,数据剖析的仅仅前史状况,足球是圆的,场上瞬息万变。比方,阿根廷现在危如累卵,梅西心里慌得一逼……

  4 猜测

  本届世界杯真的是爆冷太多。

  意大利,荷兰,连小组赛都没进;

  阿根廷,能够说现在已凉了半截;

  德国队,若不是最终的绝杀,也差不过能够送首凉凉了,不过现在看已回血多半。

  最终,来放上我的神猜测。

  黑马年年有,本年特别多,猜测禁绝,坐等 pia pia 打脸。

Python剖析 谁是2018世界杯夺冠最大抢手?

  当然,其实我心里深处期望是下面这样的。

  怎么样,为强壮的心里点赞吧~~

Python剖析 谁是2018世界杯夺冠最大抢手?

  特别阐明: 以上数据剖析,纯属个人学惯用,猜测成果与实际状况或许误差很大,不能用于其他用处。

  本文是一次比较归纳的项目实战,期望能够给咱们带来一些启示。如需获取源代码,请在大众号【Python数据之道】后台回复“code”获取。


0
相关文章