足球比赛结果预测模型

本文建立了一个关于足球比赛结果预测和确定如何下注获利最大化模型。 第一问,对于确定 X 场比赛主队胜平负以及如何下注问题,我们将给定的大 量数据(各球员进球、助攻、射门、射正和扑救等数量)进行整合,运用 Excel 进行统计分析并算出 X 场比赛主队和其客队的进球能力、进攻能力和防守能力, 从而确定主队和其客队的进球期望值,然后运用泊松分布的方法计算出 X 球队胜 平负的概率,确定如何下注。 第二问中,预测 X 场总进球数的概率分布,确定如何下注,根据第一问结论 并利用数学软件 MATLAB 预测出所有可能的 X 场总进球数的概率分布,选择概率 最大的,结合实际历史数据和主客观影响因素确定如何下注。 对于第三问,要求预测四场比赛的进球情况,并确定在这四场中如何下注获 利最大,首先球队在积分榜上的排名可以较为客观的代表这支球队的实力强弱, 其中进球数直接影响球队积分,因此本问通过球队积分排行榜和进球率的相关性 预测四场比赛进球情况,利用 Excel 画出球队进球率与排名散点图和相关性分析 确定下注比例。 最后一问,要求通过分析赔率对于博彩公司收益的影响并针对问题三,设计 合理赔率方案。 本文论证严密,运用大量可靠数据对模型进行验证,并对模型优缺点进行了 分析。

1. 问题的重述 博彩业发展繁荣,创造了不少富翁,其中福利彩票的中奖号码可以认为是纯

粹的随机数,难以预测。而体彩中一些结果可以人为预测,并根据预测结果下注。 结果预测准确与否,关系到金钱的盈亏。足球赔率是博彩公司在其十几年乃至数 十年所积累的丰富的、海量的与足球比赛相关数据的基础上,利用科学的数学理 论模型,计算得出的对于一场足球比赛所产生某种结果的概率,并使这组数据加 以转换得到的一组常人可以看得懂的数据。

赔率与足球比赛的结果间存在着必然的联系。博彩公司就是靠预测结果,调 整赔率,吸引大家下注来赚取收益的。如果我们比博彩公司预测得更加准确,或 者押中冷门,就有可能在其中赚取巨大收益。现在我们所关心的问题就是:

1) 根据所给的数据,如何确定各球队胜负平的概率,并确定如何下注。 2) 根据比赛的总进球数的概率分布,如何确定下注的分配比率。 3) 根据球队历史排名与进球率,如何预测球队未来进球情况,并在下 注时获利最大。 4) 通过分析赔率对博彩公司收益的影响,如何给出合理的赔率设计方 案,在吸引尽可能多的客户的同时,获得最大利润。

2. 问题的分析 对于一场球赛,结果有胜、平、负三种结果。而比赛结果往往由球队实力高

低,主客场,裁判判决公正与否甚至是天气好坏等一些要素相关,导致胜负平的 概率不会是1/3;这就要求模型能综合比赛各项因素得出合理的赛果预测。本问 题即是一个在历史数据的基础上,通过对数据的整合,如何制定预测模型,确定 下注比例并获得最大利润。

1. 假设在一个赛季内, 一名球员的单位进球、进攻、防守能力变化不大。 2. 比赛主要影响因素是实力和主客场,其结果不受天气等环境影响。 3. 球队实力由球队近期战绩决定。 4. 比赛结果符合泊松分布。

5. 裁判判决公正无黑哨。 6. 确定现实中已有伤病球员不上场,所选球员无伤病情绪稳定、发挥正常。

1. α:代表球员单场进球能力。 2. β:代表球员单场进攻能力。 3. γ:代表球员单场防守能力。 4. d1:代表球员单场助攻数。 5. d2:代表球员单场射门数。 6. d3:代表球员单场射正数。 7. d4:代表球员单场扑救数。 8. T:代表球员出场时间。 9. λ:代表球队进球期望值。 10. P:代表球队单场获胜概率。 11. Wt:代表某支球队的进球率. 12. Yi:代表这支球队在第i场比赛的进球数

:问题一及其求解 根据题意,要预测 X 场比赛中主队的胜平负的概率(即猜胜负平),而球队

的胜负平取决于球员的进球以及进攻防守能力,所以应根据附表 1 计算出主队和 客队的综合进球、进攻和防守能力,从而分别得出主队和客队的进球期望值,经 过比较确定主队的胜负平的概率,并确定如何下注。

(一)、主队进球能力、进攻能力和防守能力的计算 根据附表 1,用 Excel 数据处理器对其数据进行整合及计算,分别得出主队 和客队的进球能力、进攻能力和防守能力,以球员阿格利亚尔迪为例:将他的单场

助攻数 d1、单场射门数 d2 和单场射正数 d3 相加再除以出场时间 T,即可得到单位进攻 能力β1。再将单场扑救数 d4 除以出场时间 T,就得到单位防守能力γ1。经过计 算得到本场所有球员的单场进球能力α,所有球员的单场进攻能力β以及所有球 员的单场防守能力γ,然后将α,β,γ三个数进行算术平均,从而得出单场球 队进球期望值λ。具体计算如下:利用公式

问题 2 为预测 X 场比赛总进球数的概率分布并确定如何下注,首先由附表 1

的数据和问题 1 的结论出发,经分析可以清楚地知道这两题思路相同,即在第 1

题 matlab 程序代码基础上增加一条输出语句后,我们能够直接清晰地得到 X 场

预测 X、Y、Z、W 四场比赛的进球情况,确定在“4 场进球”中如何下注能

其中,Wt 表示某支球队的进球率,Yi 表示这支球队在第 i 场比赛的进球

态好的时候,胜率就高;竞技状态差的时候,胜率就低。所以从整体来看,进球率确 实反映了球队的实力,但是却不能反映球队当前所处的竞技状态对比赛的影响, 因此我们有必要对进球率的计算公式进行一些合理的调整,将球队近期的状态考 虑进去,也就是将球队近期比赛的进球数与原有的进球率结合起来。将球队最近 4 场比赛的进球数纳入调整后的进球率,得到如下计算[1]公式:

其中,Wt 表示调整后的某支球队进球率,表示这支球队在第 i 场比赛中的进

因此,由预测的 X、Y、Z、W 四场比赛进球情况,可以确定确定在“4 场进 球”中应选择单式投注,方能获利最大。 4.4:问题 4 的解决

博彩公司事前所设定的赔付率不会随意变动,而变动的是赔率和胜负平概 率,跟随其变动的则是凯利指数。由于凯利指数是“变量中的变量”总是随市场

赔率和平均概率(平均概率又是随着各家概率高低变动的)不断变动的,就是说凯 利指数是能够反映博彩公司的数据的真实趋势和投注资金流量运动。凯利指数首 要的作用就是反应将一场球赛做为经济市场各家公司赢利和赔付风险差异的做 用,一般来说,认同程度越高的选项,打出可能越大,博彩公司存在的赔付风险 越大。而差异越大的选项,则打出可能越小,为博彩公司盈利安全点。

有问题 3 可知,通过分析对阵双方的各种资讯,诸如出场阵容,以往交手战绩, 主队主场战绩,客队客场战绩,在联赛中的成绩排位,球队最近的状态斗志,俱乐 部的运作情况等等方面因素之后,估算出这场赛事胜,平,负三种结果的概率。根 据所得概率确定对应赔率,一般概率高的情况赔率相对较低,而概率低的情况赔 率相对较高。

其中:A:代表博彩公司根据各个球队以往十年历史赔率数据的算术平均数;D:代表根据计

在第一问中,我们运用了 Excel 数据处理器选取部分历史数据作为基础,进 行整合,完成对问题一的解答,但数据具有一定的偏向性,同时数据的基础量不 够充足。

性的把数学软件 MATLAB 引入,并且利用泊松分布对足球比赛结果进行分析预测。

优点: 1. 本模型利用历史数据、Excel 数据处理器、相关性比较及 MATLAB 软 件对如何预测足球比赛的胜平负和怎样确定下注进行了模拟和验证,结 果误差小,数据准确合理。 2. 本模型综合应用了多种方法对问题进行求解,如第一问确定 X 场比 赛主对胜平负概率时,应用了两种处理办法,加强了模型的精确性,更 令人信服。 3. 本模型通过大量的历史数据对问题进行阐述,给人一目了然的感觉。 4. 本模型有很好的推广价值。

缺点: 1. 由于统计资料不够全面,仅有一个赛季的数据,以及对足球赛事了 解不深,我们设计预测模型时,各个因素的确定有一定的偏差。 2. 第三问的约束条件中,对部分数值的处理是由经验假设而来,具有 一定的主观性。

本模型针对足球比赛结果预测和如何下注利润最大化的问题,运用了历史数 据、Excel 数据处理器、相关性比较及 MATLAB 软件对如何预测足球比赛胜平负 概率和怎样下注进行了求解并通过大量的数据给出结论,非常直观。在博彩业的 运营和购买彩票过程中有很强的实用性,此模型同样适用于篮球比赛等运动类赛 事结果的预测。

[1] 阎峰.《利用关联规则对足球赔率进行数据挖掘的研究》. 2015 年 5 月 24

[2] 黄晓雯.《足球博彩市场建模及市场有效性假说检验》.专题研究.2015 年 5 月 24 日. [3] 冯宗松.《竞彩足球投资策略分析》. 2015 年 5 月 24 日. [4]黄丹宁.《英超球员能力的定量评估和预测》. 2015 年 5 月 24 日. [5] 不详.《基于泊松分布预测足球赛果的统计模型》. 2015 年 5 月 24 日.

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注