Skip to content

wstczlt/XSpider

Repository files navigation

项目的核心理念:

  1. 针对滚球盘设计,当然初盘可以归纳到0分钟的情况,所以也适用于初盘分析;
  2. 采集场上任意时刻(比如半场45分钟, 或者下半场60分钟等)的关键信息(具体关键数据参看下面数据设计),然后将该时刻数据面+两队基本面数据传入推测引擎进行估算预测;
  3. 目前实现了预测大小球、让分等,按照思路实现角球、胜平负都是可以的;
  4. 数据采集的比较多,不过并不是数据维度越多预测越准确,很多无用信息反而会干扰预测引擎,所以这里面需要针对不同的预测做很多的实验来调整输入维度;
  5. 我做实验的方案是用历史五年内的数据全部跑一次学习,然后复盘近一年的比赛做预测,如果近一年里有9个月都持续盈利(稳定性好),且整年总体盈利就可以使用该参数,调整好引擎之后,为预测的高概率的判断结果做输出,比如判断70%出大球,则显示出来,这里面阈值设置的越高过滤的比赛越多,好在周末每天有上千场比赛,大约能够选出来几十场有价值的滚球盘口;
  6. 引擎的设计是基于历史五年的比赛来学习的,注意我这边是按一场比赛的某个时间片来存储的数据,所以数据量比按比赛为单位多出90倍(90分钟);
  7. 理论上时间越往后预测越准确,但那时候可得到的赔率越低,所以引擎里面会权衡,目前主要做的是30分钟、45分钟、60分钟的大小球和让球胜平负;
  8. 自动预报方案是电脑持续实时抓取滚球网站的数据,分析进行中的比赛,并传入引擎预测,如果遇到高价值盘口则写入日志,本地电脑通过监控日志,将新产生的记录自动转发到微信群,实现通知;
  9. 该项目比较类似股票量化投资思路,主要是使用历史关键信息对当前比赛做判断;
  10. 数据源目前做了DS足球、球探数据等实时滚球网站;
  11. 有价值的滚球比赛盘口不多,平时大约每天一个,周末大约能有10个左右,都是自动分析的,且滚球盘口转瞬即逝,赔率变化很快,未来希望做自动下注,手动下注大约存在1~5分钟延迟;
  12. 该项目是我19年夏天做的,后来家里除了情况就没在继续了,当时运行的时候整体的感觉是基本能做到正,但是长期看盈利率并不高并且要手动下单,很多比赛都是半夜,比较累;
  13. 赔率各个网站不同,抽水多的网站可能做不到正;
  14. 大家可以多去看平博的官网论坛,有很多讲庄狗使用AI优化盘口的思路的,所以实际这个也是攻防的过程,并没有那么容易持续盈利,而且庄家总在优化,历史的数据并不完全能指导当前比赛,我之前试过拿18年的比赛去预测近3个月是盈利的,但是换另外3个月就不一定盈利了,不确定性是有的,人工下注很考验人的心态;
  15. 人工下注存在的延时,比如3分钟,这段时间内场面变化概率,有可能大过你的盈利率,也就是虽然机器预测了本场大球,但是等你下注的时候比分已经变了,假设这个概率是5%,而假如模型的盈利率本来就只有3%,那你是不能盈利的,所以未来做自动下注也很重要;
  16. 初盘就是0分钟或者-1分钟,由于输入的信息偏少,我做的研究不多,反而建议看看15分钟,那时候场面刚刚打开,还是有利可图的;
  17. com.test.learning - 学习引擎
  18. com.test.pipeline - 数据流处理
  19. com.test.manual - 预测和播报筛选规则
  20. com.test.radar - 扫描实时盘口的雷达
  21. 接下来我会把项目重新运行起来,推送转发到微信群里,但是最近疫情比赛很少,预计基本没有什么价值比赛,看不懂的代码可以找我;

数据设计

  1. 比赛信息表(抓取近5年数据) 主要数据来源: 基本指数:http://score.nowscore.com/analysis/1709701cn.html 基本比赛信息:http://score.nowscore.com/detail/1709701cn.html
  • 比赛ID,自增即可;
  • 主队名称
  • 客队名称
  • 联赛名称
  • 联赛ID(看网页有没有)
  • 比赛日期(用long类型存储)
  • 是否杯赛(比赛名称包含'杯')
  • 是否是一级比赛(白名单内)
  • 所属国家(用映射表,或者看网页是否有返回)
  • 欧赔威廉希尔初盘/临场盘胜平负赔率
  • 亚赔bet365初盘/临场盘让球盘口、让球赔率
  • 亚赔bet365初盘/临场盘大小球盘口、让球赔率
  • 初盘角球大小盘口、赔率
  • 主队联赛排名
  • 客队联赛排名
  • 主队联赛主场排名
  • 客队联赛客场排名
  • 必发指数胜平负
  • 一年内主客队交战历史主队胜率,平率,负率
  • 主客队近3场/10场平均进球数
  • 主客队近3场/10场平均丢球数
  • 主客队近3场/10场平均角球数
  • 主客队近3场/10场平均黄卡数
  • 主客队近3场/10场平均射门/被射门次数
  • 主客队近10场胜率、让胜率、大球率
  • 同赛事主客队近10场胜率、让胜率、大球率 (裁判数据源:http://score.nowscore.com/info/referee.aspx?id=1656691)
  • 裁判场均黄卡数
  • 裁判场均红卡数
  • 裁判执法主胜率
  • 裁判执法客胜率
  • 比赛最终进球比分
  • 比赛半场进球比分
  • 比赛最终进球数
  • 主队最终主队进球数
  • 客队最终客队进球数
  • 比赛最终角球数
  • 比赛最终主队角球数
  • 比赛最终客队角球数
  • 比赛最终黄卡数
  • 比赛最终主队黄卡数
  • 比赛最终客队黄卡数
  1. 实时指数表(按分钟取) 主要数据源: 实时指数:http://score.nowscore.com/odds/3in1Odds.aspx?companyid=3&id=1738311 实时角球指数:http://score.nowscore.com/odds/cornerDetail.aspx?id=1738311
  • 比赛ID,关联比赛信息表
  • 当前时刻(分钟)
  • 总进球数
  • 主队进球数
  • 客队进球数
  • 让球盘口
  • 让球主赔率
  • 让球客赔率
  • 欧指主胜赔率
  • 欧指平局赔率
  • 欧指主负赔率
  • 角球总数
  • 主队角球数
  • 客队角球数
  • 角球大小盘口
  • 角球大赔率
  • 角球小赔率
  • 射门总数
  • 主队射门次数
  • 客队射门次数
  • 射正总数
  • 主队射正次数
  • 客队射正次数
  • 危险进攻总数
  • 主队危险进攻数
  • 客队危险进攻数
  • 主队控球率
  • 客队控球率
  • 黄卡总数
  • 主队黄卡数
  • 客队黄卡数
  • 红卡总数
  • 主队红卡数

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published