Logo

Goal Signal

Análisis de Partidos Impulsado por AI

© 2025 Goal Signal

← Volver al Parlay Diario
TECHNICAL DOCUMENTATIONv2.1.0

Metodología IA

Enfoque de Aprendizaje Automático para Predicción Probabilística de Fútbol

Tarsier Vision LTD Research Division • 2026

Resumen

Esta documentación detalla la infraestructura matemática, el pipeline de procesamiento de datos y las métricas de rendimiento del modelo del sistema de predicción Golsinyali AI. El sistema genera predicciones optimizadas a partir de datos del mercado de apuestas utilizando teoría de probabilidad bayesiana y métodos de aprendizaje ensemble.

1. Arquitectura del Modelo

El sistema emplea un pipeline de procesamiento de datos multicapa:

Entrada
Raw Data
Odds, Stats, H2H
Proceso
Feature Eng.
ΔO, EMA, MCI
Proceso
ML Model
Ensemble
Proceso
Threshold
C ≥ θ
Salida
Prediction
MS, O2.5, BTTS
Pipeline: D → F(D) → M(F) → T(M) → P

2. Especificaciones del Modelo

Identificador del ModeloGolsinyali AI
Versiónv2.1
Ventana de Datos de Entrenamiento24 months
Conjunto de Datos de Entrenamiento~120,000 partidos
Conteo Acumulativo de Análisis50,000+
Frecuencia de ActualizaciónSemanal

3. Fuentes de Datos e Ingeniería de Características

ACaracterísticas Basadas en Mercado

  • Diferencial de cuotas apertura/cierre (ΔO)
  • Velocidad de movimiento de línea (dL/dt)
  • Índice de Consenso de Mercado (MCI)
  • Indicador de dinero inteligente

BCaracterísticas de Rendimiento

  • Media Móvil Exponencial (EMA-5, EMA-10)
  • Diferencial de Expected Goals (xG)
  • Coeficiente de rendimiento local/visitante
  • Momentum de Diferencia de Goles (GDM)

CCaracterísticas Históricas

  • Probabilidad de victoria cara a cara (H2H-WP)
  • Delta de posición en liga (ΔPos)
  • Vector de tendencia estacional
  • Peso de Importancia del Partido (MIW)

4. Marco Matemático

El cálculo de puntuación de confianza utiliza una función de distancia normalizada:

Fórmula de Puntuación de Confianza
C(O) = 100 × (1 - |O - μ| / σ)
where: O = observed odds, μ = optimal mean, σ = range std

Donde O representa el valor de cuota observado, μ es la media del rango óptimo y σ es la desviación estándar del rango.

Criterio de Selección de Predicción
Pactive = (C(O) ≥ θ) ∧ (Omin ≤ O ≤ Omax)
where: θ = 70 (threshold), Omin/Omax = acceptance range

La predicción se activa cuando la puntuación de confianza supera el umbral y el valor de cuota está dentro del rango aceptable.

5. Tipos de Predicción y Criterios de Aceptación

Resultado del Partido (RES)

P(MS) = f(O_home, O_away) where O ∈ [1.40, 2.00]

Identificación de favorito basada en sistema de cuotas europeo

Aceptación: 1.40 ≤ O_fav ≤ 2.00
Precision
0.84
Recall
0.79
F1-Score
0.81

Más de 2.5 Goles

P(O2.5) = g(L_ou) where L ∈ [2.5, 3.5]

Expectativa de goles depende de la línea Over/Under

Aceptación: 2.5 ≤ Línea ≤ 3.5
Precision
0.87
Recall
0.82
F1-Score
0.84

Ambos Marcan (BTTS)

P(BTTS) = h(O_draw, L_ou) where O_x ≤ 4.0 ∧ L ∈ [2.5, 3.75]

Criterio de aceptación de doble condición

Aceptación: O_draw ≤ 4.00 ∧ 2.50 ≤ L ≤ 3.75
Precision
0.78
Recall
0.71
F1-Score
0.74

6. Resultados de Backtesting

El rendimiento del modelo se evaluó en un conjunto de prueba out-of-sample de 24 meses:

Rendimiento General

Accuracy0.81
Precision (Macro)0.83
Recall (Macro)0.77
F1-Score (Macro)0.80
ROC-AUC0.87
Log Loss0.42
Brier Score0.18

Matriz de Confusión (Normalizada)

Calculado de las últimas 10,000 predicciones

Predicho +
Predicho -
Real +
0.81
TP
0.19
FN
Real -
0.17
FP
0.83
TN

7. Calibración de Puntuación de Confianza

El modelo produce probabilidades bien calibradas. La tabla compara rangos de confianza predichos con tasas de éxito observadas:

PredichoObservadoConteo de MuestrasΔ
70-75%72.3%2,847+2.3%
75-80%77.8%3,521+2.8%
80-85%82.1%2,198+2.1%
85-90%86.4%1,102+1.4%
90-95%91.2%332+1.2%

8. Análisis de Importancia de Características

Puntuaciones de importancia de características calculadas usando el método de importancia por permutación:

Odds Differential (ΔO)
28%
Line Movement (dL/dt)
22%
EMA-10 Form
18%
H2H Win Probability
14%
Market Consensus (MCI)
10%
League Position Delta
8%
* Permutation Importance (n=1000 iterations)

9. Limitaciones Metodológicas

  • [1]El modelo no incorpora eventos en tiempo real (lesiones, tarjetas rojas, condiciones climáticas)
  • [2]Las predicciones son probabilidades estadísticas; sin garantía de resultado determinista
  • [3]Manipulación del mercado y trading con información privilegiada están fuera del alcance
  • [4]El rendimiento puede disminuir en ligas pequeñas debido a insuficiencia de datos
  • [5]El modelo detecta correlaciones; no hace inferencias causales

10. Referencias y Metodología

  • [1]Kelly, J. L. (1956). A New Interpretation of Information Rate. Bell System Technical Journal.
  • [2]Štrumbelj, E., & Vračar, P. (2012). Simulating a basketball match with a homogeneous Markov model.
  • [3]Dixon, M. J., & Coles, S. G. (1997). Modelling Association Football Scores. Applied Statistics.
  • [4]Constantinou, A. C., et al. (2012). Profiting from an inefficient association football gambling market.

11. Información Corporativa

Tarsier Vision LTD

UK Company #14646033

Este sistema es desarrollado y operado por Tarsier Vision LTD (UK Company #14646033).

Fecha de Revisión del Documento: 15 de enero de 2026
Document Version: v2.1.0 | Generated by Golsinyali Documentation System