Quant research / Published report
ARIMA-EGARCH + LightGBM — volatilité S&P 500
Étude économétrie + ML testant l’apport d’un log-sigma conditionnel dans un modèle LightGBM multi-actifs.
Problème
Les modèles ML tabulaires capturent beaucoup de signaux techniques, mais peuvent manquer une structure de risque conditionnel issue de la volatilité.
Approche
Pipeline reproductible 2013-2024 : ARIMA-EGARCH, génération causale de features, LightGBM, ablations, walk-forward, Diebold-Mariano, SHAP et permutation importance.
Preuves
Dataset complet : RMSE 0.0109, R² 0.765 contre 0.0113 et 0.749 sans insight.
AR + insights : R² 0.538 contre 0.497 sans insight.
Tests Diebold-Mariano significatifs pour les comparaisons clés, p < 0.01.

Rapport complet
Forecasting S&P 500 volatility with an ARIMA-EGARCH and LightGBM pipeline.
Version française originale et version anglaise complète préparée pour une lecture internationale / YC.
Méthode
Pipeline 2013-2024 avec split temporel et walk-forward.
Signal log_sigma_garch généré causalement à partir d’un ARIMA-EGARCH.
Ablations LightGBM avec et sans insight, tests Diebold-Mariano, R² bootstrap, SHAP et permutation importance.
Résultats clés
Complete dataset: RMSE 0.0109, R² 0.765.
No-insight dataset: RMSE 0.0113, R² 0.749.
AR + insights: R² 0.538 vs 0.497 without insight.
Cette étude porte sur la prévision de volatilité. Elle ne constitue pas une stratégie d’investissement ni une recommandation financière.
Limites
Le projet est une étude de prévision de volatilité, pas une stratégie d’investissement. H2 est rejetée et l’horizon reste J+1.