Spaces:

PranavSharma
/

Forecast-Sandbox-Lite

Sleeping

App Files Files Community

Forecast-Sandbox-Lite / models /analysis_regime_conditioned_forecasting.py

PranavSharma

Updated files

a52ec73 verified 6 days ago

raw

history blame contribute delete

5.33 kB

	"""
	Regime-Conditioned Forecasting Analysis
	======================================

	Reproduces all decision-grade evidence used in the consulting slides:

	1. Demand structure segmentation
	2. Model performance by structure
	3. Portfolio-level mean loss
	4. Tail-risk (P90) analysis
	5. SKU win-rate vs portfolio loss disconnect
	6. Chronos2 positioning (descriptive, not causal)

	Inputs (from sandbox):
	- combined_metrics.csv
	- best_by_sku.csv

	No assumptions beyond the data.
	"""

	import pandas as pd
	import numpy as np

	# ---------------------------------------------------------------------
	# CONFIG
	# ---------------------------------------------------------------------

	DATA_DIR = "metrics" # adjust if needed

	COMBINED_PATH = f"{DATA_DIR}/combined_metrics.csv"
	BEST_BY_SKU_PATH = f"{DATA_DIR}/best_by_sku.csv"

	SCORE_COL = "score"
	BIAS_COL = "bias"
	MODEL_COL = "model"
	BEST_MODEL_COL = "best_model"
	SKU_COL = "id"

	# optional if present
	STRUCTURE_COLS = ["cv_bin", "adi_bin", "regime"]

	# ---------------------------------------------------------------------
	# LOAD DATA
	# ---------------------------------------------------------------------

	combined = pd.read_csv(COMBINED_PATH)
	best_by_sku = pd.read_csv(BEST_BY_SKU_PATH)

	# sanity
	assert SCORE_COL in combined.columns
	assert MODEL_COL in combined.columns

	print("\nLoaded data:")
	print(f" combined_metrics rows: {len(combined):,}")
	print(f" best_by_sku rows: {len(best_by_sku):,}")
	print(best_by_sku.head())
	print(best_by_sku.columns)
	# ---------------------------------------------------------------------
	# 1. PORTFOLIO-LEVEL PERFORMANCE
	# ---------------------------------------------------------------------

	portfolio_summary = (
	combined
	.groupby(MODEL_COL)
	.agg(
	mean_score=(SCORE_COL, "mean"),
	p90_score=(SCORE_COL, lambda x: np.percentile(x, 90)),
	mean_abs_bias=(BIAS_COL, lambda x: np.mean(np.abs(x))),
	std_score=(SCORE_COL, "std")
	)
	.sort_values("mean_score")
	)

	print("\n=== Portfolio-Level Performance ===")
	print(portfolio_summary.round(2))

	# ---------------------------------------------------------------------
	# 2. WIN-RATE (BEST-MODEL SHARE)
	# ---------------------------------------------------------------------

	win_rate = (
	best_by_sku
	.groupby(BEST_MODEL_COL)
	.size()
	.rename("sku_wins")
	.to_frame()
	)

	win_rate["win_share"] = win_rate["sku_wins"] / win_rate["sku_wins"].sum()

	print("\n=== SKU Win Share ===")
	print(win_rate.sort_values("win_share", ascending=False).round(3))

	# ---------------------------------------------------------------------
	# 3. WIN-RATE vs PORTFOLIO LOSS RELATIONSHIP
	# ---------------------------------------------------------------------

	win_vs_loss = (
	portfolio_summary
	.merge(win_rate, left_index=True, right_index=True, how="left")
	.fillna(0)
	)

	correlation = win_vs_loss["win_share"].corr(win_vs_loss["mean_score"])

	print("\n=== Win-Rate vs Mean Score ===")
	print(win_vs_loss[["mean_score", "win_share"]].round(3))
	print(f"\nCorrelation (win_share vs mean_score): {correlation:.3f}")

	# ---------------------------------------------------------------------
	# 4. STRUCTURE-CONDITIONAL PERFORMANCE
	# ---------------------------------------------------------------------

	structure_cols = [c for c in STRUCTURE_COLS if c in combined.columns]

	if structure_cols:
	print("\n=== Structure-Conditional Analysis ===")
	for col in structure_cols:
	print(f"\n-- Performance by {col} --")
	table = (
	combined
	.groupby([col, MODEL_COL])[SCORE_COL]
	.mean()
	.unstack()
	)
	print(table.round(2))
	else:
	print("\nNo explicit structure columns found (cv_bin / regime).")

	# ---------------------------------------------------------------------
	# 5. TAIL-RISK DOMINANCE
	# ---------------------------------------------------------------------

	tail_ratio = (
	portfolio_summary["p90_score"] /
	portfolio_summary["mean_score"]
	).rename("p90_to_mean_ratio")

	print("\n=== Tail-Risk Ratio (P90 / Mean) ===")
	print(tail_ratio.sort_values())

	# ---------------------------------------------------------------------
	# 6. CHRONOS2 DESCRIPTIVE POSITIONING
	# ---------------------------------------------------------------------

	if "chronos2" in portfolio_summary.index:
	chronos_row = portfolio_summary.loc["chronos2"]
	chronos_win = win_rate.loc["chronos2"] if "chronos2" in win_rate.index else None

	print("\n=== Chronos2 Positioning ===")
	print(chronos_row.round(2))
	if chronos_win is not None:
	print("\nChronos2 win share:")
	print(chronos_win.round(3))
	else:
	print("\nChronos2 not found in model list.")

	# ---------------------------------------------------------------------
	# 7. OPTIONAL: EXPORT TABLES FOR SLIDES
	# ---------------------------------------------------------------------

	portfolio_summary.round(3).to_csv(f"{DATA_DIR}/analysis_portfolio_summary.csv")
	win_vs_loss.round(3).to_csv(f"{DATA_DIR}/analysis_win_vs_loss.csv")

	print("\nAnalysis tables exported:")
	print(" analysis_portfolio_summary.csv")
	print(" analysis_win_vs_loss.csv")