Direct Experience	MDP			e,T-optimal	O(\|S\|²\|A\|T³/e³)	E³ or R_max (improved)
		e-Approx. Planning	Factoring		Poly(\|Factoring\|, 1/e,T)	Factored-E³
		e-Approx. Planning	local model		O(T \|Cover\| / e)	Metric-E³
				e-optimal	O(\|A\|^\|S\|T²/e²)	Q-learning
Reset Model	e_infinity-regression		e_infinity -unmonotone	e_infinity / T²,T -optimal	Very Large	Appr. Policy Iter.
Reset Model			monotone	local optimal	Very Large	Policy Gradient
&mu Reset Model	e/T²-regression	&mu = opt. dist	e²-monotone	e,T-optimal	O(T/e²)	Cons. Policy Iter.
Generative Model					(\|A\|T/e)^O(T)	Sparse Sampling
	e/T-classification				O(\|A\|^T)	RLGen
				e-local-optimal	O(T²)	various
		&mu = opt. dist		Te,T-optimal	O(T²)	PSDP
Deterministic Gen. Model				e local optimal	O(T³ /e²)	Pegasus
Precise Description	MDP			optimal	O(T\|S\|\|A\|)	Value Iter.
Precise Description	MDP			optimal	O(\|A\|^\|S\|)	Policy Iter.

basic setting direct experience reset model generative model precise description