Direct Experience	MDP			e,T-optimal	O(\|S\|²\|A\|T³/e³)	E³
		e-Approx. Planning	Factoring		Poly(\|Factoring\|, 1/e,T)	Factored-E³
		e-Approx. Planning	local model		O(T \|Cover\| / e)	Metric-E³
				e-optimal	O(\|A\|^\|S\|T²/e²)	Q-learning
Trace Model	e_infinity-regression		e_infinity -unmonotone	e_infinity / T²,T -optimal	???	Appr. Policy Iter.
Trace Model			monotone	local optimal	Very Large	Policy Gradient
&mu Trace Model	e/T²-regression	&mu = opt. dist	e²-monotone	e,T-optimal	O(T/e²)	Cons. Policy Iter.
Generative Model					(\|A\|T/e)^O(T)	Sparse Sampling
	e/T-classification				\|A\|^T	RLGen
				e-local-optimal	O(T²)	various
		&mu = opt. dist		Te,T-optimal	O(T²)	PSDP
Deterministic Gen. Model				e local optimal	T³ log (1/e) /e²	Pegasus
Precise Description	MDP			optimal	T\|S\|\|A\|	Value Iter.