The big table

Direct Experience	MDP			e,T-optimal	O(\|S\|²\|A\|T³/e³)	E³
		e-Approx. Planning	Factoring		Poly(\|Factoring\|, 1/e,T)	Factored-E³
		e-Approx. Planning	local model		O(T \|Cover\| / e)	Metric-E³
				e -optimal	O(\|A\|^\|S\|T²/e²)	Q-learning
Trace Model	e_infinity regression		e -unmonotone	e_infinity / T²,T optimal	???	Appr. Policy Iter.
Trace Model			monotone	local optimal	Very Large	Policy Gradient
&mu Trace Model	e/T² regression	&mu = opt. dist	e²-monotone	e,T -optimal	O(T/e²)	Cons. Policy Iter.
Generative Model					(\|A\|T/e)^O(T)	Sparse Sampling
	e/T classification				\|A\|^T	RLGen
				e local-optimal	O(T²)	various
		&mu = opt. dist		Te,T -optimal	O(T²)	PSDP
Deterministic Gen. Model				e local optima	T³ log (1/e) /e²	Pegasus
Precise Description	MDP			optimal	T\|S\|\|A\|	Value Iter.