Robbie's real problem

Direct Experience	MDP			e,T-optimal	O(\|S\|²\|A\|T³/e³)	E³ or R_max (improved)
		e-Approx. Planning	Factoring		Poly(\|Factoring\|, 1/e,T)	Factored-E³
		e-Approx. Planning	local model		O(T \|Cover\| / e)	Metric-E³
				e-optimal	O(\|A\|^\|S\|T²/e²)	Q-learning

basic setting reset model generative model precise description full table