Trace Model	e_infinity-regression		e_infinity -unmonotone	e_infinity / T²,T -optimal	???	Appr. Policy Iter.
Trace Model			monotone	local optimal	Very Large	Policy Gradient
&mu Trace Model	e/T²-regression	&mu = opt. dist	e²-monotone	e,T-optimal	O(T/e²)	Cons. Policy Iter.

generative model results