2026 | Yunxiang Peng

May 02, 2026	Counterfactual Reasoning of Agents
May 02, 2026	Hierarchical Reward for Long-Horizon Planning and Agent RL
May 01, 2026	Mechanistic Understanding of Hallucination in Multimodal Models
Jan 12, 2026	Compositional Generalization in Diffusion Models