Publications

3 results for Meng Wang

When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers
- - Hongkang Li
  - Yihua Zhang
  - et al.
- 2025
- ICLR 2025
Training Nonlinear Transformers for Chain-of-Thought Inference: A Theoretical Generalization Analysis
- - Hongkang Li
  - Songtao Lu
  - et al.
- 2025
- ICLR 2025
A Provably Effective Method for Pruning Experts in Fine-tuned Sparse Mixture-of-Experts
- - Mohammed Nowaz Rabbani Chowdhury
  - Meng Wang
  - et al.
- 2024
- ICML 2024