Publications

2 results for Asad Ul Haq

Accelerating LLM Inference via Dynamic KV Cache Placement in Heterogeneous Memory System
- - Yunhua Fang
  - Rui Xie
  - et al.
- 2025
- IEEE Computer Architecture Letters
Breaking the HBM Bit Cost Barrier: Domain-Specific ECC for AI Inference Infrastructure
- - Rui Xie
  - Asad Ul Haq
  - et al.
- 2025
- IEEE Computer Architecture Letters