Publications

33 results at ACL 2025

R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory
- - Tenghao Huang
  - Kinjal Basu
  - et al.
- 2025
- ACL 2025
Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual Evaluation
- - Shivalika Singh
  - Angelika Romanou
  - et al.
- 2025
- ACL 2025
A Perspective on LLM Data Generation with Few-shot Examples: from Intent to Kubernetes Manifest
- - Antonino Angi
  - Liubov Nedoshivina
  - et al.
- 2025
- ACL 2025
Multi-Sense Embeddings for Language Models and Knowledge Distillation
- - Qitong Wang
  - Mohammed Zaki
  - et al.
- 2025
- ACL 2025
Multi-Level Explanations for Generative Language Models
- - Lucas Monteiro Paes
  - Dennis Wei
  - et al.
- 2025
- ACL 2025
BI-Bench : A Comprehensive Benchmark Dataset and Unsupervised Evaluation for BI Systems
- - Ankush Gupta
  - Aniya Aggarwal
  - et al.
- 2025
- ACL 2025
REAL-MM-RAG: A Real-World Multi-Modal Retrieval Benchmark
- - Navve Wasserman
  - Roi Pony
  - et al.
- 2025
- ACL 2025
Conceptual Diagnostics for Knowledge Graphs and Large Language Models
- - Rosario Uceda-Sosa
  - Maria Chang
  - et al.
- 2025
- ACL 2025
Multi-Sense Embeddings for Language Models and Knowledge Distillation
- - Qitong Wang
  - Mohammed Zaki
  - et al.
- 2025
- ACL 2025
DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation
- - Eliya Habba
  - Ofir Arviv
  - et al.
- 2025
- ACL 2025