Publications

88 results for Prasanna Sattigeri

When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails
- - Manish Nagireddy
  - Inkit Padhi
  - et al.
- 2025
- AIES 2025
Multi-Level Explanations for Generative Language Models
- - Lucas Monteiro Paes
  - Dennis Wei
  - et al.
- 2025
- ACL 2025
Granite Guardian: Comprehensive LLM Safeguarding
- - Inkit Padhi
  - Manish Nagireddy
  - et al.
- 2025
- NAACL 2025
Contextual Value Alignment
- - Kush Varshney
  - Miao Liu
  - et al.
- 2025
- ICASSP 2025
The RealHumanEval: Evaluating Large Language Models’ Abilities to Support Programmers
- - Hussein Mozannar
  - Valerie Chen
  - et al.
- 2025
- TMLR
Large Language Model Confidence Estimation via Black-Box Access
- - Tejaswini Pedapati
  - Amit Dhurandhar
  - et al.
- 2025
- TMLR
Graph-based Uncertainty Metrics for Long-form Language Model Generations
- - Mingjian Jiang
  - Yangjun Yangjun
  - et al.
- 2024
- NeurIPS 2024
WikiContradict: A Benchmark for Evaluating LLMs on Real-World Knowledge Conflicts from Wikipedia
- - Yufang Hou
  - Alessandra Pascale
  - et al.
- 2024
- NeurIPS 2024
Interventional Causal Discovery in a Mixture of DAGs
- - Burak Varici
  - Dmitriy Katz-Rogozhnikov
  - et al.
- 2024
- NeurIPS 2024
Value Alignment from Unstructured Text
- - Inkit Padhi
  - Karthikeyan Natesan Ramamurthy
  - et al.
- 2024
- NeurIPS 2024