Publications

893 results for Trustworthy AI

FairSISA: Ensemble Post-Processing to Improve Fairness of Unlearning in LLMs
- - Swanand Ravindra Kadhe
  - Anisa Halimi
  - et al.
- 2023
- NeurIPS 2023
Subtle Misogyny Detection and Mitigation: An Expert-Annotated Dataset
- - Anna Richter
  - Brooklyn Sheppard
  - et al.
- 2023
- NeurIPS 2023
Probabilistic Abduction for Visual Abstract Reasoning via Learning Rules in Vector-symbolic Architectures
- - Michael Hersche
  - Francesco Di Stefano
  - et al.
- 2023
- NeurIPS 2023
Symbolic Learning for Material Discovery
- - Daniel Cunnington
  - Flaviu Cipcigan
  - et al.
- 2023
- NeurIPS 2023
Sequential data-consistent model inversion
- - Tim Rumbell
  - Catherine Wanjiru
  - et al.
- 2023
- NeurIPS 2023
Weakly Supervised Detection of Hallucinations in LLM Activations
- - Miriam Rateike
  - Celia Cintas
  - et al.
- 2023
- NeurIPS 2023
Cost-Aware Counterfactuals for Black Box Explanations
- - Natalia Martinez Gil
  - Kanthi Sarpatwar
  - et al.
- 2023
- NeurIPS 2023
Risk Assessment and Statistical Significance in the Age of Foundation Models
- - Apoorva Nitsure
  - Youssef Mroueh
  - et al.
- 2023
- NeurIPS 2023
Characterizing pre-trained and task-adapted molecular representations
- - Celia Cintas
  - Payel Das
  - et al.
- 2023
- NeurIPS 2023
PROMINET: Prototype-based Multi-View Network for Interpretable Email Response Prediction
- - Yuqing Wang
  - Prashanth Vijayaraghavan
  - et al.
- 2023
- EMNLP 2023