Claudia Shi

PhD Candidate | Columbia University

Claudia Shi is a Ph.D. student in Computer Science at Columbia University, advised by David Blei. She is broadly interested in using insights from the causality and machine learning literature to approach AI alignment problems. Currently, she is working on making language models produce truthful and honest responses.

NEWs & publications

Evaluating LLM Responses to Moral Scenarios

March 25, 2024

evaluating-llm-responses-to-moral-scenarios

Evaluating the Moral Beliefs Encoded in LLMs

evaluating-the-moral-beliefs-encoded-in-llms

An Invariant Learning Characterization of Controlled Text Generation

May 31, 2023

an-invariant-learning-characterization-of-controlled-text-generation

Evaluating the Moral Beliefs Encoded in LLMs

July 26, 2023

evaluating-the-moral-beliefs-encoded-in-llms

Evaluating LLM Responses to Moral Scenarios

evaluating-llm-responses-to-moral-scenarios

publications:

An Invariant Learning Characterization of Controlled Text Generation

May 31, 2023

Research

Our research explores a portfolio
of high-potential agendas.

Events

Our events bring together
global leaders in AI.

Programs

Our programs build the field of trustworthy and secure AI