Andrew M. Bean

about
publications
repositories
cv
press
teaching

Measuring what Matters: Construct Validity in Large Language Model Benchmarks

© Copyright 2026 Andrew M. Bean. Last updated: March 08, 2026.