Interactive Retrieval Evaluation

Very difficult to do well

Two particular problems
- modern systems are too good:
  - effectiveness measures limited by user agreement with relevance judgments
- usually assumes naļve users
  - variation among user performance enormous
  - isn’t realistic

Possible fixes?
- time-based measures

Previous slide Next slide Back to first slide View graphic version