QA List Evaluation

Each list judged as a unit
- instances marked right/unsupported/wrong
- subset of right& unsupported instances marked distinct

Each list judged as a unit