Welche Evaluationsmethode? Precision/Recall?

Hallo,

ich habe ein Set von Daten, das manuell mit positiv/negativ annotiert wurde. Nun habe ich einen Algorithmus, der ebenfalls mit positiv/negativ annotiert hat. Ich möchte nun die Ergebnisse vergleichen, weiß aber nicht, welche Methode aus wissenschaftlicher Sicht die beste dafür ist.

Mir wurde mal Precision/Recall empfohlen, jedoch würden hierbei ja die korrekt als negativ klassifizierten Daten gar nicht beachtet.
Ich tendiere momentan zu einer generellen Übereinstimmungsqote… was wäre hier passend?

Danke schon mal!

Hallo, classification guy,
mit dieser ziemlich spezialisierten Frage bin ich leider überfordert, wünsche aber viel Erfolg!

Entschuldige, aber da kann ich dir beim besten Willen nicht helfen