Hallo,
ich habe ein Set von Daten, das manuell mit positiv/negativ annotiert wurde. Nun habe ich einen Algorithmus, der ebenfalls mit positiv/negativ annotiert hat. Ich möchte nun die Ergebnisse vergleichen, weiß aber nicht, welche Methode aus wissenschaftlicher Sicht die beste dafür ist.
Mir wurde mal Precision/Recall empfohlen, jedoch würden hierbei ja die korrekt als negativ klassifizierten Daten gar nicht beachtet.
Ich tendiere momentan zu einer generellen Übereinstimmungsqote… was wäre hier passend?
Danke schon mal!