Hallo Robert,
Mich irritiert nur noch, dass ich die bayes files an mehreren
Stellen habe. Zum einen sind unter /root/.spamassassin die
files bayes_seen und bayes_tok und dann in jedem Mailordner
unter /var/qmail/mailuser/domainname/mailboxname/.spamassassin
sind die gleichen Files nochmal drin.
Das sind dann User- bzw. Mailaccountspezifische Spam-Datenbanken.
Wenn ich aber mit sa-learn --dump magic mir die Statistik
ansehe, sehe ich keine Änderung während der automatischen
läufe. Erst wenn ich sa-learn manuell ausführe ändert sich die
Anzahl.
So genau habe ich mir das noch nicht angesehen. Aber ich denke, daß hängt mit der verzögerten Synchronisation der Bayes-DB zusammen und ob Du sa-learn mit --sync oder --no-sync ausführst. Im Handbuch steht dazu folgendes:
_While SpamAssassin is scanning mails, it needs to track which tokens it uses in its calculations. To avoid the contention of having each SpamAssassin process attempting to gain write access to the Bayes DB, the token timestamps are written to a ‚journal‘ file which will later (either automatically or via sa-learn --sync) be used to syncronize the Bayes DB.
Also, through the use of bayes_learn_to_journal, or when using the --no-sync option with sa-learn, the actual learning data will take be placed into the journal for later syncronization. This is typically useful for high-traffic sites to avoid the same contention as stated above._
man sa-learn
gibt da bei der Option --no-sync noch mehr Details dazu. Aber eigentlich sehe ich darin nichts, worüber man sich beunruhigen müsste.
Ich hatte jedenfalls sa-learn nicht von Hand ausgeführt, sondern das einen cron-Job machen lassen. Da gibt es z.B. hier ein ziemlich ausgefeiltes Skript für:
http://help.directadmin.com/item.php?id=358
kann ich irgendwie sa-learn --dump magic so ausführen, dass
ich den Inhalt der beiden Datenbanken vergleichen kann?
? Verstehe ich jetzt nicht so ganz. So gross ist die Ausgabe doch nicht, daß man nicht zwei miteinander vergleichen kann. Du kannst aber auch mit der Option -f eine Datei angeben, in der gleich eine ganze Liste von Verzeichnissen (eine pro Zeile) eingetragen ist.
Kann ich das irgendwie für verschiedene Mailboxen aufrufen?
(siehe oben)
Wenn ich dich richtig verstanden habe, ja (s.o. die Option -f).
Viele Grüße
Marvin