Willkommen im User-Forum von mailbox.org
 

SpamAssassin, Inhaltsspamfilter: Individuelle mailbox.org Einstellungen

FX hat dies geteilt, 2 Jahren her
unbeantwortet

Hallo,


wie arbeitet der Inhaltsspamfilter SpamAssassin bei mailbox.org? Wie kann man sich das vorstellen, wie das technisch abläuft? Ich dachte auf mailbox.org durchsucht "nichts und niemand" meine eingehenden Mails?

Danke


"Verfügbar ab 5/2017.Inhaltsspamfilter

Es handelt sich dabei um die bekannte Software SpamAssassin, die die Spam-Wahrscheinlichkeit einer Mail anhand ihrer technischen und inhaltlichen Merkmale berechnet. Ist die Wahrscheinlichkeit zu hoch, kann eine Mail direkt abgelehnt oder in einen Mailordner umgeleitet werden.

  • Vorsichtig: Das Risiko eines False Positives ist kaum noch messbar, aber im Gegenzug kommen vermehrt Spam-Mails („False Negatives“) durch.
  • Normal: Nach jahrelanger Erfahrung das Optimum zwischen maximal geblockten Spam-Mails bei kaum vorhandenen False Positives-Risiko. Wir haben eigentlich keinerlei Beschwerden über falsch gefilterte Mails. Von uns definitiv empfohlen.
  • Hart: Mails werden sehr niedrigschwellig als Spam erkannt. Das blockt viele Spam-Mails, das Risiko für False Positives steigt jedoch.

Empfehlung: „Normal“ verwenden."

Quelle: https://support.mailbox.org/knowledge-base/article/individuelle-einstellungen-des-mailbox-org-spam-filters

Kommentare (26)

Foto
1

Der Frage möchte ich mich anschließen, zumal dieser Filter offensichtlich nicht vollständig abgeschaltet werden kann.

Foto
1

Ich würde gerne die Inhaltsfilterung ganz abschalten können.

Nutze viel die temp.mailbox.org Funktion und würde gerne auch mal sehen wie viel Spam bei meiner mailbox.org Nutzung tatsächlich kommt.

Generell erhalte ich bei meinen verschiedenen Providern und eigenen Domains sehr wenig Spam und eine Mail in Whois wird entweder abgeschaltet, wenn zu viel Spam kommt, oder ein Privacyschutz genutzt.


Dank.

Foto
1

Wenn man die Mails nur kennzeichnen und in einen Ordner verschieben lässt, sieht man doch wieviel Spam ankommt, unabhängig von der eingestellten Stufe.

Foto
2

Stimmt, sollte man dann im Spam/Junk Ordner sehen. Aber trotzdem wäre mir so ein Radiobutton für "Aus" lieber, wenn ich nicht will das ein fremdes Script meine Mailinhalte filtert. Diese "Privatsphäre" war doch ein Anliegen des Anbieters und hat vielen gefallen?


895d2ea18eddf1e12107ef9ae7c89a38

Foto
Foto
1

Bisher habe ich das so verstanden:


Nehmen wir mal an das mailbox.org in Spam-Emails die Ihnen zur Verfügung stehen / zur Verfügung gestellt werden (z.B. durch Kunden) immer wieder folgenden Text findet:


„Auf Ihrem Konto sind EUR 50000 die Sie abheben sollten“


Beim Eingang der Mails werden sie dann einmal auf diese bekannten Textmuster durchsucht bevor sie im Posteingang landen. Man könnte sich das also so ähnlich vorstellen als wenn man selber seine Spammails anschauen würde und dann entsprechende Filter einrichtet, nur das in diesem Fall die Filter von mailbox.org für einen gemacht werden.

Foto
1

"Beim Eingang der Mails werden sie dann einmal auf diese bekannten Textmuster durchsucht"

Was aber bedeutet, dass jede E-Mail tatsächlich durchleutet und abgeglichen wird. Behelfen kann man sich, indem man die Mails in einen Ordner legen lässt. Die Option bleibt aber aktiviert. Wenn dies komplett abschaltbar wäre, wäre das zumindest eine Option, die dem Selbstverständnis entsprechen würde, denn dort heißt es:

"Unsere Provider JPBerlin.de und mailbox.org sind darum keine x-beliebigen technischen Anbieter, sondern schaffen bewusst Rückzugs- und Sicherungsräume, schützen die Meinungsfreiheit und stellen die eigentlich selbstverständlichen Möglichkeiten einer unüberwachten privaten Kommunikation wieder her" - https://mailbox.org/motivation-und-selbstverstaendnis/

Foto
1

Das mit dem Ordner war nur ein Versuch zu erklären wie die Inhaltsanalyse technisch ungefähr funktioniert, das Ablegen von Emails in Ordnern ändert gar nichts an der Textmustererkennung.


Aber ja, ein Inhaltsfilter analysiert zwangsweise Inhalte. In wieweit man das als Überwachung und damit als Widerspruch zum Selbstverständnis sehen kann hängt davon ab was man unter Überwachung versteht.


Im folgenden mal meine Meinung:


Ich persönlich sehe hier aber nicht wirklich einen logische Argumentationskette warum dieser Mechanismus Überwachung ermöglichen sollte: ein Computer dem es völlig egal ist wer ich bin / bei wem eine Email als Spam abgewiesen gleicht den Inhalt mit einer begrenzten Anzahl an klar definierten Textmustern ab und vergisst alles danach sofort wieder. Es wird dadurch nichts (weder die Textmuster noch anderes) mit meinem Profil verknüpft und kann auch damit von keinem genutzt werden.


Natürlich kann ich für mailbox.org sprechen, ich hatte aber zumindest bisher den Eindruck das Überwachungsfrei vor allem so wenige Daten wie möglich und keinerlei „Google-Aktivitäten“ bedeutet, also keiner Erhebung, Speicherung und Auswertung von Dingen wie


⁃ wer hat wann mit wem Kontakt

⁃ über was tauschen sich die Parteien aus

⁃ welche Geräte nutzen sie, wo befinden sie sich

⁃ wer sind die Personen

⁃ Interessen, Geschlecht, Einkommen, politische Ansichten, …

Foto
1

Die zuletzt von dir aufgeführten Aspekte sind doch von dem Spamfilter umfasst. Durch das Greylisting wird gespeichert, dass und (insgesamt) mit wem bereits ein Kontakt bestand: "In der Vergangenheit bereits gesehene Mailsysteme werden nicht mehr gegreylisted". Und der Inhaltsfilter wird ja durch Menschen gespeist.

Sicherlich, das ist nicht damit zu vergleichen, dass nun accountspezifisch ein nachhaltiges Speichern durchgeführt wird. Aber es wäre dennoch recht einfach elegant, wenn man dem zahlenden Nutzer die Möglichkeit geben könnte, den Spamfilter insgesamt auszuschalten. Ein Schaden entsteht dadurch ja nicht.


Finde es auch gut, dass du für mailbox.org sprichst, sonst kommt ja nur ab und zu mal eine Beteiligung von offizieller Seite.

Foto
2

Ich befürchte dass das alles irgendwie im ersten Moment einfacher klingt als es ist, auch wenn auch mir anders lieber wäre.


Klar kann man das Greylisting abschalten und keine Liste an bekannten Mailservern zu haben, das bedeutet im Umkehrschluss aber auch dass mal Spam durchkommt und v.a. die Gefahr für Phishing steigt. Und dann haben wir die Frage ob die Privatsphäre besser geschützt ist wenn Accounts gehackt werden oder wenn mailbox.org diese Serverliste hat.


Was den Inhaltsfilter betrifft könnte man ja z.B. argumentieren dass das Lesen durch Menschen kein Problem ist wenn die Emails von Kunden als Spam deklariert gesendet werden und wie beim Greylisting steht man dann vor derselben Abwägungsproblem.


Wahrscheinlich können wir das gleiche Spiel auch mit den log-Files spielen die für wenige Tage behalten werden. Sie enthalten reichlich Metadaten sind aber auch unerlässlich für die Verhinderung von Missbrauch, Spammern (die dann dafür sorgen würden das mailbox.org irgendwann auf einer Blacklist steht), helfen beim Debuggen, sichern, ...


Was ich sagen möchte, ich verstehe diese Bedenken (ich habe sie auch), ich sehe aber einfach auch Argumente für all das und glaube an sich ja auch das mailbox.org das tun wird was aus Ihrer Erfahrung praktisch möglich ist um so wenig wie möglich Daten zu haben.

Foto
Foto
5

Ich fass es echt nicht. Erst jammern alle wegen des einstellbaren Spamfilters und jetzt diskutiert Ihr echt das Thema Spamfilter vs Überwachung. Leute, wir sprechen hier von Industriestandards. Spam wird auf der ganzen Welt so gefiltert. Echt fassungslos gerade.

Foto
1

Nur weil irgendjemand irgendwo irgendwas macht, heißt es doch nicht, dass der Kunde hier nicht anregen darf, dass er den Spamfilter für sein Postfach auch gerne deaktivieren können möchte.

Was ist denn daran so schlimm? Weil es anders ist? Dann würde mailbox.org an sich auch schon aus dem Rahmen fallen.

Ich fasse es echt nicht!

Foto
2

Naja, ein Mailprovider kann es sich im Prinzip nicht leisten das die User die Option abschalten können meines Erachtens. Stell Dir mal vor wenn das ein Grossteil machen würde welche zusätzliche schwer kontrollierbare Last dieser Spam verursachen würde. Ich glaube das wäre generell kontraproduktiv und überlebenswichtig für den Provider. Eventuell kann Peer hierzu nochmal was sagen. Bezogen auf den abschalten des Spamfilter.

Gruss!

Foto
1

Es ist sicher weniger "Last" für den Mailprovider, wenn er nicht mehr alle Mails durch den Spamfilter prüfen lassen muß und stattdessen gleich in die Postfächer zustellen kann.

Foto
1

Vor ein paar Tagen gab es von Peer Heinlein folgende Antwort auf eine Frage warum man den Spamfilter nicht komplett abschalten kann:


"Es ist NIE möglich die 100%ige Kontrolle zu haben. Bei keinem Provider auf der ganzen Welt. Das würde nur gehen, wenn man *sämtliche* Maßnahmen abschaltet. Wer das will, der braucht aber keinen Provider mehr. Und ein Provider, der das macht, wäre aber binnen Minuten überlastet und tot."


https://support.mailbox.org/topic/wie-oft-werden-mails-fälschlich-als-spam-erkannt#comment-7481

Foto
1

Dieses Zitat verstehe ich nicht. Vor allem warum ich dann keinen Provider mehr brauchen soll. Ich gehe mal davon aus, daß noch weitere Spamschutzeinrichtungen gemeint sind, als die, die jetzt konfiguriert werden können. Ich habe den Spamfilter soweit es geht runtergefahren und noch keine einzige Spam bekommen. Den Inhaltsspamfilter um den es hier geht könnte ich also - zur Zeit - auch gerne ganz abschalten.

Foto
1

Natürlich bedeutet es für die Systeme eine "Last", wenn beim Maileingang (von z.B. mehreren tausend Mails pro Zeiteinheit) weitere "Stellschrauben" zu beachten sind.

Wer eine absolut 100%ige Kontrolle selbst ausüben will, muss eben einen eigenen Mailserver betreiben (Root-Server, Managed Server, Server zu Hause usw.). Wer das macht und nicht auch 100% fit ist in der Konfiguration eines solchen Servers, wird sehr schnell merken, auf was er sich dabei einlässt. Unerwünschte Nebenwirkungen sind nicht ausgeschlossen. ;-)

Foto
1

"Natürlich bedeutet es für die Systeme eine "Last", wenn beim Maileingang (von z.B. mehreren tausend Mails pro Zeiteinheit) weitere "Stellschrauben" zu beachten sind."

Was ja der Fall ist, wenn man drei Stufen der Inhaltsfilterung auswählen kann, deren Konfiguration man aber gar nicht kennt. Denn hier muss jeweils unterschiedlich stark ein Skript drüberlaufen und die Mail entsprechend der (dem Nutzer unbekannten) Konfiguration beurteilen und einteilen. Das wäre bei einem Ausschalten gar nicht der Fall, die Last wäre also geringer, da die Skripte erst gar nicht durchlaufen werden müssen.


"Naja, ein Mailprovider kann es sich im Prinzip nicht leisten das die User die Option abschalten können meines Erachtens. Stell Dir mal vor wenn das ein Grossteil machen würde welche zusätzliche schwer kontrollierbare Last dieser Spam verursachen würde"

Wenn der Spamfilter ausgestellt ist, wird die Mail ins Postfach eingeliefert, also schlicht gespeichert. Ist das Postfach (Quota) voll, wird die Mail zurückgewiesen. Mehr passiert nicht. Im Gegenteil, es muss eben nicht vorab noch mal geprüft werden, welche Inhalstfilterung der Kunde denn ausgewählt hat, um dann die Inhaltsfilterungsskripte über die Mail zu jagen, diese zu beurteilen und einzusortieren.

Foto
1

Ohne dich angreifen zu wollen, aber das problem bei deinem Gedanken ist, das er halt leider einfach falsch ist, denn "Schlicht gespeichert" ist deutlich aufwändiger als kurz analysiert und weggeworfen, zumal an "schlicht gespeichert" mehr dranhängst als irgendwo eine Datei zu erstellen (was auch langsamer ist, file-i/o ist immer lahm).

Hier wäre es sinnvoll Herrn Heinlein glauben zu schenke da seine Aussage einfach kompetent ist.

Ich persönlich spreche hier für mich als Programmierer von solchartigen Systemen (keine Mailsysteme, aber ähnlich) und kann dir versichern dass "einfach speichern" wirklich in der Realität nie "einfach" ist und dass kurzes analysieren und ablehnen deutlich fixer geht.

Das Motto "der schnellste Code ist der, welcher nie laufen muss" stimmt nur, wenn dann stattdessen nicht wesentlich komplexere Prozesse passieren müssen.

Foto
2

Ich bin zwar kein Programierer aber diese Aussage ist falsch. Das jetzige System läßt die Einstellung zu, daß eine eingehende Mail analysiert, bewertet UND in einen Ordner Deiner Wahl zugestellt wird. Es ist sicher weniger Aufwand auf die ersten beiden Schritte zu verzichten. Und genau das wird hier angeregt: Eine Option zu schaffen, die ersten beiden Schritte abzuschalten. Das sollte programiertechnisch doch recht einfach sein.

Foto
1

"Das jetzige System läßt die Einstellung zu, daß eine eingehende Mail analysiert, bewertet UND in einen Ordner Deiner Wahl zugestellt wird."

Das ist doch ein wichtiger Punkt. Ich dachte schon nach einigen Beiträgen die gemacht wurden, meine Vorstellung den Inhaltsfilter abstellen zu können, wäre zu naiv, weil dann der Provider vielleicht mit Spam überhäuft wird. Aber das wird er ja in allen Fällen (egal welche Einstellung), wenn eine Spamwelle kommt.

Eingangsverschlüsselung: Was mich noch interessieren würde, wenn man diese Verschlüsselung für eingehende Mails aktiv hat, wird das "vor", oder nach dem Spamfilter gemacht?

Foto
1

"Ohne dich angreifen zu wollen, aber das problem bei deinem Gedanken ist, das er halt leider einfach falsch ist, denn "Schlicht gespeichert" ist deutlich aufwändiger als kurz analysiert und weggeworfen, zumal an "schlicht gespeichert" mehr dranhängst als irgendwo eine Datei zu erstellen (was auch langsamer ist, file-i/o ist immer lahm)."

Die Problematik scheint bei mailbox.org nicht zu bestehen, denn es kann ja nach dem Durchlauf der Inhaltsfilterung dennoch noch die E-Mail gespeichert werden. (Ich vermute auch, dass mailbox.org eher amavisd-new mit Anbindung an Mysql oder LDAP verwendet)

Zumal (bspw. bei Postfix) sowieso schon ein disk i/o stattfindet, wenn die Mail eintrifft, ohne dass was passiert ist (mail queue). Daneben erzeugt auch Spamassassin disk i/o. Es sei denn natürlich, man lagert das ganze in eine RAM-Disk aus. Ist dann natürlich auch eher flüchtig. Mal von dem Aspekt des datenbankbetriebenen Mailservers komplett abgesehen (wie er z. B. in Herrn Heinleins Buch thematisiert oder in den - wirklich guten - Fortbildungen beigebracht wird).

Daneben: Mails direkt bei der SMTP-Konversation abzulehnen ist im Hinblick auf § 206 StGB problematisch, was Herr Heinlein als Jurist sicherlich geprüft haben dürfte. Denn: Als Referent auf seinen Fortbildungen bringt er diese Problematik nahe und auch sein Postfix-Buch (welches ich hier seit Jahren im Regal habe) ist inhaltlich sehr gut.

Von daher nehme ich deine Aussage auch nicht als "Angriff" wahr. Bin selbst kein Programmierer, administriere nur mehrere Postfix-Mailserver, insbesondere durch das beigebrachte Know-How von der Fa. Heinlein (Fortbildungen/Buch). Vielleicht daher auch für dich als Programmierer ganz interessant: https://www.heinlein-support.de/schulung/spamassassin-und-amavis

Foto
1

Hehe, danke ;) Ich kann mir jedoch weiterhin leider nur schwer vorstellen, dass es tatsächlich langsamer ist eine Mail zu scannen und abzuweisen als die Mail anzunehmen, an das Storage Backend zu geben, wo es redundant gespeichert wird, ggf. vom User erstellte Filter drüberlaufen, vom IMAP Server/Such Backend indiziert wird und dann an die IMAP Clients ausgeliefert wird.

Bei neuen Adressen mit wenig/garkein Spam ist das sicherlich Wurst, aber bei lange bestehenden und/oder zwangsweise öffentlichen Adressen (wie meinen) die ca. das 3-5 fache Volumen an unsinnsmails pro Tag haben die direkt auf den ersten Ebenen bereits verworfen werden, ist das doch ein großer Unterschied, v.a. wenn man den Benutzern in Masse erlauben würde dies abzuschalten.

Bzgl. des Ablehnens beim SMTP-Dialog: Genau dies ist doch der Clou hier. Das direkte Ablehnen entspricht quasi dem "Annahme verweigert". Würde der Spamfilter es annehmen wäre es ja ein "Angenommen/Eingegangen in Abwesenheit d. Empfängers". Soweit habe ich das mit den bisherigen Kommenteren von Mailbox.org hier im Forum, sowie den Vorträgen von Heinlein Support und Co. verstanden. Ist es doch anders?

Foto
1

"Ich kann mir jedoch weiterhin irgendwie schwer vorstellen dass es langsamer ist eine Mail zu scannen und abzuweisen als die Mail anzunehmen, an das Storage Backend zu geben, wo es redundant gespeichert wird, ggf. vom User erstellte Filter drüberlaufen, vom IMAP Server/Such Backend indiziert wird und dann an die IMAP Clients ausgeliefert wird."

Die Problematik scheint bei mailbox.org aber nicht zu bestehen. Schau dir den Bereich des Spamfilters doch noch einmal genau an. Es geht hier nur im die Inhaltsfilterung die abgestellt werden soll. Derzeit läuft diese immer durch (nur in verschiedenen, vom Benutzer nicht näher bestimmbaren Graden), aber gespeichert werden kann die Mail.

Der Vorschlag ist, dass nur der Inhaltsfilter ausgestellt wird, der Rest aber bleibt. Gespeichert wird so oder so. (siehe Screenshot oben bzw. den Bereich der Spamverwaltung.)

Foto
1

Stimmt, Hast recht. Im falle vom Tagging ist es wirklich fast egal. Die einzige "mehrlast" die man dann noch andichten kann, ist dass mehr zu den IMAP Clients gesendet werden muss (Inbox hat jeder abonniert, Junk insb. Mobilgeräte Standardmäßig eher nicht).

Foto
1

Eben. Und ganz ehrlich: Die RBL und den SMTP-Plausibilitätscheck würde ich auch nie abstellen wollen. Den Inhaltsfilter aber schon, da ich die Filter nicht kenne. Als reiner Privatnutzer evtl. egal, aber als Freiberufler lese ich lieber eine Spam-Mail mehr, als dass der Inhaltfilter eine Auftrags-/Kundenmail verschlingt/taggt.

Foto
Foto
5

  1. wie arbeitet der Inhaltsspamfilter SpamAssassin bei mailbox.org? Wie kann man sich das vorstellen, wie das technisch abläuft?

SpamAssassin ist eine OpenSource-Tool, welches unter dem Apache-Dach entwickelt wird.

Die Ganzen Infos über das "wie" usw. findest du unter http://spamassassin.apache.org/.

Vereinfacht gesagt kannst du dir das so vorstellen: E-Mail wird an SpamAssassin übergeben, das Programm guckt nach einigen (konfigurierbaren) Kriterien (ich nenn mal ein Beispiel, keine Ahnung wie das zutrifft: Enthält die Mail einen Weblink drin, der auf eine Adresse verweist, die auf einer Phishing-Blackliste ist?).

Am Ende kommt eine Score raus (z. B. "1.5") und wenn dieser Score einen Schwellenwert überschreitet, kann man die E-Mail als Spam markieren lassen. Den Schwellenwert und welche Kriterien wie stark darin einfließen bestimmt dabei der Admin des Mailservers oder neuerdings (dank des konfigurierbaren Spamfilters) bei MBO in gewisser Kapazität du selbst, auch wenn du hier nicht weisst welche Kriterien wie herangezogen werden: Dies aber im Detail den Nutzer regeln zu lassen wäre utopisch.

Wichtig ist: Das ist eine Einmal-Operation. E-Mail wird an SpamAssassin gereicht und Score kommt raus. Fertig. (SpamAssassin kannst du übrigens bei so gut wie jedem Mail-Hoster begegnen).


  1. Ich dachte auf mailbox.org durchsucht "nichts und niemand" meine eingehenden Mails?

Hier solltest du ganz stark unterscheiden zwischen "durchsuchen" und "durchsuchen".

Natürlich muss irgendeine Software deine Mail dursuchen: Wenn du Virenschutz willst, muss ein Virenscanner den Anhang "durchsuchen"; Wenn du Filterregeln einstellen willst (Mails von X in Ordner Y), muss die Filtersoftware deine E-Mail "durchsuchen"; Wenn du dein Postfach ansehen willst, muss der IMAP-Server deine Mails "durchsuchen" um dir die Liste auszugeben; ...

Was hier bei Mailbox.org jedoch nicht passiert ist, dass die spezifischen Inhalten deiner einzelnen Mails analysiert und querreferenziert in einer Datenbank landen, um so ein Profil über dich, deine Freunde, deine Unterhaltungsthemen und Interessensgebiete anzulegen und diese dann zu in irgendeiner Form zu vermarkten.

Ebenso werden auch keine Schattenprofile von Leuten erstellt die nicht bei Mailbox.org sind, aber deren E-Mails du erhälst.

Bei GoogleMail schreibt dir, beispielsweise, dein Vater eine E-Mail über Winterreifen und bei deiner nächsten Nachrichtenseite die Google Ads verwendet, siehst du Werbung von Pirelli. Das passiert dir hier nicht, weil die Inhalte nach der Spamauswertung nichtmehr von Bedeutung sind.

Mailbox.org wertet zu Spam-Zwecken die Inhalte anhand fester Kriterien aus (welche MBO wahrscheinlich zu Teilen nicht verraten wird um Spammern nicht das Leben leichter zu machen), aber das ist ein "technisches auswerten" und kein "durchsuchen" im Sinne von einem "bewussten" Lesen und merken der Inhalte.

Hoffe das hat etwas geholfen. Sollte ich was komplett falsch verstanden haben, freue ich mich natürlich über korrekturen ;)