Anonymisierter Screenshot von 14:31 Uhr:
Der Server relayed Mails „ins Internet” via dediziertem SMTP-Gateway, welches in einer anderen Stadt steht. Die Standorte sind via privatem WAN verbunden. Man beachte:
- Die Anzahl der Nachrichten in der Warteschlange (rechts unten).
- Den Absendezeitpunkt der ersten Nachricht (rechts oben).
- Die Größe der Nachricht, die derzeit zugestellt wird (oben Mitte) - und ja, alle Nachrichten, die er auszuliefern versucht hat, waren „relativ groß” und es waren alles Retries von großen Nachrichten.
Was schließen wir daraus, wenn die gesamte „active queue” mit sowas zugeballert ist? Genau, klassischer Fall von „congestion” bzw. „saturation”. Laut Auskunft des Verantwortlichen lag es am fehlerhaft funktionierenden Bandbreitenmanagement. Ursächlich vielleicht richtig. Daß das eigentliche Problem die Fehlkonfiguration der Exchange-Server war (man hätte die Anzahl der „delivery slots” für große Nachrichten limitieren müssen, um dieses Phänomen, i.e. Füllen der Queue mit erneuten Zustellversuchen von großen Nachrichten, die höchstwahrscheinlich wieder in einen Timeout laufen, zu verhindern, aber wahrscheinlich ist Exchange für sowas zu doof), davon war keine Rede. Funktioniert unter normalen Umständen ja schließlich auch problemlos. Und kann auch garantiert nie wieder vorkommen („eins ausrufezeichen elf ”).
Wieso lasse ich mich eigentlich immer wieder mit solchen Aussagen abspeisen? Ich meine, ich
weiß es doch eigentlich besser. 300k Mails am Tag (auf meinen Kisten) sprechen halt eine deutliche Sprache. Muß an der Sympathie liegen, die ich für die Verantwortlichen empfinde. Die stammt übrigens noch aus dem Jahr 2002.
Nachtrag: Ich sollte die Reports von
postfix-logwatch auch mal lesen. 634k am Tag, seit einer Woche nicht unter 600k.