Störung machte unser Netz einige Tage für manche unbenutzbar

Seit ca. 26.10.2017 habe ich bemerkt, dass meine Knoten gelegentlich eine sehr schlechte Preformance hatten. Ein Neustart des Knoten brachte dann meist wieder Besserung. Meine Vermutung war ein lokales Problem. Als ich aber am Freitag von Usern ebenfalls hörte, dass sie seit Tagen ein Problem mit dem Netz haben, musste ich der Sache nachgehen.

Ich habe mehrere Möglichkeiten Speedtests zu machen:
– zwischen FF-Knoten und GW
– GW zu GW
– FF-Host als Server ins Internet (Upload)
– FF-Client zum Internet (Download)

Nach vielen Stunden Fehlersuche und rum probieren an diversen Configs hatte ich (großer Dank an kpanic!) den Eindruck, dass es ein Problem mit der fastd-Verbindung zwischen Knoten und GW geben musste. Sobald die Knoten versuchen den GW per IPv6 zu erreichen und in Folge eine IPv6-Verbindung für den Aufbau des fastd-Tunnels nutzen, scheint es zu einem massiven Zusammenbruchs der Performance auf diesem Uplink zu kommen. Zwinge ich den Knoten dazu, den Tunnel über eine IPv4-Verbindung zu realisieren, funktioniert es hingegen problemlos.

Jedem Netzwerker kommt jetzt natürlich sofort die MTU als Problemauslöser in den Sinn. Hier kann ein zu hoher Wert im fastd zu massiven Störungen führen. Gegen diese Vermutung spricht aber:

  • den Wert von 1406 verwenden wir von Beginn an und hatten nie Probleme
  • Telekom hat im DSL eine MTU von 1492, sodass uns auf Telekom-Leitungen (z.B. auch meiner) 86 Bit Overhead zu den Nutzdaten im fastd-Tunnel bleiben und das sollte eigentlich reichen.

Was hat sich in der letzten Woche denn geändert? Wir haben LEDE 2017.1.3 per Autoupdate ausgerollt.
Aber auch hier gebe ich zu bedenken, dass ich LEDE im Vorfeld schon 2 Wochen bei mir laufen hatte und ich keine solchen Probleme bemerkt habe. (Vielleicht ist es mir aber auch nur nicht aufgefallen.)

Als erste Maßnahme habe ich auf (fast) allen GWs die fastd-config dahingehend geändert, dass nur noch IPv4-Verbindungen von euren Freifunk-Routern entgegen genommen werden. Auf absehbare Zeit wollen wir aber wieder IPv6 anbieten können. Daher …….

Wer an dieser Stelle jetzt Lust hat sich an der Problemlösung zu beteiligen ist herzlich eingeladen!

Eine Antwort auf “Störung machte unser Netz einige Tage für manche unbenutzbar

  1. Michael Reiter

    Hallo Heinz,

    konntest du prüfen ob das Problem nur bei Telekomanschlüssen besteht? Ich hatte vor einiger Zeit auch massive Performance-Probleme an meinem Anschluss. Ich hatte im Speedtest immer so 10Mbit downstream. Allerdings IPv4. Ich hab alles geprüft, andere Router + DSL Modem getestet, einen neuen und performanteren FF-Router gekauft, aber ich kam einfach nich über 3 Mbit hinaus. Dann hab ich mir einen VPS bei Vultr gemietet und meinen Traffic für den FF Router transparent über OpenVPN über den Server geroutet, weil ich vermutet habe, dass die Telekom vielleicht die FF-Server IPs drosselt. Auch keine Abhilfe. Als ich OpenVPN dann von UDP auf TCP umgestellt habe war alles wieder schnell. Mehrfach umgeschaltet. Problem war reproduzierbar. Die Telekom hat bei mir am Anschluss also UDP (ob es Openvpn UDP oder UDP im allgemeinen war hab ich nicht gestest) gedrosselt. Das hab ich mir dann ein paar Tage angeschaut und irgendwann war alles wieder cool… Wie gesagt IPv4, aber vielleicht ein neuer Angriffsvektor 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.