ECC - Sinn/Zweck oder Unsinn (Glaubensfrage!?)

…in Anlehnung an USV - Sinn/Zweck oder Unsinn (Glaubensfrage!?, der aus den Antworten zu meiner Anfrage nach Tipps für Server als eigenes Thema entstand.

Hallo zusammen,

Einerseits ist ECC-RAM ca. 40% teurer, andererseits macht RAM ja nur einen Teil der Kosten aus. Ein Server so um die 2000€ wird zwar nicht wesentlich teurer, aber ich frage mich dennoch und in die Runde:

  • Ist ECC-RAM im Umfeld Linuxmuster/Schule wirklich nötig?
  • Was sind eure Einschätzungen/Erfahrungen?

Hängt davon ab, ob die Schule bereit ist, Serverabstürze oder Datenverluste aufgrund mangelnder Fehlerkorrektor der RAM-Speicher in Kauf zu nehmen, also ein potentiell unsicheres System zu betreiben (man Stelle sich das in einer Abschlußprüfungssituation vor) und statt dessen Geld zu sparen.

Hallo!
Für einen Server würde ich immer ECC verwenden. An der Schule läuft mein Arbeitsplatzrechner auch dauerhaft, weil ich da ein paar Monitor-Dinge mit mache. Alle 1-2 Monate hängt der und braucht einen Neustart, er hat kein ECC, ich vermute, es liegt daran, auch am Laptop beobachte ich diesee Phänomen.
Wenn Du als Server einen Desktop-PC nutzen willst (Kostengründe), viele ASUS-Boards können ECC, zwar unregistered, aber immerhin ECC. Ich habe das so umgesetzt, der Speicher (ich habe Kingston, war der einzige bei ASUS gelistete mit ECC) war nicht wesentlich teurer.
Wenn Du jetzt sowieso Deinen Server jede Nacht neu startest, wie das professtionelle Rechenzentren tun (nach eigener Aussage zumindest KOMM.ONE), ist das sicher nicht so relevant :slight_smile:
LG
Max

Hallo,

ich verwende bei Servern auch immer ECC-Ram.

Gruß

Alois

Gleiche Diskussion wie bei der USV und weiteren potentiellen Fragen: brauche ich redundante Netzteile, Lüfter, USV,…

Nein, braucht man nicht unbedingt. Der Server läuft auch auf dem Billig-Desktop-PC vom Discounter.

Kann jeder wiederum machen, wie er will. Aber auch hier ne selbst erlebte Geschichte:
hab an meiner alten Schule damals gewagt, einen „gescheiten“ Server zu fordern. Hat mir einen Anschiss meines damaligen Schulleiters erster Güte in Anwesenheit von externem Dienstleister und Schulträger eingebracht, „was ich mir denn vorstellen würde, wie seien ja schließlich keine Bank oder Versicherung…! Und wenn da mal was kaputt gehe, dann wär’s eben so…“
Ratet mal, wer mich in den Sommerferien in Südfrankreich angerufen hat „das Internet ginge nicht und überhaupt und das müsse SOFORT gerichtet werden usw…“!!!

Seither bestehe ich (und hab an meiner neuen Schule NIE Probleme deswegen gehabt) auf ordentliche Serverhardware! Redundante Netzteile, Lüfter, ECC-RAM, RAID, USV,…

Ein weiterer Gesichtspunkt:
Kollegen, Schulleitungen, Schüler, Eltern, und nicht zuletzt die Presse stürzen sich gerade genüsslich (und teilweise zu Recht) auf Ausfälle von Lernplattformen, Videokonferenzsystemen etc während Corona!
Und wir diskutieren ernsthaft darüber, ob wir zentraler Infrastruktur, wo vielleicht unser zentrales AD drauf läuft, gegen das sich alle (auch externe) unsere Dienste authentifizieren, nun ECC-RAM oder nen redundanten Lüfter spendieren sollen!???

Sorry für die Emotionalität :wink:
Wiederum nur meine persönliche Meinung…

Liebe Grüße,
Jochen

Hallo Jochen,

alles was Du schreibst kann ich nur bestätigen. Anfangs hatte ich auch die Illusion dass in einer Schule das Internet mal nicht funktionieren dürfe. Ich wurde eines besseren belehrt. Deshalb habe ich zunehmend professionelle Hardware gefordert und auch bekommen.

Die Ausfallzeiten sind in der Tat nur noch gering. Vorher waren sie aber auch nicht sonderlich hoch.

Gruß

Alois

Hi Jochen.
Ich mache das jetzt auch nur noch so! Wir haben vor gut 3 Jahren mehr oder weniger zufällig einen alten Rack-Server geschenkt bekommen … da sind mir die Augen aufgegangen. Mittlerweile befindet sich fast alles im Rack und ich würde auch nicht mehr auf pedestrial server (im schlechtesten Fall mit Kabel-Wust im Innern) zurückkehren … ich finde auch, dass man sehr deutlich merkt, dass ein „richtiger“ Server auch für den Dauerbetrieb ausgelegt ist …
Viele Grüße,
Michael

Hallo,

Die Ausfallzeiten sind in der Tat nur noch gering. Vorher waren sie aber
auch nicht sonderlich hoch.
ich vergleich mal mein Seminar mit meiner Schule: den Vergleich hab ich
seit 15 Jahren.

Seminar: teurer DELL Server mit SAS Platten redundante Netzteile …
Hardware RAID Controller uns PERC7/8/wasweisich

Schule: immer selbergebastelt mit Consumer Hardware: ASUS Board derzeit
ein Ryzen 2700 mit 32GB normalem DDR4 RAM und 6 WD Black 7200 U/Min
Platten im softwareRAID. KVM auf einer 240GB Kingston SSD

Server im Seminar ist 4 Jahre alt und macht starke mucken, weil die 6
15k SAS Platten vom HauptRAID am abnippeln sind.
Eine ist plötzlich ganz raus: die hat der Controller nicht mehr gesehen
und die anderen zeigen alle mehrere relocated Sektoren.
Ist halt Profihardware: Enterprise Edition … ganz schön enttäuschend.
Meine ähnlich alten WD Platten: 0 relocated Sektoren und 0 pending
Sektoren und ebenfalls 0 UDMA_CRC Count.
Das ist ein RAID5 über 6 Platten und eine davon ist HotSpare.
Genauso im Seminar, nur sind es da 6 600GB Platten mit 15k und in der
Schule sind es 6 4TB Platten mit 7k2

Dumm dass die enterprise SAS Platten extrem teuer sind und trotzdem
früher ausfallen … klar: drehen ja auch doppelt so schnell …

Über die 17 Jahre geschaut würde ich sagen, ist es etwa Gleichstand.
In der Schule muss ich das Netzteil im Server so etwa alle 4 Jahre
tauschen, sonst gibts ab und zu mal einen Stillstand. Seit ich das weiß,
passiert da nix mehr.

Mein Fazit: die „echten“ Server haben etwas mehr Verläßlichkeit für ganz
schön viel Aufpreis: das kann durchaus gerechtfertigt sein.
Ob es das ist muß jeder selber entscheiden.
Man muss dazu sagen, dass Hardware mein Lieblingsspielfeld ist: da kenn
ich mich eigentlich wirklich gut aus.

Was ich sagen will: niemand muss ein schlechtes Gewissen haben, nur weil
er nicht das Geld bekommt für Serverhardware. Mit normalen KOmponenten
kann man es auch sehr weit schaffen.

Serverhardware bewahrt einen nicht vor dem Einrichten eines Monitorings
und HardwareRAID Controller sind ein echtes „Pain in the Ass“: die
Dinger nerven: man kommt nur umständlich direkt an das Device zum
Auslesen der Smart Daten. Zum Erreichen der Oberfläche benötigt man eine
extra IP und Netzwerkverbindung, die man dann raus tunnelt. Und ich frag
mich, ob ich mit bekomme, wenn die BatteryUnit den Geist auf gibt …
ich hab versucht den Treiber für den Perc7 HBA unter meinem kvm Host
(16.04) zu installieren: nach 5 verschiedenen Softwarepaketen die für
den Controller waren hab ich es aufgegeben… keine hat den Controller
gefunden.

LG

Holger

Hallo Holger,

ich habe früher auch selbst gebaut. Wenn man folgendes beachtet hat, dann liefen die Kisten auch ewig.

  1. ECC-Ram
  2. redundantes Netzteil (nicht die billigsten)
  3. großer Kühler (nicht die mitgelieferten) mit 120 mm Pabst-Lüfter (leise)
  4. Zusätzlich noch ein oder zwei 120 mm Pabst-Lüfter für das Gehäuse
  5. Beim Motherboard nicht das billigste (wenn man aber vier und mehr Festplatten dort unter bringt, dann ist das idR auch qualitativ hochwertig)
  6. Software Raid

So aufgebaute Server habe ich hin gestellt und nach fünf bis zehn Jahren funktionsfähig abgebaut, weil die nächste Generation dran kam. Ab und an hatte sich mal eine Festplatte aus dem Raid verabschiedet. Wobei ich dafür gesorgt habe dass die Festplatten ca. alle vier Jahre getauscht wurden.

Ich habe mich aber dann entschieden nicht mehr selbst zu bauen, sondern fertig zu kaufen, weil die Anforderungen an die Zuverlässigkeit immer höher wurden und es nicht am selbst gebauten Server liegen sollte, wenn es zum Stillstand kam.

Bei Arbeitsplatzrechnern bin ich ein Fan von gebrauchter professioneller Hardware. Damit habe ich die Schulen versorgt und war sehr zufrieden mit der Lösung. Wer kein Geld für Computerhardware ausgeben muss, der kann das Geld in andere Infrastruktur (Beamer und Co.) stecken.

Argumente der Kaufleute „da hat man doch keine Garantie“ kann man getrost in den Wind schlagen. Wenn man ausreichend Hardware (Computer) geschenkt bekommt, dann kommt es auf einen von hundert der in zehn Jahren ausfällt nicht an. Ich hatte immer genügend Rechner in Reserve um austauschen zu können.

Gruß

Alois

Morgen,
vorausgeschoben, Hardware interessiert mich nicht wirklich.
Wir haben zwei 6000€-Server von Thomas Krenn, Raketenbau mit allen Features, damit virtualisieren wir alles. Die Dinger haben 128GByte-RAM und bewusst „nur“ Software-RAID, Kollege verwirklicht sich darauf, ich werf da immer mal wieder eine VM rein.

Ich hab ein olles Sunfiremonster am Start, das frisst leider Strom ohne Ende, hat auch viel RAM (glaube 96GByte, haben wir geschenkt bekommen das Ding) und war auch mal vor langer Zeit sauteuer, da hab ich noch eine Handvoll Services drauf, daneben brummen aber auch noch zwei uralte Desktoprechner mit so Frickelkram, ich glaub der aeltere ist 15 Jahre alt, da sind Desktopplatten drin, ich glaub nichtmal RAID1, kein ECC-RAM, nix, Gehaeuse offen, eine Platte haengt da auch frei drin rum, ich muss mal Fotos davon machen. Laeuft seit Ewigkeiten.

Will sagen, mir ist vollkommen egal, was an Hardware drin ist und wie alt das Zeugs ist. RAID1 macht Sinn und zwar Software, da geh ich voll konform mit Holger, Hardware-RAID suckt wie Sau.
Bei redundanten Netzteilen hab ich nur an einem den Stecker drin.

Ich mag aber auch LVM und den ganzen Kram nicht, partitionieren auch gerne minimal, quasi fuer Anfaenger alles auf einer Partition, je einfacher, desto schneller krieg ich das wieder gefixt wenn was bockt.

Ich liebe einfache Systeme, muss aber sagen, dass ich/wir auch die Skills haben, eben mal ein ganzes Netzwerk mit Serverdiensten aus dem Boden zu stampfen, unsere Netzwerktruppe ist schon sehr gut unixoid besetzt, haben uns als Team gesucht und gefunden.

Achso, ging ja um ECC-RAM, ich glaub den braucht man nicht, wenn da mal ein Bit kippt macht das aus meiner Sicht bei einem Schulsystem nix.
Wenn bei uns was schieflaeuft ist es meistens ein Fehler vom Adminfucker, der mal wieder zu schnell war oder sonstige Konfigurations- oder Softwareprobleme.
Dass bei den bescheuerten Cisco-DSL- und Kabel-Modems alle 2 Jahre das Netzteil stirbt laesst sich per ECC auch nicht fixen und das Baggerfahrer regelmaessig Kabel rausbaggern auch nicht, Handwerker mit der Hilti entziehen sich auch dem redunanten Netzteil.

Gruss Harry

Hallo Harry,

wenn da mal ein Bit kippt

… na dann kippen wir eins mit :slight_smile:
(… dabei mag ich gar kein Bier… ).

LG

Holger

Ich liebe Bier und dann viel, aber als trockener Alki waere das leider kontraproduktiv :slight_smile:

Hallo,

wie gesagt: Machen kann man fast alles. Wenn dir dann aber in einer Abschlussprüfung der Server wegen so einem Mist wegfliegt, du dafür gerade stehen musst UND unter Umständen mehr zu verlieren hast, als nur den Posten des Netzwerkberaters an der Schule…kein Thema…kannst ja weiter deinen Unterricht machen, alles schön…gibts nen neuen Netzwerkberater…die Dingen gehen ihren Gang…Mach das als Dienstleister und dir fliegt der Kram um die Ohren, können die Konsequenzen u.U. deine Existenz gefährden.

Gruß
Thomas

Hallo,
(das ist ja eine lustige Diskussion hier :grinning:),

den Vorteil von ECC-RAM sehe ich darin, dass ich mit den edac-utils im laufenden Betrieb rausfinden kann, wie es meinen RAM-Riegeln geht. Man kann das natürlich auch monitoren… Ich wollte nicht darauf verzichten, schließlich läuft ein guter MEMTEST86 bei abgeschalteter Server-Funktionalität eine Nacht lang.

Das Problem der bei einer Prüfung ausfallenden Plattform würde ich dennoch eher über Redundanzen etc. lösen. Es darf auch kein Tabu für den/die SL sein, zu wissen, dass so etwas einfach mal passieren kann. Selbst die Google-Dienst sind bei uns hier vor ein paar Wochen für 40 min. ausgefallen (!!!).

Grüßle
Christoph

Genau Christoph, der ganzen Diskussion um USV, RAID-Irgendwas und ECC-RAM muesste eigentlich eine Risikoanalyse vorausgehen und eine Erhebung, wie oft welches Versagen auftritt, also wie wahrscheinlich ein kritischer Ausfall ist, welche Ursache dieser hat und mit welchen Aufwand sich am meisten davon verhindern laesst.

Da stehen Stromausfall/Ueberspannung und dadurch Schaeden im Dateisystem, Festplattencrash und kritische Fehler im RAM-Riegel zumindest in meiner 30 jaehrigen persoenliche Serverstatistik mal ganz ganz weit hinten als Ursache, dummer Admin (mich eingeschlossen), kaputte Netzteile bei Kleingeraetschaften (Cisco-Plasterouter fuer DSL und Vodafone-Kabel) und Baggerfahrer ganz vorne und natuerlich die Helden bei Unitymedia/Vodafone, die eben mal Mutterzellen abbauen, auch wenn da noch drei Schulen dranhaengen und ein paar Geschichten von den Stadtnetzwerkern und der Telekom haette ich auch noch.

Dazu Probleme im Rechenzentrum bei Keyweb (Stromausfall ueber viele Stunden) und und und…aber so gut wie nie…

Mein Weg, schnelle Backups, auch von ganzen VMs oder nur vom Dateisystemteilen (keine Baender, Magnetbaender sucken genauso wie Hardware-RAID) und Redundanz, nicht mal richtig hotsparemaessig, ich hab noch so eine olle Sunfire, die mach ich nur an, wenn ich ein Backup einer VM mal eben aus Ausfallgruenden hurtig einspielen und starten muss (hahaha…„muesste“, gab’s naemlich noch nie).
Nix gegen RAID1 uebrigens, so eine Festplatte stirbt schonmal so alle 10 Jahre (kaputte Serverplatten hatte ich in meiner Lebenszeit genau drei).
Wenn ich das ein bisschen ueberziehe, dann soll man mir das nicht uebel nehmen, unsere schlimmen Ausfaelle lagen aber nie an Stromausfall/Ueberspannung und hier in meinem Umfeld ist aus eurer Sicht eigentlich alles mit heisser Nadel gestrickt.

Wir hatten noch nie Probleme in Abschlusspruefungen, falls da was crashen sollte, schreiben die Schueler ihren Kram auf den Desktop und ich sammel das per USB ein, fertig.
Pragmatische Loesungen, ich hab keine 10000 Auktionen pro Minute, bei denen der Preis in den letzten 5 Sekunden gemacht wird und keine 10000 Ueberweisungen pro Sekunden die sauber quittiert werden wollen.

Gruss Harry

Alles gut…bei mir hat es auch seit 30 Jahren nicht gebrannt…wozu brauch ich da einen Feuerlöscher?

1 „Gefällt mir“

Wie gesagt…wenn mir im Fehlerfall nichts weiter passieren kann, als dass ich nicht mehr Netzwerkberater an irgendeiner Schule bin…kann ich machen was ich will…Worst Case ich mach einfach Unterricht…Dann ist das alles kein Thema

Ich weiss gar nicht, was ein Netzwerkberater ist und ich will eigentlich nur, dass man die Probleme richtig gewichtet und das Problem „Server durch Stromausfall/Ueberspannung defekt“ und „Bit kippt und RAM kriegt das nicht mit.“ sind sicher nicht die grossen Probleme im Schulnetz, deshalb lohnt es sich aus meiner (!) Sicht da auch weder Geld noch Hirn zu investieren, das ist besser woanders investiert. Man muss mit den menschlichen und finanziellen Ressourcen clever umgehen.

Die Hauptprobleme im Schulnetz lassen sich nicht oder nur sehr schwer mit Geld bewerfen, auch wenn’s schoen waere.

Hatte ja schon jemand geschrieben, dass das teilweise Vorgehensweisen sind, die aus einer anderen Zeit kommen, durch viel RAM, SSDs und flotte CPUs selbst in Konsumerrechnern da I/O-Durchsatz realisierbar ist, der frueher nicht einmal im Ansatz durch Hardware-RAID mit schnellen und superteuren 15k-Platten realisierbar waren.

Gruss Harry

Das ist hier nicht das Thema: Thema ist ob es Sinn macht, Geld in ECC-RAM zu investieren, welches vor Systemabstürzen durch fehlerhafte Speicheraddressierung schützt.

Zwar ist dieser Beitrag ein bisschen offtopic, aber mich friert es immer, wenn die Leute Raid5 im Server einsetzen, hoffentlich wohl wissend, dass bei einer defekten Disk das System bei der Rekonstruktion bei einem weiteren Ausfall komplett unlesbar wird. Leute nehmt Raid6 oder Raid10, aber nur in Ausnahmen Raid5, wenn ständig woanders Backup gemacht wird.