Hohe Temperatur und BBU-Probleme bei neuem HW-RAID-Controller

Hallo,

nach viel Recherchieren und einlesen habe ich es endlich geschafft, zumindest Kommandozeilen-Tools für meinen Broadcom LSI 9361-8i RAID-Controller zu installieren, die den Controller auch finden.

Ein so schönes grafisches Tool für DAU wie mich gibt es aber nicht, oder zumindest nicht so einfach. Siehe auch Webzugriff auf Broadcom LSI 9361-8i RAID-Controller

Die Konsolentools liefern 2 Ausgaben, die mir gar nicht gefallen:
Ausgabe von megasasctl

a0 LSI MegaRAID 9361-8i encl:1 ldrv:2 batt:FAULT, low
voltage, high temperature, charge failed
a0d0 139GiB RAID 1 1x2 optimal
a0d1 7450GiB RAID 5 1x5 optimal
hot spares : a0e252s7
a0e252s0 139GiB a0d0 online
a0e252s1 139GiB a0d0 online
a0e252s2 1863GiB a0d1 online
a0e252s3 1863GiB a0d1 online
a0e252s4 1863GiB a0d1 online
a0e252s5 1863GiB a0d1 online
a0e252s6 1863GiB a0d1 online
a0e252s7 1863GiB hotspare

Auszug aus der Ausgabe von megacli -AdpAllInfo -aAll

ROC temperature : 63 degree Celsius

Der neue Server mit diesem Controller befindet sich diese Woche quasi noch im Leerlauf. Ich möchte nicht wissen, wie hoch die Temperatur des Controllers steigt, wenn intensive Schreib- und Lesevorgänge stattfinden.

Der Server steht in einem auf 20°C klimatisierten Raum, daran liegt das also definitiv nicht.

Wenn ich das Gehäuse öffne und mir anschaue, dass durch ein Klarsichtplexiglas ein abgeschlossener, definierter Luftstrom durch die CPU-Kühler erzeugt wird und die Steckkarten für NIC und RAID-Controller somit keinem nennenswerten Luftstrom ausgesetzt sind, wundert mich die Temperatur nicht.

Angesichts der Temperatur der RAID-Karte wundert mich auch nicht der von megasasctl ausgegebene Zustand der BBU.

Auch wenn man im Internet nach dem Problem sucht, wird man schnell fündig:
http://www.tomshardware.co.uk/forum/id-2903961/lsi-9361-raid-card-hot-temperature-heat-limit-solutions.html

Ich habe bei dem Händler schon 2 Server gekauft (auch den bis dato produktiv eingesetzten) und war mit beiden vollauf zufrieden. Beim neuen scheint aber irgendwas nicht zu passen, oder bin ich zu paranoid?

Viele Grüße
Steffen

Hallo,

ok, also 63°C liegt definitiv außerhalb der Spezifikation:
https://www.future-x.de/images/datasheet/s115901.pdf

Maximale Umgebungstemperatur: Controller-Karte: 55 °C mit optionalem
CacheVault-Zubehör (LSICVM02): 55 °C

Na prima. Jetzt kann ich wohl alle VMs wieder auf den alten Server zurück umziehen…

Viele Grüße
Steffen

Hallo Steffen,

ok, also 63°C liegt definitiv außerhalb der Spezifikation:

wiso?
Da steht „Umgebungstemperatur“ nicht Chiptemperatur.
Hast du 63 °C im Gehäuse?
das war doch die Chip Temperatur.

Na prima. Jetzt kann ich wohl alle VMs wieder auf den alten Server
zurück umziehen…

… nun ja: da kann man normalerweise schon was machen.
In dem einen Tread den du gepostet hast schreibt der Nutzer von 91°C,
was der Controller ausliest (also Chiptemperatur).
Das würde ich auch hoch finden. 63 °C find ich jetzt noch nicht so
schockierend.

Kannst du ihm mehr Luft verschaffen?
Kann man mehr Gehäuselüfter einbauen/besser platzieren?
Kann man die Karte in einen anderen Slot stecken?

LG

Holger

Hallo Holger,

du hast natürlich Recht. Da ist die Umgebungstemperatur gemeint. Systemtemp ist laut Sensoren bei 22°C und peripheral temp bei 28°C - wobei ich nicht weiß, was genau mit peripheral gemeint ist.
Der Raum kann keine 28°C haben. Die Klimaanlage ist auf 20°C eingestellt.

Finde ich im Idle schon hoch. Hab aber gerade auch nochmal mit dem Lieferanten telefoniert und der meinte, dass die LSI RAID Karten ihrer Erfahrung nach immer recht heiß werden es aber trotzdem eigentlich nie Probleme damit gibt.

Ich hab vorhin mal die Lüftersteuerung von optimal auf full speed gesetzt. Laut Software-Tool megaclisas-status ist die Temperatur jetzt trotzdem 65°C (gestern abend 63°C). Laut RAID-BIOS war die Temperatur gestern abend sogar noch höher als mit dem Tool ausgelesen. Was das RAID-BIOS sagt weiß ich nicht, dazu müsste ich in die Schule un den Server neu starten.

Nein. Hinter den HDs befinden sich schon 3 Lüfter übereinander. Mehr Platz hat’s da nicht (mehr rechtsseitig grün auf dem Bild zu sehen). Hinten sind 2 Lüfter und darunter die Slotbleche.

Das Problem das ich sehe ist, dass der Luftstrom durch einen Plexiglas-Luftleitkanal von den beiden oberen Lüftern hinter den HDs zu den beiden hinteren Lüftern über CPUs und Board geführt wird, um hier eine optimale Kühlung zu erzielen. Das bedeutet, dass der einzige Luftstrom, dem die Steckkarten ausgesetzt sind, der des unteren Lüfters hinter den Festplatten ist.

Die RAID-Karte ist die untere der beiden Steckkarten. Die obere ist die SFP+ Karte.

Nun ist das ja nicht der erste und einzige Supermicro-Server, der verkauft worden ist. Prinzipiell scheint das also schon zu funktionieren?!?

Theoretisch müsste man die Karten vertauschen können. ich weiß aber nicht, ob danach noch alles funktoniert. Zumindest das Umstecken der SFP+ Karte in einen anderen Slot (ganz unten ist noch ein Steckplatz frei) hat bewirkt, dass die NICs nachher anders heißen.

Ich habe gerade mal mit dem Lieferanten telefoniert und der meinte, dass die LSI RAID Karten wohl immer ziemlich warm werden und sie schon viele solche Server mit diesen Karten verkauft haben und es noch nie Probleme gab.

Er hat mir dann noch diesen Link geschickt. Das ist allerdings ein anderes Modell, um das es da geht:
https://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=5&cad=rja&uact=8&ved=0ahUKEwiZ1f7swpLWAhWDVxQKHTa_De4QFgg8MAQ&url=https%3A%2F%2Fdocs.broadcom.com%2Fdocs-and-downloads%2Fhost-bus-adapters%2F9206-16e_HBA_TemperatureAirflow_Application_Note.pdf&usg=AFQjCNEdk9pZc3UX57nK_6lm4I6Z11qTGw

Viele Grüße
Steffen

Hallo Steffen,

Er hat mir dann noch diesen Link geschickt. Das ist allerdings ein
anderes Modell, um das es da geht:
Weiterleitungshinweis

… aha: da steht nun, dass die Karte bis 102 °C verträgt: da bist du mit
den 65 °C noch bequem weg.
Jetzt würde ich mal zu Stoßzeiten schauen, wie warm sie wird.

LG

Holger