Seltsame HDD-Auslastung bei Suse 8.2

Hallo,

wir haben zur Zeit ein ganz massives Problem mit unserem Server hier in der Arbeit. Der Server ist ein Fujitsu-Siemens TX200 mit Raid5 und Suse Linux 8.2 drauf. Seit einiger Zeit hat das Problem nun massive „Hänger“, obwohl das System eine Przessorauslastung von nur ca. 5-10% aufweist. Wenn man nun den Befehl iostat -x eingibt, dann schaut auch noch alles vollkommen normal aus. gibt man jedoch z.B. iostat -x 2 10 ein, dann bekomme ich da bei manchen Partitionen ab dem zweiten Durchgang Werte

Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s
wkB/s avgrq-sz avgqu-sz await svctm %util
/dev/sda7 0.20 8.00 4.40 4.40 36.80 99.20 18.40 49.60 15.45 8589886.37 133.86 111.82 98.40
/dev/sda8 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 8589924.59 0.00 0.00 100.00

Besonders absolut auffällig ist hier der Wert bei avgqu-sz. Besonders interessant ist dabei, dass /dev/sda7 vollkommen leer ist.

Nun hatte ich Fujitsu schon im Haus und hab den Server und das Raid testen lassen. Angeblich alles vollkommen ok und keine Hardwarefehler. Die Software- und Systemtechniker hatte ich schon auf der Anlage. Die sagen, dass es eigentlich nur ein Hardwareproblem sein kann, denn wenn ganz einfache cp-Befehle auf der Anlage für 12 GB große Dateien mehrere Stunden dauern, dann ist das vollkommen einleuchtend ein Hardwareproblem. Noch dazu, wenn man die Plattenauslastung bei dem vollkommen leeren Filesystem betrachtet.
Leider fällt mir jetzt auch keinerlei Idee mehr ein, wo ich suchen könnte, oder was hier die Ursache sein könnte.

Vielleicht hat ja irgendwer einen praktikablen Tipp, was ich noch schauen oder tun könnte.

Gruß

Thomas

Hallo,

wir haben zur Zeit ein ganz massives Problem mit unserem
Server hier in der Arbeit. Der Server ist ein Fujitsu-Siemens
TX200 mit Raid5 und Suse Linux 8.2 drauf.

Wow, SuSE 8.2 ist echt alt. Hoffentlich an keinem öffentlich erreichbaren Netz …

Seit einiger Zeit
hat das Problem nun massive „Hänger“, obwohl das System eine
Przessorauslastung von nur ca. 5-10% aufweist.

[…]

Vielleicht hat ja irgendwer einen praktikablen Tipp, was ich
noch schauen oder tun könnte.

In die Log-Files hast Du vermutlich schon gesehen? Mitunter stehen im Syslog interessante Dinge, die Festplatten-Hänger eingrenzen.

Hast Du eine Möglichkeit, unter der alten SuSE S.M.A.R.T.-Parameter auszulesen („smartctl“)?

Gruß,

Sebastian

Hallo,

Wow, SuSE 8.2 ist echt alt. Hoffentlich an keinem öffentlich
erreichbaren Netz …

das ist ein hausinterner Datenbankserver. Ich kann daran nur nicht so ohne Weiteres irgendwelche Updates machen, weil sonst auch so manche andere Software wie Informix etc. upgedatet werden müßte, was allein der notwendigen Lizenzen wegen so im Bereich zwischen 20000 und 30000 Euro liegt.

In die Log-Files hast Du vermutlich schon gesehen? Mitunter
stehen im Syslog interessante Dinge, die Festplatten-Hänger
eingrenzen.

Ich selbst nicht, da bin ich nicht so fit um da allzuviel herauslesen zu können. Ein Techniker von Fujitsu-Siemens selbst hat die LOG-Files durchgeschaut und ist felsenfest davon überzeugt, dass kein Hardwaredefekt vorliegt.
Trotzdem meldet mir interessanterweise der iostat -x eine massive Plattenauslastung gerade z.B. für eine Partition, die komplett leer und unbenutzt ist.

Hast Du eine Möglichkeit, unter der alten SuSE
S.M.A.R.T.-Parameter auszulesen („smartctl“)?

Weiß ich leider nicht. Kannst Du mir da ein paar mehr Infos dazu geben. Ich bin leider kein Linux-Sepzialist. Nur so zur Vorabinfo… Da ist keine grafische Oberfläche installiert.

Alternativ könnte ich hier ja hier z.B. mit Knoppix oder so schauen, wenn ich den Server über die CD boote, wenn dieses System selbsttätig den richtigen Raid-Controller erkennt und damit umgehen kann. Da bin ich leider wieder überfragt, ob da irgend eine Version automatisch mit diesem RAID-System umgehen kann.

Vielleicht kannst Du mir da ja noch Tipps geben.

Gruß

Thomas

1 Like

Hallo,

Wow, SuSE 8.2 ist echt alt. Hoffentlich an keinem öffentlich
erreichbaren Netz …

das ist ein hausinterner Datenbankserver. Ich kann daran nur
nicht so ohne Weiteres irgendwelche Updates machen, weil sonst
auch so manche andere Software wie Informix etc. upgedatet
werden müßte, was allein der notwendigen Lizenzen wegen so im
Bereich zwischen 20000 und 30000 Euro liegt.

Und alle so: Yeah!

In die Log-Files hast Du vermutlich schon gesehen? Mitunter
stehen im Syslog interessante Dinge, die Festplatten-Hänger
eingrenzen.

Ich selbst nicht, da bin ich nicht so fit um da allzuviel
herauslesen zu können. Ein Techniker von Fujitsu-Siemens
selbst hat die LOG-Files durchgeschaut und ist felsenfest
davon überzeugt, dass kein Hardwaredefekt vorliegt.

Nun ja, der wird schon wissen, was er tut, aber mich würde ein Blick in /var/log/syslog weiterhin interessieren …

Trotzdem meldet mir interessanterweise der iostat -x eine
massive Plattenauslastung gerade z.B. für eine Partition, die
komplett leer und unbenutzt ist.

Hm.

Hast Du eine Möglichkeit, unter der alten SuSE
S.M.A.R.T.-Parameter auszulesen („smartctl“)?

Weiß ich leider nicht. Kannst Du mir da ein paar mehr Infos
dazu geben. Ich bin leider kein Linux-Sepzialist. Nur so zur
Vorabinfo… Da ist keine grafische Oberfläche installiert.

Schau mal, ob das Tool „smartctl“ installiert ist oder installiert werden kann.

also sowas: http://www.rpmfind.net/linux/RPM/sourceforge/s/proje…

Damit kann man das interne Fehlerprotokoll der Platten auslesen - so sie eins schreiben und der (RAID-)Controller einen dorthin lässt …

Alternativ könnte ich hier ja hier z.B. mit Knoppix oder so
schauen, wenn ich den Server über die CD boote, wenn dieses
System selbsttätig den richtigen Raid-Controller erkennt und
damit umgehen kann.

Naja, auf den Versuch käme es auf jeden Fall an … Hm, was für ein RAID-Controller ist das denn genau?

Gruß,

Sebastian

Hi,

Nun ja, der wird schon wissen, was er tut, aber mich würde ein
Blick in /var/log/syslog weiterhin interessieren …

willst Du es haben? :smile:

Hm.

Schau mal, ob das Tool „smartctl“ installiert ist oder
installiert werden kann.

Wie schau ich denn da am einfachsten nach?

also sowas:
http://www.rpmfind.net/linux/RPM/sourceforge/s/proje…

Damit kann man das interne Fehlerprotokoll der Platten
auslesen - so sie eins schreiben und der (RAID-)Controller
einen dorthin lässt …

Ich schau mal, ob ich damit was anfangen kann und ob man das evtl. nachinstallieren kann, wenn es ist.

Naja, auf den Versuch käme es auf jeden Fall an … Hm, was
für ein RAID-Controller ist das denn genau?

Es handelt sich um einen Adaptec 2010S.
Der Fujitsu-Techniker hat mir ASR-2010S/48MB/FSC/ADT:2031000 dazu geschrieben.

Gruß

Thomas

1 Like

Moin,

Schau mal, ob das Tool „smartctl“ installiert ist oder
installiert werden kann.

Wie schau ich denn da am einfachsten nach?

In ner Konsole (ggf als root):

smartc >TABTABTAB passendes (software)modul auswählen und nach >smartctl

Hallo,

In ner Konsole (ggf als root):

smartc >TABTABTAB passendes (software)modul auswählen und nach
>smartctl

1 Like

smartmontools
Moin,

demnach scheint es nicht installiert zu sein, zumindest konnte
ich es nirgends finden.

such mal nach
smartmontools

HTH
J~

Hi,

Schau mal, ob das Tool „smartctl“ installiert ist oder
installiert werden kann.

also sowas:
http://www.rpmfind.net/linux/RPM/sourceforge/s/proje…

Damit kann man das interne Fehlerprotokoll der Platten
auslesen - so sie eins schreiben und der (RAID-)Controller
einen dorthin lässt …

so, das hab ich jetzt installiert. Einmal etwas, was ohne jegliche Fehlermeldung durchgelaufen ist. :smile:
Kann mir jetzt noch wer sagen, wie das funktioniert und wie man das benutzt?

Gruß Thomas

1 Like

Ich habs jetzt installiert. Leider habe ich keine Ahnung, wie das funktioniert. :frowning:

1 Like