NetBSD/i386 Raidframe を直しましょう。 それも SCSI3 Ultra320 という今やレア(?)なハードディスクです。 まさに誰トク?情報です

追記: 結局、機材自体を新しくしました。 と言っても入れ替えた機材自体も十分古い世代の業務用サーバですけど:-) (RAID設定はともかく、動きはするので)、この子はセカンダリ(予備機材)として頑張ってもらうことにしました

(そよかぜの)プロローグ

/dev/sd1aが見えなくなった、あいかわらず/dev/sd1eは使用可能だけれど。

リビルドをかけようとしても /dev/sd1a が反応しない。 もう、このハードディスクをあきらめるべき時期ということでしょう。 もう25年ものくらい(ウィスキーか!?)なので、しょうがないです。 いや、むしろ、よく保ったとほめてあげないといけませんね

ses0 at scsibus0 target 11 lun 0: <SDR, GEM318, 0> processor fixed
sd0  at scsibus1 target 0 lun 0: <SEAGATE, ST373207LC, 0003> disk fixed
sd1  at scsibus1 target 2 lun 0: <SEAGATE, ST373207LC, 0003> disk fixed

   ... 省略  ...

raid0: Components: /dev/sd0a component1[**FAILED**]

ハードウエアの謎を解く

そういえば、 このサーバ(HP NetServer LP 2000r)は、 ハードディスクが最大6本はいりますが、 実際に入っているのは3本だけ。 そして、ハードディスクが3本はいっているのに、 2本しか見えていないのでした。 あれ?こわれてる?

そういえば、わりと初期から、そうだったことを、だんだん思い出してきた …

でも3つLEDがついていてハードウエアとしては中途半端に認識はしているらしい。 しょうがないので、 (2個はずし)1個ずつ残して起動してみて、 ハードウエアを検品するところからリスタートとなってしまった

結論は、

  • 左上から右下へSCSI ID = 0 1 2 3 4 5 と認識するらしい
  • HDD側でSCSI IDの設定をしているわけではなくて挿す場所しだい
  • ID 0 2 だけで起動すると普段どおりの構成でOK
  • ID 1 (左の真ん中,縦にHDDを三台収容する形)のバックプレーン側が怪しい?
    • ID 2 のハードディスクが無い場合にはID 1が見えるらしい
    • では ID 2 のハードウエアがおかしくてID 1が影響を受けている?
    • たしかにBIOSチェックの時に、ID 2で、しばらく刺さる(待っていれば先に進む)。 ID 2は疑わしいけれど、 普通に長年つかえているので問題はないような気がするのですが… 困りましたね

ではID 1のハードディスクを右側に移動すればよいのでは?というと、 はい、3台みえるようになりました! でも、右側(ID 3 4 5)側を先にカーネルが attach してしまう。 それはsd0ではなくてsd2を期待しているハードディスクだよ〜 orz

ハードウエア問題を無理やり解決してみる

kernelがアタッチする順番を考えてディスクをさせば良いはずなんですけどね… 運用しているサーバで、そんな実験を繰り返すのもイケてないので、 この実験は、この子が引退するときにしましょう