Discussion:
RAID - Spare statt aktiv nach Plattentausch
Christian Boltz
2014-05-17 11:14:29 UTC
Permalink
Hallo zusammen,

ich habe gerade ein interessantes RAID-Problem - nachdem sich eine der
Festplatten (sdb) unsanft verabschiedet hat und ausgetauscht wurde, wird
die neue Platte als Spare statt als aktive Platte eingebunden.

Betroffen sind zwei Arrays. Da beide die gleichen Symptome haben, zeige
ich nur mal md5:

# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md5 : active raid1 sda7[0] sdb7[2](S)
104857536 blocks [2/1] [U_]

# mdadm --detail /dev/md5
/dev/md5:
Version : 0.90
Creation Time : Thu May 2 21:05:18 2013
Raid Level : raid1
Array Size : 104857536 (100.00 GiB 107.37 GB)
Used Dev Size : 104857536 (100.00 GiB 107.37 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 5
Persistence : Superblock is persistent

Update Time : Fri May 16 23:47:12 2014
State : clean, degraded
Active Devices : 1
Working Devices : 2
Failed Devices : 0
Spare Devices : 1

UUID : 67d411f5:734aa167:776c2c25:004bd7b2
Events : 0.55

Number Major Minor RaidDevice State
0 8 7 0 active sync /dev/sda7
1 0 0 1 removed

2 8 23 - spare /dev/sdb7


Wie bekomme ich das RAID dazu, sdb7 als aktive Platte statt als Spare zu
verwenden?


Die "üblichen Verdächtigen" habe ich schon durch:
- mdadm /dev/md5 --grow -n3 - dann bekomme ich eine zusätzliche
"removed-Zeile", aber sdb7 ist immer noch Spare
- mit --grow -n1 bin ich die "removed" los, das folgende --grow -n2 -a
/dev/sdb7 holt sie aber wieder hervor.
- mdadm --stop gefolgt von --assemble ändert auch nichts

Ach ja: Bei den 4 anderen RAID-Partitionen ließ sich die neue Festplatte
problemlos einbinden ("[UU]")...


Gruß

Christian Boltz
--
[Statistik] Schliesslich faelchse ich die ja selbst [...],
kann ihr also trauen... [David Haller in sl-etikette]
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Günter Ohmer
2014-05-17 13:08:08 UTC
Permalink
Hallo Christian,
Post by Christian Boltz
Hallo zusammen,
ich habe gerade ein interessantes RAID-Problem - nachdem sich eine der
Festplatten (sdb) unsanft verabschiedet hat und ausgetauscht wurde, wird
die neue Platte als Spare statt als aktive Platte eingebunden.
Betroffen sind zwei Arrays. Da beide die gleichen Symptome haben, zeige
# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md5 : active raid1 sda7[0] sdb7[2](S)
104857536 blocks [2/1] [U_]
# mdadm --detail /dev/md5
Version : 0.90
Creation Time : Thu May 2 21:05:18 2013
Raid Level : raid1
Array Size : 104857536 (100.00 GiB 107.37 GB)
Used Dev Size : 104857536 (100.00 GiB 107.37 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 5
Persistence : Superblock is persistent
Das ist ein Fall für"manage":

mdadm /dev/md5 --remove /dev/sdb7
mdadm /dev/md5 --add /dev/sdb7

schon probiert?

Viele Grüße
Günter
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Christian Boltz
2014-05-18 13:02:41 UTC
Permalink
Hallo Günter, hallo Leute,
Post by Günter Ohmer
Post by Christian Boltz
ich habe gerade ein interessantes RAID-Problem - nachdem sich eine
der Festplatten (sdb) unsanft verabschiedet hat und ausgetauscht
wurde, wird die neue Platte als Spare statt als aktive Platte
eingebunden.
Betroffen sind zwei Arrays. Da beide die gleichen Symptome haben,
# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md5 : active raid1 sda7[0] sdb7[2](S)
104857536 blocks [2/1] [U_]
mdadm /dev/md5 --remove /dev/sdb7
mdadm /dev/md5 --add /dev/sdb7
schon probiert?
Ja, wäre zu einfach ;-)

# mdadm /dev/md5 --remove /dev/sdb7
mdadm: hot removed /dev/sdb7 from /dev/md5
# mdadm /dev/md5 --add /dev/sdb7
mdadm: added /dev/sdb7
# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md5 : active raid1 sdb7[2](S) sda7[0]
104857536 blocks [2/1] [U_]

sdb7 ist wieder nur eine spare...

mdadm --detail /dev/md5 sieht noch/wieder so aus wie gestern, von daher
spare ich mir das Pasten ;-)


Gruß

Christian Boltz
--
Post by Günter Ohmer
[...] weil ich eigentlich nur was vom Gateway kopieren wollte.
Ist dir mal aufgefallen, wie oft bei der Beschreibung von Katastrophen
das Wort "nur" vorkommt? [Dicht gefolgt auf Platz 2 und 3: "eben" und
"schnell"] [> Helga Fischer und Ratti in suse-linux]
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Günter Ohmer
2014-05-18 18:55:51 UTC
Permalink
Hallo Christian,
Post by Christian Boltz
Post by Günter Ohmer
mdadm /dev/md5 --remove /dev/sdb7
mdadm /dev/md5 --add /dev/sdb7
schon probiert?
Ja, wäre zu einfach ;-)
probiere mal vorher noch:
mdadm /dev/md5 --set-faulty /dev/sdb7
Post by Christian Boltz
# mdadm /dev/md5 --remove /dev/sdb7
mdadm: hot removed /dev/sdb7 from /dev/md5
# mdadm /dev/md5 --add /dev/sdb7
mdadm: added /dev/sdb7
Das hat bei mir schon mal geholfen.

Viele Grüße
Günter
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Christian Boltz
2014-05-19 17:26:24 UTC
Permalink
Hallo Günter, hallo Leute,
Post by Günter Ohmer
Post by Christian Boltz
Ja, wäre zu einfach ;-)
mdadm /dev/md5 --set-faulty /dev/sdb7
Hatte ich auch schon durch - hilft auch nicht :-(

Auch ein --zero-superblock /dev/sdb7 (natürlich nach einem -r) ändert
nichts an der Situation.

Ich habe nochmal die allwissende Müllhalde befragt - das Problem scheint
gelegentlich vorzukommen, eine "saubere" Lösung oder Erklärung dafür
scheint es nicht wirklich zu geben.

Ratlose Fehlersuche gibt es (außer bei mir) auch auf
http://superuser.com/questions/429776/simple-mdadm-raid-1-not-activating-spare

Eine mögliche Lösung findet sich auf
https://forums.gentoo.org/viewtopic-t-847807-view-next.html - die
Empfehlung ist, das RAID zu stoppen und mit --create quasi neu
zusammenzubauen. (Die Metadaten sollte man natürlich richtig angeben,
sonst gibt es Datensalat!)

Wenn keine anderen Vorschläge kommen, teste ich das mal - aber erst sehe
ich nach, ob das Backup aktuell ist ;-)


Gruß

Christian Boltz
--
Seit wann schaut hier noch irgendeiner aufs Subject? Das hab ich mir
nur angesehen, als ich noch relativ neu war. Mittlerweile nehme ich
es nur mehr wahr, wenn es mehr als den halben Bildschirm verdeckt.
[Adalbert Michelic in suse-talk]
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Loading...