Wenn man unter Windows 2008 das Kommando devbra -dev ausführt, so wird unter Umständen kein Ergebnis zurückgeliefert. In diesem Fall ist die Benutzerkontensteuerung dafür verantwortlich. In diesem Fall muss der Command Prompt als Administrator ausgeführt werden und schon wird ein Ergebnis angezeigt.
Autor Archiv: danielbraun
What is device polling
Bestimmt jeder Data Protector Kunde mit einer Fibre Channel Tape Library hat dieses Problem schon mal wissentlich oder unwissentlich erlebt: ein SCSI Reset während einer Sicherung… und das ganze Band ist zerstört. Was war passiert? Das Bandlaufwerk wurde mit SCSI Kommandos überschüttet – das nennt man auch Device Polling.
Polling ist das Verhalten eines Dienstes welches Bandlaufwerk bzw. Library-Controller über IFC (Interface Controller) oder NSR (Network Storage Router) in regelmäßigen Abständen mit SCSI-Befehlen abfragt. Dies kann ein Backup stören da der NSR jede Menge zusätzlicher Befehle verarbeiten muss, die nicht vom Backup kommen.
Mögliche Resultate:
- Beinflussung der Backupgeschwindigkeit
- I/O Fehler
- Die Backupsoftware meldet das Band als „Poor“
- Das Band Laufwerk wird offline gesetzt
- Der Datendurchsatz sinkt
- Das Laufwerk streamt nicht mehr (Start/Stop modus)
Bekannte Dienste die diese Fehler provozieren:
- Netzwerk Scanner
- RSM Polling (Wechselmediendienst)
- Bandtreiber polling (z.B. hplto.sys)
- OVSAM mit altem Tachyon Treiber
- Insight Management Agents (SIM)
- Retrosopect / Retrorun (Macintosh)
Empfehlung: Polling auf allen Servern deaktivieren die Bandlaufwerke „sehen“.
Disable Device Polling
In einem anderen Artikel „What is device polling“ hatte ich beschrieben was Device Polling ist und welche Auswirkungen das auf ein backup haben kann. Hier versuche ich nun aufzuzeigen wie man Device Polling verhindert.
Bleibt zu erwähnen das nachfolgende Hinweise für anständige Hardware – HP – gelten. Wenn man gezwungen ist Data Protector auf F***** oder I** oder D*** Servern zu installieren, so ist die entsprechende Doku des Herstellers zu verwenden.
Generell gilt: Device Polling muss auf allen Servern deaktiviert werden welche Bandlaufwerke im SAN „sehen“ können. Server die nicht Bandlaufwerke sehen müssen sind in eine separate Zone auf den SAN Switchen zu schieben. Nach Möglichkeit sollte immer 1:1 Zoning genutzt werden. Auf den MSL 6000 kann es helfen eine leere indexed map zu haben (somit werden neue Server nicht zugeordnet) und eine zusätzliche Map im NSR zu generieren.
- Deaktivieren von Netzwerkscannern: NMAP oder 3com Network Director sind dafür bekannt Netzwerktraffic auf dem NSR zu senden, der sporadische Reboots der NSR’s verursachen kann. Scans sollte nur in der backupfreien Zeit stattfinden.
- Unter Windows werden sogenannte TUR (Test Unit Ready) Komanndos in periodischen Abständen an den SCSI Bus gesendet (Windows 2000 – alle 3 Sekunden, Windows 2003 – jede Sekunde). Dieses Verhalten tritt sofort auf wenn ein neuer Server installiert wird und dieser Server SAN Zugriff hat. Windows 2008 ist nur dann betroffen, wenn dort der Wechselmediendienst (RSM) als zusätzliches Feature installiert wird. Prinzipiell ist der Wechselmediendienst zu deaktivieren und zusätzlich dem Bandlaufwerkstreiber TUR zu entwöhnen (siehe auch Folgepunkt). Microsoft hat hierfür einen KB Artikel 842411: http://support.microsoft.com/default.aspx?scid=kb;en-us;842411. Zusätzlicher Hinweis: wenn man einen Server abschaltet und für neue Zwecke neu installieren möchte, so sollte man auch das Zoning beim „Rückbau“ überprüfen, da beim Neuinstallieren des Servers mit Windows das Problem sofort wieder auftreten kann.
- Für HP LTO muss die aktuellste Version der Treiber eingesetzt werden, da eine ältere Version (1.0.3.0) im Installationsfile das Polling immer aktiviert. Prinzipiell muss der folgende Registry Key für jedes Laufwerk (Laufwerkstyp – hplto, hpdlt, …) eingetragen werden und danach der Server neu gestartet werden, unter Umständen muss auch der NSR neu gestartet werden. Die Schritte sind auch für die Robotic notwendig (libxprmc, hpmc oder hpuln32).
- HKLM\SYSTEM\CurrentControlSet\Services\hplto
- neuen DWORD anlegen, Name AutoRun, Wert=0
Auch auf UNIX kann es zum Pollen der Devices kommen:
- HP-UX 11.23 (v2) reicht es aus den Kernel Parameter st_san_safe zu setzen –>
kctune st_san_safe=1 - Für HP-UX 11.31 (v3) gibt es einen neuen Parameter, hierfür ist jedoch Patch PHKL_36312 erforderlich:
- Setzen des Wertes:
scsimgr set_attr -d estape -a norewind_close_disabled=1 - Speichern des Wertes:
scsimgr save_attr -d estape -a norewind_close_disabled=1 - Überprüfen des Wertes:
scsimgr - estape get_attr
Und wie kann man das dann alles noch kontrollieren? Auf einem NSR kann man die Traces leeren und bei nichtlaufendem Backup prüfen wieviele Einträge geschrieben werden, device polling würde hier sehr viele Einträge in Sekunden anzeigen.
Anmerkung generell: Polling wird zwar immer noch passieren, aber mit den ergriffenen Maßnahmen nicht mehr in der Masse. Ein unter HP-UX abgesetztes ioscan, unter Windows ausgeführtes „Nach geänderter Hardware suchen“ oder ein ausgeführtes LTT werden trotzdem ein wenig device polling durchführen, dieses Verhalten ist aber in einem akzeptablen Maße.
Und weil ich grade LTT erwähnt habe. Dieses Tool kann mittlerweile auch genau dokumentieren welcher HBA TUR verursacht; mit einer sauber gepflegten SAN Doku sollte man dann sehr schnell den verursachenden Server finden können. Das LTT Tool gibt es übrigens hier: (Wusstet hier dass es das Tool für Netware gibt? – Ich bin Master CNE…)http://h20000.www2.hp.com/bizsupport/TechSupport/DriverDownload.jsp?lang=de&cc=de&prodNameId=406731&taskId=135&prodTypeId=12169&prodSeriesId=406729&lang=de&cc=de
Advisory c02618631
Unter der Dokument ID c02618631 ist am 19.11.2010 bei HP zu Data Protector 6.11 ein Advisory erschienen, welches ein Problem bei der Verwendung der GUI nach Installieren des Patch DPWIN_00483; ein Anlegen von Integrationsbackup ist nicht mehr möglich, da das Browsen der Instanzen nicht mehr funktioniert.
Es gibt eine Lösung, das Kopieren der alten GUI Bestandteile und verwenden des VEPA Patches auf dedizierten Servern.
Der vollständige Artikel kann hier nachgelesen werden: http://h20000.www2.hp.com/bizsupport/TechSupport/Document.jsp?objectID=c02618631&dimid=1004694894&dicid=alr_nov10&jumpid=em_alerts/us/nov10/all/xbu/emailsubid/mrm/mcc/loc/rbu_category/alerts
UPDATE: DPWIN_490 behebt das Problem, siehe Artikel Patches.
Cannot Create Integration Backups when Patch DPWIN_00483 is installed
Wenn der Patch DPWIN_00483 (VEPA Patch) installiert ist, kann man auf dem Client über die GUI kein Backup (Exchange, SQL, …) mehr anlegen. In der GUI bleibt ausgegraut nach der Instanz zu browsen. Die Ursache hierfür ist ein Bug in der ausgetauschten manager.exe durch den Patch DPWIN_000483. Als Workaround kann hier die JAVA GUI genutzt werden in der dieses Verhalten nicht sichtbar ist. HP hat hierzu auch ein Advisory herausgegeben, siehe Advisory Sektion.