Notfallhandbuch
Mustervorlage: "Notfallhandbuch für KMU"
Strukturiertes Muster-Notfallhandbuch für kleine und mittlere Unternehmen (KMU) mit Best Practices für Notfallvorsorge, Krisenmanagement und Wiederanlauf. Basierend auf dem BSI-Standard 200-4 und ISO 22301.
Einleitung
Unsere Organisationen sieht sich zunehmend komplexen Bedrohungen gegenüber – von technischen Störungen über Cyberangriffe bis hin zu Naturereignissen oder Lieferkettenunterbrechungen. In solchen Situationen ist die Fähigkeit, schnell und wirksam zu reagieren, entscheidend für den Fortbestand der Geschäftstätigkeit und den Schutz von Werten und Vertrauen.
Dieses Notfallhandbuch bildet die zentrale Handlungsgrundlage für die Vorbereitung, Bewältigung und Nachbereitung betrieblicher Notfälle. Es konkretisiert die im Rahmen des Business Continuity Managements (BCM) etablierten Prozesse und beschreibt, wie die Organisation auch unter außergewöhnlichen Bedingungen handlungsfähig bleibt.
Ziel des Handbuchs ist es, allen betroffenen Mitarbeitenden klare, praxisgerechte und handlungsorientierte Anleitungen bereitzustellen – abgestimmt auf die individuellen Strukturen, Prozesse und Ressourcen der Organisation.
Es richtet sich insbesondere an:
- das BCM-Team und den Krisenstab,
- Führungsverantwortliche und Entscheidende in den Fachbereichen,
- operativ eingebundene Mitarbeitende sowie
- externe Dienstleistende, sofern sie in Wiederanlaufprozesse eingebunden sind.
Das Handbuch basiert auf den Anforderungen des BSI-Standards 200-4 sowie anerkannten Methoden des Business Continuity Managements gemäß ISO 22301. Es wird regelmäßig aktualisiert, getestet und im Rahmen von Schulungen und Übungen in der Organisation verankert.
Notfälle lassen sich nicht vollständig vermeiden – aber ihre Auswirkungen lassen sich wirksam beherrschen. Dieses Handbuch ist ein wesentlicher Baustein dafür.
Allgemeine Informationen und Governance
Dieses Kapitel beschreibt den Rahmen, in dem das Notfallhandbuch angewendet wird, sowie die organisatorischen Grundlagen für wirksames Business Continuity Management (BCM) in der Organisation. Es schafft Transparenz über Zweck, Geltungsbereich, Rollen und Verantwortlichkeiten.
Zweck und Geltungsbereich
Zielsetzung des Notfallhandbuchs
Das Notfallhandbuch definiert die organisatorischen und technischen Maßnahmen zur Bewältigung von Notfällen und zur Wiederherstellung des Geschäftsbetriebs. Es verfolgt folgende Ziele:
- Sicherstellung der Reaktionsfähigkeit der Organisation in Notfällen
- Minimierung wirtschaftlicher, rechtlicher und reputativer Schäden
- Einhaltung gesetzlicher und vertraglicher Anforderungen
- Förderung einer resilienten Unternehmenskultur
Es dient als verbindliche Handlungsanleitung für alle Notfallszenarien, die wesentliche Geschäftsprozesse beeinträchtigen.
Abgrenzung gegenüber Notfall- und Krisenmanagement
Das Notfallhandbuch ist das zentrale Dokument des Business Continuity Managements (BCM). Es wird im Falle eines schwerwiegenden Ereignisses aktiviert, das den Normalbetrieb stört oder unterbricht.
Abgrenzung:
- BCM: Präventive und reaktive Maßnahmen zur Aufrechterhaltung bzw. Wiederherstellung kritischer Geschäftsprozesse (strategisch-prozessorientiert)
- Notfallmanagement: Operative Bewältigung unerwarteter Störungen (reaktiv-taktisch)
- Krisenmanagement: Steuerung organisationsweiter Entscheidungen bei strategisch bedeutsamen Notlagen (kommunikativ, strategisch-politisch)
Das Handbuch ist eng verzahnt mit der operativen Incident-Response sowie dem Informationssicherheitsmanagement (ISMS).
Anwendungsbereich (Räumlich, organisatorisch, prozessual)
Räumlich:
Alle Standorte der Organisation, einschließlich externer Lager, Produktionsstätten oder angemieteter Büroflächen.
Organisatorisch:
Alle Fachbereiche, Abteilungen und Funktionsrollen, die an der Aufrechterhaltung kritischer Geschäftsprozesse beteiligt sind.
Prozessual:
Alle in der Business Impact Analyse (BIA) identifizierten kritischen oder wesentlichen Geschäftsprozesse, inkl. zugehöriger IT-Services, Infrastruktur, Lieferketten und externer Dienstleistender.
Organisation und Verantwortlichkeiten
Eine klare Rollen- und Verantwortlichkeitsverteilung ist Voraussetzung für die effektive Steuerung im Notfall. Die folgenden Strukturen sind dauerhaft etabliert und regelmäßig überprüft.
BCM-Beauftragter und Lenkungsausschuss
BCM-Beauftragte Person:
- Zentrale Koordinationsstelle für alle BCM-Aktivitäten
- Verantwortlich für Aufbau, Betrieb und Weiterentwicklung des BCM-Systems
- Ansprechpartner:in für die Geschäftsleitung, externe Prüfinstanzen und Aufsichtsbehörden
- Berichtspflicht an die Geschäftsleitung
Lenkungsausschuss BCM:
Besteht aus Vertretenden der Geschäftsleitung, IT, betroffenen Fachbereiche und ggf. Datenschutz/Informationssicherheit. Aufgaben:
- Strategische Steuerung und Ressourcenzuteilung
- Genehmigung von BCM-relevanten Konzepten
- Validierung und Freigabe von Risikoanalysen und BIA-Ergebnissen
- Regelmäßige Bewertung der BCM-Performance (z. B. jährlich)
Notfall- und Krisenstab: Rollen und Kompetenzen
Im Notfall übernimmt der Krisenstab die operative Steuerung. Die Zusammensetzung orientiert sich an der Art des Ereignisses.
Rollen:
- Leitung Krisenstab (z. B. Geschäftsführung): Gesamtverantwortung und Außenkommunikation
- BCM-Beauftragte: Koordination und Dokumentation, Verbindung zur Lenkungsgruppe
- IT-Notfallkoordinator: Technische Bewertung, Maßnahmenplanung und Wiederanlauf
- Fachbereichsvertretung: Bewertung fachlicher Auswirkungen
- Kommunikationsverantwortliche: Interne und externe Kommunikation
- Sicherheitsbeauftragte / Datenschutz (bei Bedarf): Compliance, Schutzmaßnahmen
Kompetenzen:
Der Krisenstab ist berechtigt, abweichend vom Regelbetrieb zu handeln, temporäre Maßnahmen anzuordnen und Ressourcen direkt zuzuweisen.
Eskalations- und Entscheidungswege
Eine klare Eskalationsstruktur gewährleistet schnelle Entscheidungen im Notfall:
Stufe | Beschreibung | Entscheidungskompetenz |
---|---|---|
1 | Lokaler Vorfall (z. B. IT-Störung) | Fachbereichsleitung / IT |
2 | Kritisches Ereignis (z. B. Systemausfall mit Auswirkungen auf Geschäftsprozess) | BCM-Beauftragte / IT-Leitung |
3 | Notfall (z. B. vollständiger IT-Ausfall, Gebäudeschaden) | Krisenstab |
4 | Unternehmensweite Krise (z. B. Cyberangriff mit Datenabfluss) | Geschäftsführung / Krisenstab erweitert |
Die Auslösung einer Eskalationsstufe erfolgt durch definierte Trigger, wie z. B. Unterschreitung der RTO, Sicherheitsvorfälle, Medienberichterstattung oder behördliche Anforderungen. Entscheidungen und Übergaben werden dokumentiert.
Analyse- und Planungsprozesse
Business Impact Analyse (BIA)
Die Business Impact Analyse der Organisation dient der Identifikation und Priorisierung geschäftskritischer Prozesse sowie der Festlegung von Wiederherstellungszielen. Die BIA bildet die Grundlage für die Notfallvorsorgeplanung.
Identifikation kritischer Geschäftsprozesse
Im Rahmen eines Workshops unter Beteiligung der Fachbereiche wurden die folgenden Prozesse als kritisch für die Geschäftstätigkeit der Organisation identifiziert:
Geschäftsprozess | RTO | RPO | Begründung |
---|---|---|---|
Auftragserfassung | 8 Stunden | 4 Stunden | Fortlaufende Auftragsannahme für Umsatzsicherung erforderlich |
Produktion | 4 Stunden | 1 Stunde | Produktionsunterbrechung führt zu erheblichen Folgekosten |
Warenannahme und -ausgang | 24 Stunden | 12 Stunden | Lagerpuffer verfügbar, tägliche Abwicklung ausreichend |
Fakturierung | 48 Stunden | 24 Stunden | Verzögerung kurzfristig verkraftbar |
Personalmanagement | 5 Arbeitstage | 2 Arbeitstage | Periodischer Ablauf ohne unmittelbare betriebliche Relevanz |
Wiederherstellungsziele (RTO / RPO)
Basierend auf der Auswirkungsbewertung wurden folgende Wiederherstellungszeiten (RTO) und Datenverlusttoleranzen (RPO) festgelegt:
Geschäftsprozess | RTO | RPO | Begründung |
---|---|---|---|
Auftragserfassung | 8 Stunden | 4 Stunden | Fortlaufende Auftragsannahme für Umsatzsicherung erforderlich |
Produktion | 4 Stunden | 1 Stunde | Produktionsunterbrechung führt zu erheblichen Folgekosten |
Warenannahme und -ausgang | 24 Stunden | 12 Stunden | Lagerpuffer verfügbar, tägliche Abwicklung ausreichend |
Fakturierung | 48 Stunden | 24 Stunden | Verzögerung kurzfristig verkraftbar |
Personalmanagement | 5 Arbeitstage | 2 Arbeitstage | Periodischer Ablauf ohne unmittelbare betriebliche Relevanz |
Risikoanalyse
Die Risikoanalyse bewertet, welchen Gefährdungen die kritischen Prozesse der Organisation ausgesetzt sind, und hilft, geeignete Maßnahmen zur Risikominimierung abzuleiten.
Bedrohungen und Schwachstellen
Für die Organisation wurden unter Einbezug von IT, Produktion und Verwaltung folgende typische Bedrohungsszenarien identifiziert:
- Stromausfall am Hauptstandort
- Schadsoftware (z. B. Ransomware) im ERP-System
- Ausfall des Hauptservers (z. B. Festplattendefekt)
- Personalausfall (z. B. durch Grippewelle oder Streik)
- Gebäudebrand in Lager- oder Produktionshalle
Schwachstellen ergeben sich u. a. durch:
- Fehlende Vertretungsregelungen für Schlüsselpersonen
- Veraltete Hardware ohne Redundanz
- Unzureichende Datensicherung oder Offsite-Backup
- Mangelnde Awareness bei Mitarbeitenden
Risikobewertung
Risiken werden anhand der Skalen „Eintrittswahrscheinlichkeit“ und „Schadensausmaß“ auf einer Skala von 1 (niedrig) bis 5 (hoch) bewertet.
Bedrohung | Eintrittswahrsch. | Schadensausmaß | Risikowert | Einstufung |
---|---|---|---|---|
Ransomware | 4 | 5 | 20 | Hoch |
Stromausfall | 3 | 4 | 12 | Mittel |
Serverdefekt | 3 | 3 | 9 | Mittel |
Personalausfall | 2 | 3 | 6 | Gering |
Gebäudebrand | 1 | 5 | 5 | Gering |
Risikopriorisierung
Für Risiken mit hohem und mittlerem Risikowert werden von der Organisation Risikobehandlungsmaßnahmen definiert. Diese umfassen sowohl technische Maßnahmen (z. B. USV, Backup, Firewalls) als auch organisatorische Regelungen (z. B. Notfallvertretungen, Awareness-Schulungen).
Strategieentwicklung und Prävention
Die Organisation entwickelt basierend auf den Ergebnissen von BIA und Risikoanalyse geeignete Vorsorgestrategien.
Kontinuitätsstrategien
Beispielhafte Strategien der Organisation:
- Ausweicharbeitsplätze für Schlüsselpersonal mit VPN-Zugang
- Cloud-basierte Backup- und Wiederherstellungslösung
- Nutzung externer Lohnbüros bei Ausfall der internen HR-Abteilung
- Vereinbarungen mit Dienstleistern zur Notfallproduktion (z. B. Lohnfertiger)
Technisch-organisatorische Maßnahmen
- Tägliche inkrementelle und wöchentliche Vollsicherung aller geschäftskritischen Systeme
- Regelmäßige Prüfung der Wiederherstellbarkeit (Restore-Test)
- Schulung der Mitarbeitenden zum Verhalten im Notfall
- IT-Redundanz durch virtualisierte Systeme mit Failover-Funktion
Integration in das Risikomanagement
Alle Ergebnisse aus der BIA und Risikoanalyse werden in das übergreifende Risikomanagement der Organisation eingebunden. Die Schnittstellen zu anderen Managementsystemen (z.B. ISMS, Datenschutz) sind dokumentiert und werden regelmäßig überprüft.
Operative Notfallreaktion, Wiederanlauf und Review
Dieses Kapitel beschreibt die konkreten Abläufe zur Reaktion auf einen Notfall, zur Wiederherstellung der Betriebsfähigkeit sowie zur kontinuierlichen Verbesserung des Notfallmanagements. Es richtet sich an alle Beteiligten im Krisenfall und dient als Handlungsgrundlage.
Alarmierungs- und Meldeverfahren
Interne Alarmierung (Automatisierte Systeme, Telefonketten)
Die Organisation betreibt ein abgestuftes internes Alarmierungssystem. Dieses soll sicherstellen, dass im Notfall alle relevanten Personen schnell und zuverlässig informiert werden.
Beispielhafte Mechanismen:
- Automatisierte Alarmierung über Monitoring-Tools bei IT-Ausfällen
- Vordefinierte Telefon-/Messenger-Ketten für alle kritischen Bereiche
- E-Mail-/SMS-Alarmserver mit Eskalationsstufen
Beispiel: Interne Alarmierung IT-Ausfall
- Monitoring erkennt Ausfall eines Servers
- Automatisierter Alarm an IT-Notfallkoordinator
- Aktivierung der Telefonkette für das Notfallteam
- Dokumentation des Vorfalls im Ereignisprotokoll
Externe Benachrichtigung (Behörden, Dienstleister, Medien)
Je nach Art und Ausmaß des Notfalls werden externe Stellen informiert:
- Polizei, Feuerwehr bei physischen Schäden oder Gefahr für Personen
- Aufsichtsbehörden (z. B. Datenschutzbehörde bei Datenpannen)
- IT-Dienstleister zur Unterstützung bei technischer Wiederherstellung
- Versicherungen zur Schadenmeldung
- Öffentlichkeit und Medien, gesteuert durch die Kommunikationsverantwortlichen
Für jede Kategorie existieren Kontaktlisten mit primären und sekundären Ansprechpersonen. Die Entscheidung zur externen Benachrichtigung liegt beim Krisenstab.
Notfall- und Krisenmanagement
Einberufung und Arbeitsweise des Krisenstabs
Der Krisenstab wird einberufen, wenn ein Notfallereignis die operative Steuerung durch die regulären Abläufe überfordert.
Zusammensetzung:
- Notfallbeauftragte (Leitung)
- IT-Notfallkoordinator
- Vertretung der betroffenen Fachbereiche
- Kommunikationsverantwortliche
- Bei Bedarf: Datenschutzbeauftragte, externe Berater
Arbeitsweise:
- Schnelle Bewertung der Lage („Lagebild“)
- Definition und Priorisierung der Maßnahmen
- Regelmäßige Lagebesprechungen (z. B. alle 2 Stunden)
- Dokumentation aller Entscheidungen
Sitzungen finden physisch oder virtuell statt (Krisenraum, Videokonferenzsystem).
Entscheidungs- und Eskalationsprozesse im Incident Response
Im Rahmen der Notfallreaktion gelten definierte Entscheidungs- und Eskalationswege:
Beispielhafte Eskalationsstufen:
- Stufe 1: Betriebsstörung – lokale Bearbeitung
- Stufe 2: Kritischer Vorfall – Einbindung Notfallteam
- Stufe 3: Notfall – Einberufung Krisenstab
Entscheidungsbefugnisse:
- Technische Maßnahmen: IT-Notfallkoordinator
- Kommunikationsfreigaben: ausschließlich durch die Organisationsleitung oder Kommunikationsverantwortliche
- Wiederanlaufentscheidungen: Krisenstab
Alle Entscheidungen werden nachvollziehbar protokolliert.
Wiederanlauf- und Recovery-Pläne
IT-Wiederanlauf (System- und Datenwiederherstellung)
Der IT-Wiederanlauf erfolgt auf Basis dokumentierter Recovery-Pläne:
Ablaufschema:
- Systemdiagnose und Fehleranalyse
- Wiederherstellung der Infrastruktur (z. B. Server, Netzwerk)
- Restore der Daten aus Backups (unter Beachtung RPO)
- Verifizierung der Datenintegrität und Funktionalität
- Übergabe an Fachbereiche
Werkzeuge:
- Backup-Software (z. B. Veeam, Acronis)
- Recovery-Dokumentation mit IP-Plänen, Serverrollen, Zugangsdaten
Tests der Wiederherstellung (z.B. quartalsweise) werden dokumentiert.
Infrastruktur- und Logistik-Recovery
Die Organisation verfügt über definierte Wiederherstellungsstrategien für Gebäude, Maschinen und logistische Abläufe:
Beispielhafte Maßnahmen:
- Umzug in Ausweichstandort bei Gebäudeschaden
- Nutzung externer Logistikdienstleister bei Ausfall eigener Fahrzeuge
- Notstromversorgung über mobile Generatoren
- Alternative Lieferantennutzung bei Ausfall eines Hauptlieferanten
Die Reaktivierung kritischer Versorgungswege erfolgt koordiniert durch den Krisenstab.
Priorisierte Wiederanlaufreihenfolge der Geschäftsprozesse
Die Wiederanlaufreihenfolge basiert auf der BIA (vgl. Kapitel 2). Beispielhafte Reihenfolge:
- Produktionssteuerung (MES)
- Auftragserfassung / ERP
- Kommunikation (E-Mail, Telefonanlage)
- Lagerverwaltung / Versand
- Buchhaltung / Faktura
- HR-Systeme
Diese Reihenfolge wird jährlich validiert und bei Prozessveränderungen angepasst.
Übungen, Training und kontinuierliche Verbesserung
Test- und Übungskonzepte (Tischübungen, Volltests)
Die Organisation führt regelmäßig Übungen durch, um die Wirksamkeit der Notfallvorsorge zu überprüfen:
- Tischübungen (1–2x pro Jahr): Szenarienbasiertes Durchspielen im Krisenstab
- Technische Wiederherstellungstests (quartalsweise): Test-Backups und Restore einzelner Systeme
- Vollübung (alle 2 Jahre): Kombination aus IT-Ausfall und Personalnotstand
Ergebnisse werden dokumentiert und ausgewertet.
Lessons Learned und Anpassung des Handbuchs
Nach jedem Notfall oder jeder Übung wird ein Lessons-Learned-Prozess durchgeführt:
- Dokumentation der Abweichungen vom Plan
- Bewertung der Effektivität der getroffenen Maßnahmen
- Vorschläge zur Optimierung (z. B. neue Rollen, andere Kommunikationsmittel)
Das Notfallhandbuch wird mindestens jährlich aktualisiert.
Monitoring und Performance-Kennzahlen (KPIs)
Die Organisation erfasst qualitative und quantitative Kennzahlen zur Bewertung der Notfallmanagementprozesse:
Beispiele für KPIs:
- Durchschnittliche Wiederanlaufzeit (RTO) pro System
- Erfolgsquote bei Wiederherstellungstests
- Anteil geschulter Mitarbeitender im BCM
- Anzahl dokumentierter Lessons Learned pro Jahr
Diese Kennzahlen werden im Rahmen des Management-Reviews analysiert und als Basis für Verbesserungen genutzt.
Schlussbemerkung
Revision
Diese Richtlinie wird regelmäßig, jedoch mindestens einmal pro Jahr, durch den Regelungsverantwortlichen auf Aktualität und Konformität geprüft und bei Bedarf angepasst.
Inkrafttreten
Das Notfallhandbuch der Organisation tritt zum 01.01.2222 in Kraft.
Freigegeben durch: Organisationsleitung
Ort, 01.12.2220,
Unterschrift, Name der Leitung