Notfallhandbuch

Aus ISMS-Ratgeber WiKi
Zur Navigation springenZur Suche springen

Mustervorlage: "Notfallhandbuch für KMU"

Strukturiertes Muster-Notfallhandbuch für kleine und mittlere Unternehmen (KMU) mit Best Practices für Notfallvorsorge, Krisenmanagement und Wiederanlauf. Basierend auf dem BSI-Standard 200-4 und ISO 22301.

Einleitung

Unsere Organisationen sieht sich zunehmend komplexen Bedrohungen gegenüber – von technischen Störungen über Cyberangriffe bis hin zu Naturereignissen oder Lieferkettenunterbrechungen. In solchen Situationen ist die Fähigkeit, schnell und wirksam zu reagieren, entscheidend für den Fortbestand der Geschäftstätigkeit und den Schutz von Werten und Vertrauen.

Dieses Notfallhandbuch bildet die zentrale Handlungsgrundlage für die Vorbereitung, Bewältigung und Nachbereitung betrieblicher Notfälle. Es konkretisiert die im Rahmen des Business Continuity Managements (BCM) etablierten Prozesse und beschreibt, wie die Organisation auch unter außergewöhnlichen Bedingungen handlungsfähig bleibt.

Ziel des Handbuchs ist es, allen betroffenen Mitarbeitenden klare, praxisgerechte und handlungsorientierte Anleitungen bereitzustellen – abgestimmt auf die individuellen Strukturen, Prozesse und Ressourcen der Organisation.

Es richtet sich insbesondere an:

  • das BCM-Team und den Krisenstab,
  • Führungsverantwortliche und Entscheidende in den Fachbereichen,
  • operativ eingebundene Mitarbeitende sowie
  • externe Dienstleistende, sofern sie in Wiederanlaufprozesse eingebunden sind.

Das Handbuch basiert auf den Anforderungen des BSI-Standards 200-4 sowie anerkannten Methoden des Business Continuity Managements gemäß ISO 22301. Es wird regelmäßig aktualisiert, getestet und im Rahmen von Schulungen und Übungen in der Organisation verankert.

Notfälle lassen sich nicht vollständig vermeiden – aber ihre Auswirkungen lassen sich wirksam beherrschen. Dieses Handbuch ist ein wesentlicher Baustein dafür.

Allgemeine Informationen und Governance

Dieses Kapitel beschreibt den Rahmen, in dem das Notfallhandbuch angewendet wird, sowie die organisatorischen Grundlagen für wirksames Business Continuity Management (BCM) in der Organisation. Es schafft Transparenz über Zweck, Geltungsbereich, Rollen und Verantwortlichkeiten.

Zweck und Geltungsbereich

Zielsetzung des Notfallhandbuchs

Das Notfallhandbuch definiert die organisatorischen und technischen Maßnahmen zur Bewältigung von Notfällen und zur Wiederherstellung des Geschäftsbetriebs. Es verfolgt folgende Ziele:

  • Sicherstellung der Reaktionsfähigkeit der Organisation in Notfällen
  • Minimierung wirtschaftlicher, rechtlicher und reputativer Schäden
  • Einhaltung gesetzlicher und vertraglicher Anforderungen
  • Förderung einer resilienten Unternehmenskultur

Es dient als verbindliche Handlungsanleitung für alle Notfallszenarien, die wesentliche Geschäftsprozesse beeinträchtigen.

Abgrenzung gegenüber Notfall- und Krisenmanagement

Das Notfallhandbuch ist das zentrale Dokument des Business Continuity Managements (BCM). Es wird im Falle eines schwerwiegenden Ereignisses aktiviert, das den Normalbetrieb stört oder unterbricht.

Abgrenzung:

  • BCM: Präventive und reaktive Maßnahmen zur Aufrechterhaltung bzw. Wiederherstellung kritischer Geschäftsprozesse (strategisch-prozessorientiert)
  • Notfallmanagement: Operative Bewältigung unerwarteter Störungen (reaktiv-taktisch)
  • Krisenmanagement: Steuerung organisationsweiter Entscheidungen bei strategisch bedeutsamen Notlagen (kommunikativ, strategisch-politisch)

Das Handbuch ist eng verzahnt mit der operativen Incident-Response sowie dem Informationssicherheitsmanagement (ISMS).

Anwendungsbereich (Räumlich, organisatorisch, prozessual)

Räumlich:

Alle Standorte der Organisation, einschließlich externer Lager, Produktionsstätten oder angemieteter Büroflächen.

Organisatorisch:

Alle Fachbereiche, Abteilungen und Funktionsrollen, die an der Aufrechterhaltung kritischer Geschäftsprozesse beteiligt sind.

Prozessual:

Alle in der Business Impact Analyse (BIA) identifizierten kritischen oder wesentlichen Geschäftsprozesse, inkl. zugehöriger IT-Services, Infrastruktur, Lieferketten und externer Dienstleistender.

Organisation und Verantwortlichkeiten

Eine klare Rollen- und Verantwortlichkeitsverteilung ist Voraussetzung für die effektive Steuerung im Notfall. Die folgenden Strukturen sind dauerhaft etabliert und regelmäßig überprüft.

BCM-Beauftragter und Lenkungsausschuss

BCM-Beauftragte Person:

  • Zentrale Koordinationsstelle für alle BCM-Aktivitäten
  • Verantwortlich für Aufbau, Betrieb und Weiterentwicklung des BCM-Systems
  • Ansprechpartner:in für die Geschäftsleitung, externe Prüfinstanzen und Aufsichtsbehörden
  • Berichtspflicht an die Geschäftsleitung

Lenkungsausschuss BCM:

Besteht aus Vertretenden der Geschäftsleitung, IT, betroffenen Fachbereiche und ggf. Datenschutz/Informationssicherheit. Aufgaben:

  • Strategische Steuerung und Ressourcenzuteilung
  • Genehmigung von BCM-relevanten Konzepten
  • Validierung und Freigabe von Risikoanalysen und BIA-Ergebnissen
  • Regelmäßige Bewertung der BCM-Performance (z. B. jährlich)

Notfall- und Krisenstab: Rollen und Kompetenzen

Im Notfall übernimmt der Krisenstab die operative Steuerung. Die Zusammensetzung orientiert sich an der Art des Ereignisses.

Rollen:

  • Leitung Krisenstab (z. B. Geschäftsführung): Gesamtverantwortung und Außenkommunikation
  • BCM-Beauftragte: Koordination und Dokumentation, Verbindung zur Lenkungsgruppe
  • IT-Notfallkoordinator: Technische Bewertung, Maßnahmenplanung und Wiederanlauf
  • Fachbereichsvertretung: Bewertung fachlicher Auswirkungen
  • Kommunikationsverantwortliche: Interne und externe Kommunikation
  • Sicherheitsbeauftragte / Datenschutz (bei Bedarf): Compliance, Schutzmaßnahmen

Kompetenzen:

Der Krisenstab ist berechtigt, abweichend vom Regelbetrieb zu handeln, temporäre Maßnahmen anzuordnen und Ressourcen direkt zuzuweisen.

Eskalations- und Entscheidungswege

Eine klare Eskalationsstruktur gewährleistet schnelle Entscheidungen im Notfall:

Stufe Beschreibung Entscheidungskompetenz
1 Lokaler Vorfall (z. B. IT-Störung) Fachbereichsleitung / IT
2 Kritisches Ereignis (z. B. Systemausfall mit Auswirkungen auf Geschäftsprozess) BCM-Beauftragte / IT-Leitung
3 Notfall (z. B. vollständiger IT-Ausfall, Gebäudeschaden) Krisenstab
4 Unternehmensweite Krise (z. B. Cyberangriff mit Datenabfluss) Geschäftsführung / Krisenstab erweitert

Die Auslösung einer Eskalationsstufe erfolgt durch definierte Trigger, wie z. B. Unterschreitung der RTO, Sicherheitsvorfälle, Medienberichterstattung oder behördliche Anforderungen. Entscheidungen und Übergaben werden dokumentiert.

Analyse- und Planungsprozesse

Business Impact Analyse (BIA)

Die Business Impact Analyse der Organisation dient der Identifikation und Priorisierung geschäftskritischer Prozesse sowie der Festlegung von Wiederherstellungszielen. Die BIA bildet die Grundlage für die Notfallvorsorgeplanung.

Identifikation kritischer Geschäftsprozesse

Im Rahmen eines Workshops unter Beteiligung der Fachbereiche wurden die folgenden Prozesse als kritisch für die Geschäftstätigkeit der Organisation identifiziert:

Geschäftsprozess RTO RPO Begründung
Auftragserfassung 8 Stunden 4 Stunden Fortlaufende Auftragsannahme für Umsatzsicherung erforderlich
Produktion 4 Stunden 1 Stunde Produktionsunterbrechung führt zu erheblichen Folgekosten
Warenannahme und -ausgang 24 Stunden 12 Stunden Lagerpuffer verfügbar, tägliche Abwicklung ausreichend
Fakturierung 48 Stunden 24 Stunden Verzögerung kurzfristig verkraftbar
Personalmanagement 5 Arbeitstage 2 Arbeitstage Periodischer Ablauf ohne unmittelbare betriebliche Relevanz

Wiederherstellungsziele (RTO / RPO)

Basierend auf der Auswirkungsbewertung wurden folgende Wiederherstellungszeiten (RTO) und Datenverlusttoleranzen (RPO) festgelegt:

Geschäftsprozess RTO RPO Begründung
Auftragserfassung 8 Stunden 4 Stunden Fortlaufende Auftragsannahme für Umsatzsicherung erforderlich
Produktion 4 Stunden 1 Stunde Produktionsunterbrechung führt zu erheblichen Folgekosten
Warenannahme und -ausgang 24 Stunden 12 Stunden Lagerpuffer verfügbar, tägliche Abwicklung ausreichend
Fakturierung 48 Stunden 24 Stunden Verzögerung kurzfristig verkraftbar
Personalmanagement 5 Arbeitstage 2 Arbeitstage Periodischer Ablauf ohne unmittelbare betriebliche Relevanz

Risikoanalyse

Die Risikoanalyse bewertet, welchen Gefährdungen die kritischen Prozesse der Organisation ausgesetzt sind, und hilft, geeignete Maßnahmen zur Risikominimierung abzuleiten.

Bedrohungen und Schwachstellen

Für die Organisation wurden unter Einbezug von IT, Produktion und Verwaltung folgende typische Bedrohungsszenarien identifiziert:

  • Stromausfall am Hauptstandort
  • Schadsoftware (z. B. Ransomware) im ERP-System
  • Ausfall des Hauptservers (z. B. Festplattendefekt)
  • Personalausfall (z. B. durch Grippewelle oder Streik)
  • Gebäudebrand in Lager- oder Produktionshalle

Schwachstellen ergeben sich u. a. durch:

  • Fehlende Vertretungsregelungen für Schlüsselpersonen
  • Veraltete Hardware ohne Redundanz
  • Unzureichende Datensicherung oder Offsite-Backup
  • Mangelnde Awareness bei Mitarbeitenden

Risikobewertung

Risiken werden anhand der Skalen „Eintrittswahrscheinlichkeit“ und „Schadensausmaß“ auf einer Skala von 1 (niedrig) bis 5 (hoch) bewertet.

Bedrohung Eintrittswahrsch. Schadensausmaß Risikowert Einstufung
Ransomware 4 5 20 Hoch
Stromausfall 3 4 12 Mittel
Serverdefekt 3 3 9 Mittel
Personalausfall 2 3 6 Gering
Gebäudebrand 1 5 5 Gering

Risikopriorisierung

Für Risiken mit hohem und mittlerem Risikowert werden von der Organisation Risikobehandlungsmaßnahmen definiert. Diese umfassen sowohl technische Maßnahmen (z. B. USV, Backup, Firewalls) als auch organisatorische Regelungen (z. B. Notfallvertretungen, Awareness-Schulungen).

Strategieentwicklung und Prävention

Die Organisation entwickelt basierend auf den Ergebnissen von BIA und Risikoanalyse geeignete Vorsorgestrategien.

Kontinuitätsstrategien

Beispielhafte Strategien der Organisation:

  • Ausweicharbeitsplätze für Schlüsselpersonal mit VPN-Zugang
  • Cloud-basierte Backup- und Wiederherstellungslösung
  • Nutzung externer Lohnbüros bei Ausfall der internen HR-Abteilung
  • Vereinbarungen mit Dienstleistern zur Notfallproduktion (z. B. Lohnfertiger)

Technisch-organisatorische Maßnahmen

  • Tägliche inkrementelle und wöchentliche Vollsicherung aller geschäftskritischen Systeme
  • Regelmäßige Prüfung der Wiederherstellbarkeit (Restore-Test)
  • Schulung der Mitarbeitenden zum Verhalten im Notfall
  • IT-Redundanz durch virtualisierte Systeme mit Failover-Funktion

Integration in das Risikomanagement

Alle Ergebnisse aus der BIA und Risikoanalyse werden in das übergreifende Risikomanagement der Organisation eingebunden. Die Schnittstellen zu anderen Managementsystemen (z.B. ISMS, Datenschutz) sind dokumentiert und werden regelmäßig überprüft.

Operative Notfallreaktion, Wiederanlauf und Review

Dieses Kapitel beschreibt die konkreten Abläufe zur Reaktion auf einen Notfall, zur Wiederherstellung der Betriebsfähigkeit sowie zur kontinuierlichen Verbesserung des Notfallmanagements. Es richtet sich an alle Beteiligten im Krisenfall und dient als Handlungsgrundlage.

Alarmierungs- und Meldeverfahren

Interne Alarmierung (Automatisierte Systeme, Telefonketten)

Die Organisation betreibt ein abgestuftes internes Alarmierungssystem. Dieses soll sicherstellen, dass im Notfall alle relevanten Personen schnell und zuverlässig informiert werden.

Beispielhafte Mechanismen:

  • Automatisierte Alarmierung über Monitoring-Tools bei IT-Ausfällen
  • Vordefinierte Telefon-/Messenger-Ketten für alle kritischen Bereiche
  • E-Mail-/SMS-Alarmserver mit Eskalationsstufen

Beispiel: Interne Alarmierung IT-Ausfall

  1. Monitoring erkennt Ausfall eines Servers
  2. Automatisierter Alarm an IT-Notfallkoordinator
  3. Aktivierung der Telefonkette für das Notfallteam
  4. Dokumentation des Vorfalls im Ereignisprotokoll

Externe Benachrichtigung (Behörden, Dienstleister, Medien)

Je nach Art und Ausmaß des Notfalls werden externe Stellen informiert:

  • Polizei, Feuerwehr bei physischen Schäden oder Gefahr für Personen
  • Aufsichtsbehörden (z. B. Datenschutzbehörde bei Datenpannen)
  • IT-Dienstleister zur Unterstützung bei technischer Wiederherstellung
  • Versicherungen zur Schadenmeldung
  • Öffentlichkeit und Medien, gesteuert durch die Kommunikationsverantwortlichen

Für jede Kategorie existieren Kontaktlisten mit primären und sekundären Ansprechpersonen. Die Entscheidung zur externen Benachrichtigung liegt beim Krisenstab.

Notfall- und Krisenmanagement

Einberufung und Arbeitsweise des Krisenstabs

Der Krisenstab wird einberufen, wenn ein Notfallereignis die operative Steuerung durch die regulären Abläufe überfordert.

Zusammensetzung:

Arbeitsweise:

  • Schnelle Bewertung der Lage („Lagebild“)
  • Definition und Priorisierung der Maßnahmen
  • Regelmäßige Lagebesprechungen (z. B. alle 2 Stunden)
  • Dokumentation aller Entscheidungen

Sitzungen finden physisch oder virtuell statt (Krisenraum, Videokonferenzsystem).

Entscheidungs- und Eskalationsprozesse im Incident Response

Im Rahmen der Notfallreaktion gelten definierte Entscheidungs- und Eskalationswege:

Beispielhafte Eskalationsstufen:

  • Stufe 1: Betriebsstörung – lokale Bearbeitung
  • Stufe 2: Kritischer Vorfall – Einbindung Notfallteam
  • Stufe 3: Notfall – Einberufung Krisenstab

Entscheidungsbefugnisse:

  • Technische Maßnahmen: IT-Notfallkoordinator
  • Kommunikationsfreigaben: ausschließlich durch die Organisationsleitung oder Kommunikationsverantwortliche
  • Wiederanlaufentscheidungen: Krisenstab

Alle Entscheidungen werden nachvollziehbar protokolliert.

Wiederanlauf- und Recovery-Pläne

IT-Wiederanlauf (System- und Datenwiederherstellung)

Der IT-Wiederanlauf erfolgt auf Basis dokumentierter Recovery-Pläne:

Ablaufschema:

  1. Systemdiagnose und Fehleranalyse
  2. Wiederherstellung der Infrastruktur (z. B. Server, Netzwerk)
  3. Restore der Daten aus Backups (unter Beachtung RPO)
  4. Verifizierung der Datenintegrität und Funktionalität
  5. Übergabe an Fachbereiche

Werkzeuge:

  • Backup-Software (z. B. Veeam, Acronis)
  • Recovery-Dokumentation mit IP-Plänen, Serverrollen, Zugangsdaten

Tests der Wiederherstellung (z.B. quartalsweise) werden dokumentiert.

Infrastruktur- und Logistik-Recovery

Die Organisation verfügt über definierte Wiederherstellungsstrategien für Gebäude, Maschinen und logistische Abläufe:

Beispielhafte Maßnahmen:

  • Umzug in Ausweichstandort bei Gebäudeschaden
  • Nutzung externer Logistikdienstleister bei Ausfall eigener Fahrzeuge
  • Notstromversorgung über mobile Generatoren
  • Alternative Lieferantennutzung bei Ausfall eines Hauptlieferanten

Die Reaktivierung kritischer Versorgungswege erfolgt koordiniert durch den Krisenstab.

Priorisierte Wiederanlaufreihenfolge der Geschäftsprozesse

Die Wiederanlaufreihenfolge basiert auf der BIA (vgl. Kapitel 2). Beispielhafte Reihenfolge:

  1. Produktionssteuerung (MES)
  2. Auftragserfassung / ERP
  3. Kommunikation (E-Mail, Telefonanlage)
  4. Lagerverwaltung / Versand
  5. Buchhaltung / Faktura
  6. HR-Systeme

Diese Reihenfolge wird jährlich validiert und bei Prozessveränderungen angepasst.

Übungen, Training und kontinuierliche Verbesserung

Test- und Übungskonzepte (Tischübungen, Volltests)

Die Organisation führt regelmäßig Übungen durch, um die Wirksamkeit der Notfallvorsorge zu überprüfen:

  • Tischübungen (1–2x pro Jahr): Szenarienbasiertes Durchspielen im Krisenstab
  • Technische Wiederherstellungstests (quartalsweise): Test-Backups und Restore einzelner Systeme
  • Vollübung (alle 2 Jahre): Kombination aus IT-Ausfall und Personalnotstand

Ergebnisse werden dokumentiert und ausgewertet.

Lessons Learned und Anpassung des Handbuchs

Nach jedem Notfall oder jeder Übung wird ein Lessons-Learned-Prozess durchgeführt:

  • Dokumentation der Abweichungen vom Plan
  • Bewertung der Effektivität der getroffenen Maßnahmen
  • Vorschläge zur Optimierung (z. B. neue Rollen, andere Kommunikationsmittel)

Das Notfallhandbuch wird mindestens jährlich aktualisiert.

Monitoring und Performance-Kennzahlen (KPIs)

Die Organisation erfasst qualitative und quantitative Kennzahlen zur Bewertung der Notfallmanagementprozesse:

Beispiele für KPIs:

  • Durchschnittliche Wiederanlaufzeit (RTO) pro System
  • Erfolgsquote bei Wiederherstellungstests
  • Anteil geschulter Mitarbeitender im BCM
  • Anzahl dokumentierter Lessons Learned pro Jahr

Diese Kennzahlen werden im Rahmen des Management-Reviews analysiert und als Basis für Verbesserungen genutzt.

Schlussbemerkung

Revision

Diese Richtlinie wird regelmäßig, jedoch mindestens einmal pro Jahr, durch den Regelungsverantwortlichen auf Aktualität und Konformität geprüft und bei Bedarf angepasst.

Inkrafttreten

Das Notfallhandbuch der Organisation tritt zum 01.01.2222 in Kraft.

Freigegeben durch: Organisationsleitung

Ort, 01.12.2220,

Unterschrift, Name der Leitung