Notfallhandbuch

Mustervorlage: "Notfallhandbuch für KMU"

Strukturiertes Muster-Notfallhandbuch für kleine und mittlere Unternehmen (KMU) mit Best Practices für Notfallvorsorge, Krisenmanagement und Wiederanlauf. Basierend auf dem BSI-Standard 200-4 und ISO 22301.

Einleitung

Unsere Organisationen sieht sich zunehmend komplexen Bedrohungen gegenüber – von technischen Störungen über Cyberangriffe bis hin zu Naturereignissen oder Lieferkettenunterbrechungen. In solchen Situationen ist die Fähigkeit, schnell und wirksam zu reagieren, entscheidend für den Fortbestand der Geschäftstätigkeit und den Schutz von Werten und Vertrauen.

Dieses Notfallhandbuch bildet die zentrale Handlungsgrundlage für die Vorbereitung, Bewältigung und Nachbereitung betrieblicher Notfälle. Es konkretisiert die im Rahmen des Business Continuity Managements (BCM) etablierten Prozesse und beschreibt, wie die Organisation auch unter außergewöhnlichen Bedingungen handlungsfähig bleibt.

Ziel des Handbuchs ist es, allen betroffenen Mitarbeitenden klare, praxisgerechte und handlungsorientierte Anleitungen bereitzustellen – abgestimmt auf die individuellen Strukturen, Prozesse und Ressourcen der Organisation.

Es richtet sich insbesondere an:

das BCM-Team und den Krisenstab,
Führungsverantwortliche und Entscheidende in den Fachbereichen,
operativ eingebundene Mitarbeitende sowie
externe Dienstleistende, sofern sie in Wiederanlaufprozesse eingebunden sind.

Das Handbuch basiert auf den Anforderungen des BSI-Standards 200-4 sowie anerkannten Methoden des Business Continuity Managements gemäß ISO 22301. Es wird regelmäßig aktualisiert, getestet und im Rahmen von Schulungen und Übungen in der Organisation verankert.

Notfälle lassen sich nicht vollständig vermeiden – aber ihre Auswirkungen lassen sich wirksam beherrschen. Dieses Handbuch ist ein wesentlicher Baustein dafür.

Allgemeine Informationen und Governance

Dieses Kapitel beschreibt den Rahmen, in dem das Notfallhandbuch angewendet wird, sowie die organisatorischen Grundlagen für wirksames Business Continuity Management (BCM) in der Organisation. Es schafft Transparenz über Zweck, Geltungsbereich, Rollen und Verantwortlichkeiten.

Zweck und Geltungsbereich

Zielsetzung des Notfallhandbuchs

Das Notfallhandbuch definiert die organisatorischen und technischen Maßnahmen zur Bewältigung von Notfällen und zur Wiederherstellung des Geschäftsbetriebs. Es verfolgt folgende Ziele:

Sicherstellung der Reaktionsfähigkeit der Organisation in Notfällen
Minimierung wirtschaftlicher, rechtlicher und reputativer Schäden
Einhaltung gesetzlicher und vertraglicher Anforderungen
Förderung einer resilienten Unternehmenskultur

Es dient als verbindliche Handlungsanleitung für alle Notfallszenarien, die wesentliche Geschäftsprozesse beeinträchtigen.

Abgrenzung gegenüber Notfall- und Krisenmanagement

Das Notfallhandbuch ist das zentrale Dokument des Business Continuity Managements (BCM). Es wird im Falle eines schwerwiegenden Ereignisses aktiviert, das den Normalbetrieb stört oder unterbricht.

Abgrenzung:

BCM: Präventive und reaktive Maßnahmen zur Aufrechterhaltung bzw. Wiederherstellung kritischer Geschäftsprozesse (strategisch-prozessorientiert)
Notfallmanagement: Operative Bewältigung unerwarteter Störungen (reaktiv-taktisch)
Krisenmanagement: Steuerung organisationsweiter Entscheidungen bei strategisch bedeutsamen Notlagen (kommunikativ, strategisch-politisch)

Das Handbuch ist eng verzahnt mit der operativen Incident-Response sowie dem Informationssicherheitsmanagement (ISMS).

Anwendungsbereich (Räumlich, organisatorisch, prozessual)

Räumlich:

Alle Standorte der Organisation, einschließlich externer Lager, Produktionsstätten oder angemieteter Büroflächen.

Organisatorisch:

Alle Fachbereiche, Abteilungen und Funktionsrollen, die an der Aufrechterhaltung kritischer Geschäftsprozesse beteiligt sind.

Prozessual:

Alle in der Business Impact Analyse (BIA) identifizierten kritischen oder wesentlichen Geschäftsprozesse, inkl. zugehöriger IT-Services, Infrastruktur, Lieferketten und externer Dienstleistender.

Organisation und Verantwortlichkeiten

Eine klare Rollen- und Verantwortlichkeitsverteilung ist Voraussetzung für die effektive Steuerung im Notfall. Die folgenden Strukturen sind dauerhaft etabliert und regelmäßig überprüft.

BCM-Beauftragter und Lenkungsausschuss

BCM-Beauftragte Person:

Zentrale Koordinationsstelle für alle BCM-Aktivitäten
Verantwortlich für Aufbau, Betrieb und Weiterentwicklung des BCM-Systems
Ansprechpartner:in für die Geschäftsleitung, externe Prüfinstanzen und Aufsichtsbehörden
Berichtspflicht an die Geschäftsleitung

Lenkungsausschuss BCM:

Besteht aus Vertretenden der Geschäftsleitung, IT, betroffenen Fachbereiche und ggf. Datenschutz/Informationssicherheit. Aufgaben:

Strategische Steuerung und Ressourcenzuteilung
Genehmigung von BCM-relevanten Konzepten
Validierung und Freigabe von Risikoanalysen und BIA-Ergebnissen
Regelmäßige Bewertung der BCM-Performance (z. B. jährlich)

Notfall- und Krisenstab: Rollen und Kompetenzen

Im Notfall übernimmt der Krisenstab die operative Steuerung. Die Zusammensetzung orientiert sich an der Art des Ereignisses.

Rollen:

Leitung Krisenstab (z. B. Geschäftsführung): Gesamtverantwortung und Außenkommunikation
BCM-Beauftragte: Koordination und Dokumentation, Verbindung zur Lenkungsgruppe
IT-Notfallkoordinator: Technische Bewertung, Maßnahmenplanung und Wiederanlauf
Fachbereichsvertretung: Bewertung fachlicher Auswirkungen
Kommunikationsverantwortliche: Interne und externe Kommunikation
Sicherheitsbeauftragte / Datenschutz (bei Bedarf): Compliance, Schutzmaßnahmen

Kompetenzen:

Der Krisenstab ist berechtigt, abweichend vom Regelbetrieb zu handeln, temporäre Maßnahmen anzuordnen und Ressourcen direkt zuzuweisen.

Eskalations- und Entscheidungswege

Eine klare Eskalationsstruktur gewährleistet schnelle Entscheidungen im Notfall:

Stufe	Beschreibung	Entscheidungskompetenz
1	Lokaler Vorfall (z. B. IT-Störung)	Fachbereichsleitung / IT
2	Kritisches Ereignis (z. B. Systemausfall mit Auswirkungen auf Geschäftsprozess)	BCM-Beauftragte / IT-Leitung
3	Notfall (z. B. vollständiger IT-Ausfall, Gebäudeschaden)	Krisenstab
4	Unternehmensweite Krise (z. B. Cyberangriff mit Datenabfluss)	Geschäftsführung / Krisenstab erweitert

Die Auslösung einer Eskalationsstufe erfolgt durch definierte Trigger, wie z. B. Unterschreitung der RTO, Sicherheitsvorfälle, Medienberichterstattung oder behördliche Anforderungen. Entscheidungen und Übergaben werden dokumentiert.

Analyse- und Planungsprozesse

Business Impact Analyse (BIA)

Die Business Impact Analyse der Organisation dient der Identifikation und Priorisierung geschäftskritischer Prozesse sowie der Festlegung von Wiederherstellungszielen. Die BIA bildet die Grundlage für die Notfallvorsorgeplanung.

Identifikation kritischer Geschäftsprozesse

Im Rahmen eines Workshops unter Beteiligung der Fachbereiche wurden die folgenden Prozesse als kritisch für die Geschäftstätigkeit der Organisation identifiziert:

Geschäftsprozess	RTO	RPO	Begründung
Auftragserfassung	8 Stunden	4 Stunden	Fortlaufende Auftragsannahme für Umsatzsicherung erforderlich
Produktion	4 Stunden	1 Stunde	Produktionsunterbrechung führt zu erheblichen Folgekosten
Warenannahme und -ausgang	24 Stunden	12 Stunden	Lagerpuffer verfügbar, tägliche Abwicklung ausreichend
Fakturierung	48 Stunden	24 Stunden	Verzögerung kurzfristig verkraftbar
Personalmanagement	5 Arbeitstage	2 Arbeitstage	Periodischer Ablauf ohne unmittelbare betriebliche Relevanz

Wiederherstellungsziele (RTO / RPO)

Basierend auf der Auswirkungsbewertung wurden folgende Wiederherstellungszeiten (RTO) und Datenverlusttoleranzen (RPO) festgelegt:

Geschäftsprozess	RTO	RPO	Begründung
Auftragserfassung	8 Stunden	4 Stunden	Fortlaufende Auftragsannahme für Umsatzsicherung erforderlich
Produktion	4 Stunden	1 Stunde	Produktionsunterbrechung führt zu erheblichen Folgekosten
Warenannahme und -ausgang	24 Stunden	12 Stunden	Lagerpuffer verfügbar, tägliche Abwicklung ausreichend
Fakturierung	48 Stunden	24 Stunden	Verzögerung kurzfristig verkraftbar
Personalmanagement	5 Arbeitstage	2 Arbeitstage	Periodischer Ablauf ohne unmittelbare betriebliche Relevanz

Risikoanalyse

Die Risikoanalyse bewertet, welchen Gefährdungen die kritischen Prozesse der Organisation ausgesetzt sind, und hilft, geeignete Maßnahmen zur Risikominimierung abzuleiten.

Bedrohungen und Schwachstellen

Für die Organisation wurden unter Einbezug von IT, Produktion und Verwaltung folgende typische Bedrohungsszenarien identifiziert:

Stromausfall am Hauptstandort
Schadsoftware (z. B. Ransomware) im ERP-System
Ausfall des Hauptservers (z. B. Festplattendefekt)
Personalausfall (z. B. durch Grippewelle oder Streik)
Gebäudebrand in Lager- oder Produktionshalle

Schwachstellen ergeben sich u. a. durch:

Fehlende Vertretungsregelungen für Schlüsselpersonen
Veraltete Hardware ohne Redundanz
Unzureichende Datensicherung oder Offsite-Backup
Mangelnde Awareness bei Mitarbeitenden

Risikobewertung

Risiken werden anhand der Skalen „Eintrittswahrscheinlichkeit“ und „Schadensausmaß“ auf einer Skala von 1 (niedrig) bis 5 (hoch) bewertet.

Bedrohung	Eintrittswahrsch.	Schadensausmaß	Risikowert	Einstufung
Ransomware	4	5	20	Hoch
Stromausfall	3	4	12	Mittel
Serverdefekt	3	3	9	Mittel
Personalausfall	2	3	6	Gering
Gebäudebrand	1	5	5	Gering

Risikopriorisierung

Für Risiken mit hohem und mittlerem Risikowert werden von der Organisation Risikobehandlungsmaßnahmen definiert. Diese umfassen sowohl technische Maßnahmen (z. B. USV, Backup, Firewalls) als auch organisatorische Regelungen (z. B. Notfallvertretungen, Awareness-Schulungen).

Strategieentwicklung und Prävention

Die Organisation entwickelt basierend auf den Ergebnissen von BIA und Risikoanalyse geeignete Vorsorgestrategien.

Kontinuitätsstrategien

Beispielhafte Strategien der Organisation:

Ausweicharbeitsplätze für Schlüsselpersonal mit VPN-Zugang
Cloud-basierte Backup- und Wiederherstellungslösung
Nutzung externer Lohnbüros bei Ausfall der internen HR-Abteilung
Vereinbarungen mit Dienstleistern zur Notfallproduktion (z. B. Lohnfertiger)

Technisch-organisatorische Maßnahmen

Tägliche inkrementelle und wöchentliche Vollsicherung aller geschäftskritischen Systeme
Regelmäßige Prüfung der Wiederherstellbarkeit (Restore-Test)
Schulung der Mitarbeitenden zum Verhalten im Notfall
IT-Redundanz durch virtualisierte Systeme mit Failover-Funktion

Integration in das Risikomanagement

Alle Ergebnisse aus der BIA und Risikoanalyse werden in das übergreifende Risikomanagement der Organisation eingebunden. Die Schnittstellen zu anderen Managementsystemen (z.B. ISMS, Datenschutz) sind dokumentiert und werden regelmäßig überprüft.

Operative Notfallreaktion, Wiederanlauf und Review

Dieses Kapitel beschreibt die konkreten Abläufe zur Reaktion auf einen Notfall, zur Wiederherstellung der Betriebsfähigkeit sowie zur kontinuierlichen Verbesserung des Notfallmanagements. Es richtet sich an alle Beteiligten im Krisenfall und dient als Handlungsgrundlage.

Alarmierungs- und Meldeverfahren

Interne Alarmierung (Automatisierte Systeme, Telefonketten)

Die Organisation betreibt ein abgestuftes internes Alarmierungssystem. Dieses soll sicherstellen, dass im Notfall alle relevanten Personen schnell und zuverlässig informiert werden.

Beispielhafte Mechanismen:

Automatisierte Alarmierung über Monitoring-Tools bei IT-Ausfällen
Vordefinierte Telefon-/Messenger-Ketten für alle kritischen Bereiche
E-Mail-/SMS-Alarmserver mit Eskalationsstufen

Beispiel: Interne Alarmierung IT-Ausfall

Monitoring erkennt Ausfall eines Servers
Automatisierter Alarm an IT-Notfallkoordinator
Aktivierung der Telefonkette für das Notfallteam
Dokumentation des Vorfalls im Ereignisprotokoll

Externe Benachrichtigung (Behörden, Dienstleister, Medien)

Je nach Art und Ausmaß des Notfalls werden externe Stellen informiert:

Polizei, Feuerwehr bei physischen Schäden oder Gefahr für Personen
Aufsichtsbehörden (z. B. Datenschutzbehörde bei Datenpannen)
IT-Dienstleister zur Unterstützung bei technischer Wiederherstellung
Versicherungen zur Schadenmeldung
Öffentlichkeit und Medien, gesteuert durch die Kommunikationsverantwortlichen

Für jede Kategorie existieren Kontaktlisten mit primären und sekundären Ansprechpersonen. Die Entscheidung zur externen Benachrichtigung liegt beim Krisenstab.

Notfall- und Krisenmanagement

Einberufung und Arbeitsweise des Krisenstabs

Der Krisenstab wird einberufen, wenn ein Notfallereignis die operative Steuerung durch die regulären Abläufe überfordert.

Zusammensetzung:

Notfallbeauftragte (Leitung)
IT-Notfallkoordinator
Vertretung der betroffenen Fachbereiche
Kommunikationsverantwortliche
Bei Bedarf: Datenschutzbeauftragte, externe Berater

Arbeitsweise:

Schnelle Bewertung der Lage („Lagebild“)
Definition und Priorisierung der Maßnahmen
Regelmäßige Lagebesprechungen (z. B. alle 2 Stunden)
Dokumentation aller Entscheidungen

Sitzungen finden physisch oder virtuell statt (Krisenraum, Videokonferenzsystem).

Entscheidungs- und Eskalationsprozesse im Incident Response

Im Rahmen der Notfallreaktion gelten definierte Entscheidungs- und Eskalationswege:

Beispielhafte Eskalationsstufen:

Stufe 1: Betriebsstörung – lokale Bearbeitung
Stufe 2: Kritischer Vorfall – Einbindung Notfallteam
Stufe 3: Notfall – Einberufung Krisenstab

Entscheidungsbefugnisse:

Technische Maßnahmen: IT-Notfallkoordinator
Kommunikationsfreigaben: ausschließlich durch die Organisationsleitung oder Kommunikationsverantwortliche
Wiederanlaufentscheidungen: Krisenstab

Alle Entscheidungen werden nachvollziehbar protokolliert.

Wiederanlauf- und Recovery-Pläne

IT-Wiederanlauf (System- und Datenwiederherstellung)

Der IT-Wiederanlauf erfolgt auf Basis dokumentierter Recovery-Pläne:

Ablaufschema:

Systemdiagnose und Fehleranalyse
Wiederherstellung der Infrastruktur (z. B. Server, Netzwerk)
Restore der Daten aus Backups (unter Beachtung RPO)
Verifizierung der Datenintegrität und Funktionalität
Übergabe an Fachbereiche

Werkzeuge:

Backup-Software (z. B. Veeam, Acronis)
Recovery-Dokumentation mit IP-Plänen, Serverrollen, Zugangsdaten

Tests der Wiederherstellung (z.B. quartalsweise) werden dokumentiert.

Infrastruktur- und Logistik-Recovery

Die Organisation verfügt über definierte Wiederherstellungsstrategien für Gebäude, Maschinen und logistische Abläufe:

Beispielhafte Maßnahmen:

Umzug in Ausweichstandort bei Gebäudeschaden
Nutzung externer Logistikdienstleister bei Ausfall eigener Fahrzeuge
Notstromversorgung über mobile Generatoren
Alternative Lieferantennutzung bei Ausfall eines Hauptlieferanten

Die Reaktivierung kritischer Versorgungswege erfolgt koordiniert durch den Krisenstab.

Priorisierte Wiederanlaufreihenfolge der Geschäftsprozesse

Die Wiederanlaufreihenfolge basiert auf der BIA (vgl. Kapitel 2). Beispielhafte Reihenfolge:

Produktionssteuerung (MES)
Auftragserfassung / ERP
Kommunikation (E-Mail, Telefonanlage)
Lagerverwaltung / Versand
Buchhaltung / Faktura
HR-Systeme

Diese Reihenfolge wird jährlich validiert und bei Prozessveränderungen angepasst.

Übungen, Training und kontinuierliche Verbesserung

Test- und Übungskonzepte (Tischübungen, Volltests)

Die Organisation führt regelmäßig Übungen durch, um die Wirksamkeit der Notfallvorsorge zu überprüfen:

Tischübungen (1–2x pro Jahr): Szenarienbasiertes Durchspielen im Krisenstab
Technische Wiederherstellungstests (quartalsweise): Test-Backups und Restore einzelner Systeme
Vollübung (alle 2 Jahre): Kombination aus IT-Ausfall und Personalnotstand

Ergebnisse werden dokumentiert und ausgewertet.

Lessons Learned und Anpassung des Handbuchs

Nach jedem Notfall oder jeder Übung wird ein Lessons-Learned-Prozess durchgeführt:

Dokumentation der Abweichungen vom Plan
Bewertung der Effektivität der getroffenen Maßnahmen
Vorschläge zur Optimierung (z. B. neue Rollen, andere Kommunikationsmittel)

Das Notfallhandbuch wird mindestens jährlich aktualisiert.

Monitoring und Performance-Kennzahlen (KPIs)

Die Organisation erfasst qualitative und quantitative Kennzahlen zur Bewertung der Notfallmanagementprozesse:

Beispiele für KPIs:

Durchschnittliche Wiederanlaufzeit (RTO) pro System
Erfolgsquote bei Wiederherstellungstests
Anteil geschulter Mitarbeitender im BCM
Anzahl dokumentierter Lessons Learned pro Jahr

Diese Kennzahlen werden im Rahmen des Management-Reviews analysiert und als Basis für Verbesserungen genutzt.

Schlussbemerkung

Revision

Diese Richtlinie wird regelmäßig, jedoch mindestens einmal pro Jahr, durch den Regelungsverantwortlichen auf Aktualität und Konformität geprüft und bei Bedarf angepasst.

Inkrafttreten

Das Notfallhandbuch der Organisation tritt zum 01.01.2222 in Kraft.

Freigegeben durch: Organisationsleitung

Ort, 01.12.2220,

Unterschrift, Name der Leitung