Prof. Dr. Helmut Rüßmann

Das Theorem von Bayes und die Theorie des Indizienbeweises*

Anmerkung zu BGH, Urteil vom 28. März 1989 - VI ZR 232/88

*Erstveröffentlichung in ZZP 103 (1990), 62 bis 76


Der 6. Zivilsenat des OLG Stuttgart ist für unkonventionelle Entscheidungen unter seinem inzwischen in den Ruhestand getretenen Vorsitzenden Rolf Bender bekannt. Diese Entscheidungen bewegten sich bisher vor allem auf dem Gebiete des Verbraucherkredits [1]. Sie stießen das Tor für eine inzwischen gefestigte Rechtsprechung des Bundesgerichtshofs auf [2], führten mit dem “Sandhaufentheorem” einen theoretischen Ansatz in die richterliche Diskussion ein [3], der sonst seinen Platz wohl allein bei den rechtstheoretischen Kuriositäten gefunden hätte [4], und sorgten immer wieder für Unruhe bei Banken und BGH [5]. Eine unkonventionelle Entscheidung war es auch, die zum hier abgedruckten Urteil des BGH geführt hat. Eine Beweisfrage war zu beantworten. Es standen einige Indizien zur Verfügung, die es für die Antwort auf die Frage auszuwerten galt, ob der Kläger den Unfall, für den er Schadensersatz verlangte, nicht vorsätzlich herbeigeführt hatte. Im Senat saß neben dem Vorsitzenden Rolf Bender ein Beisitzer mit Namen Armin Nack zu Gericht. Beide sind (Mit-)Verfasser eines Buches “Tatsachenfeststellung vor Gericht”, in dem eine Theorie des Indizienbeweises auf der Grundlage des Theorems von Bayes entwickelt wird [6]. Eine fast schon verführerische Gelegenheit, nicht nur im Beratungszimmer bayesianische Kontrollrechnungen durchzuführen, sondern im Urteil die Theorie als Ganze zu präsentieren, die Revision zuzulassen und den BGH dazu zu bewegen, eine für die weitere Praxis verbindliche Stellungnahme zur maßgeblichen Theorie des Indizienbeweises abzugeben. Was könnte der Verbreitung einer auf dem Theorem von Bayes aufbauenden Theorie des Indizienbeweises nach Bender/Nack förderlicher sein als eine vom BGH getragene Forderung, bei der Würdigung von Indiztatsachen eine Wahrscheinlichkeitsberechnung nach dem Theorem von Bayes anzustellen? Der Versuch schlug fehl, und das Recht liegt auf der Seite des BGH: dies war kein Fall für die Auswertung von Informationen (Indizien) nach dem Theorem von Bayes. Doch mußte der BGH dazu nicht einmal in den tragenden Gründen Stellung nehmen, weil schon zuvor handwerklich unsauber gearbeitet worden war.

I. Das für die Sachverhaltsrekonstruktion verwertbare Informationsmaterial

Das OLG Stuttgart hatte für seine Beweiswürdigung verschiedene Informationen benutzt, die - nach Aktenlage - nicht ordnungsgemäß in das Verfahren eingeführt waren und deshalb nicht hätten benutzt werden dürfen. Es handelte sich um Informationen, die das Gericht aus den auf Antrag des Beklagten beigezogenen Ermittlungsakten gewonnen hatte. Im Urteil des OLG war dazu lediglich vermerkt: “Der Senat hat ferner die Akten des Ermittlungsverfahrens der Staatsanwaltschaft Stuttgart 31 Js 17186/87 gegen den Kläger beigezogen. Auf diese hat sich der Beklagte bezogen und deren Beiziehung beantragt.” Daß die Ermittlungsakten auch Gegenstand der mündlichen Verhandlung gewesen waren, konnte den Akten dagegen nicht entnommen werden. Der BGH sieht darin einen “Verstoß gegen den Beibringungsgrundsatz im Zivilprozeß, wonach das Gericht seiner Entscheidung nur solche Tatsachen zugrundelegen darf, die die Parteien vorgetragen haben”. Diesen Satz hätte er besser unterdrückt. Denn er enthält eine überflüssige Festlegung in einer höchst zweifelhaften Frage. Auch für den Zivilprozeß läßt sich mit guten Gründen geltend machen, daß das Gericht bei seiner Sachverhaltsrekonstruktion alle Informationen zu berücksichtigen habe, die ordnungsgemäß in das Verfahren eingeführt worden sind [7], und daß dies auch Informationen außerhalb des Parteivortrags sein können. Ich zitiere:

“Die Wege, auf denen entscheidungsrelevante Sachverhaltsinformationen außerhalb des Parteivortrags beanstandungsfrei in den Prozeß einfließen können, sind vielfältig. Besonders hervorzuheben sind die in amtlichen Auskünften und Urkunden enthaltenen Informationen, von denen das Gericht bei seiner Vorbereitungstätigkeit Kenntnis erhalten hat. Dazu treten alle im Rahmen der offiziellen Beweisaufnahme bekannt gewordenen und die für das Gericht ohne Beweisaufnahme offenkundigen Informationen. Schließlich ist es dem Gericht gestattet, aus den über Parteivorträge, Auskünfte und Beweisaufnahmen erhaltenen Informationen weitere Informationen zur Rekonstruktion des Sachverhalts zu erschließen, soweit ihm das dazu erforderliche empirisch-theoretische Wissen zu Gebote steht. Über dieses Wissen braucht sich das Gericht nicht in einem förmlichen Verfahren (Sachverständigenbeweis) unterrichten zu lassen. Es kann es sich auf jede nur denkbare Weise außerhalb des Verfahrens aneignen. Als einziges Wissen, das ein Richter offiziell nicht verwerten darf, bleibt dann allein das sog. private Wissen, das ihm durch eigene Wahrnehmungen des streitigen Geschehens außerhalb des Prozesses zuteil geworden ist” [8].

Die außerhalb des Parteivortrags in das Verfahren eingeflossenen Informationen müssen allerdings, um verwertet werden zu dürfen, zum Gegenstand der mündlichen Verhandlung gemacht werden. Daran hatte es das OLG Stuttgart - nach Aktenlage [9] - fehlen lassen und damit das Gebot des rechtlichen Gehörs mißachtet. Dies ist der zweite vom BGH angeführte Grund. Er ist völlig unabhängig von der das Verfahren sonst beherrschenden Maxime (Beibringungs- oder Untersuchungsgrundsatz), und er trifft. Die Verwertung von Informationen (Indizien), die nicht zum Gegenstand der mündlichen Verhandlung gemacht worden waren, machte das Urteil des OLG Stuttgart verfahrensfehlerhaft. Das Urteil mußte der Aufhebung verfallen. Eine Stellungnahme zur maßgeblichen Theorie des Indizienbeweises, zum Zwang der Auswertung der Indizien und Berechnung des Beweisergebnisses nach dem Theorem von Bayes war nicht mehr gefordert. Der BGH ließ es aber dabei nicht bewenden und gab dem OLG Stuttgart und der weiteren Praxis einige “ergänzende Bemerkungen” mit auf den Weg, die in knappen Zügen die gewünschte Stellungnahme mit - aus Stuttgarter Sicht - wohl ungewünschtem Inhalt enthalten. Gegenüber dieser Stellungsnahme gibt es - auch von jemandem, der mathematischen Modellen der richterlichen Beweiswürdigung durchaus zugetan ist [10] - nichts zu erinnern.

II. Indizienauswertung nach dem Theorem von Bayes

Es gibt in der Tat keinen Zwang, eine Beweiswürdigung, die nachvollziehbar und frei von Gedankenfehlern ist, einer weiteren Kontrolle des Ergebnisses anhand von Wahrscheinlichkeitsberechnungen unter Zugrundelegung des Theorems von Bayes zu unterziehen. Ein Zwang besteht allein zur Beachtung (Nichtverletzung) der unangefochtenen logischen und mathematischen Regeln der Wahrscheinlichkeitsrechnung. Zu diesen Regeln zählt, ohne daß der BGH das ausdrücklich festhalten müßte, zweifelsohne auch das Bayestheorem. Der Zwang kann sich aber nur in den Situationen entfalten, in denen die Voraussetzungen für den Einsatz des Theorems gegeben sind. Die Voraussetzungen lauten [11]:

  1. verläßliche Einschätzungen zur Anfangswahrscheinlichkeit der festzustellenden Tatsache;
  2. verläßliche Einschätzungen zum Likelihoodquotienten oder zur abstrakten Beweiskraft der ausgewerteten Indizien gebildet aus der Häufigkeit des Auftretens des Indizes mit der festzustellenden Tatsache im Verhältnis zur Häufigkeit des Auftretens des Indizes ohne die festzustellende Tatsache;
  3. gesicherte Kenntnis der (statistischen) Unabhängigkeit der ausgewerteten Indizien [12] untereinander;
  4. begründete Annahme des Fehlens weiterer Indizien, die zu einer veränderten Einschätzung der Wahrscheinlichkeit der festzustellenden Tatsache führen könnten [13].

Der BGH warnt vor allem vor den Gefahren, die aus einer Mißachtung der Voraussetzungen 1) und 2) herrühren können. Die anderen Voraussetzungen sind jedoch nicht minder wichtig. Gerade die Unabhängigkeitsvoraussetzung war vom OLG Stuttgart auf die leichte Schulter genommen worden, als es mehrere Vorunfälle sowohl beim Indiz des ersten Verdachts (Anfangswahrscheinlichkeit) als auch beim ersten Indiz in Rechnung stellte. Überdies führte die Betrachtung des Indizienbeweises allein aus der Perspektive des Theorems von Bayes zu doch recht seltsam anmutenden Fragestellungen. Sie nähren den Verdacht, daß die Informationssituation in eine Theorie gezwängt wurde, statt nach einer adäquaten Theorie für die gegebene Informationssituation zu suchen. Vielleicht gibt das Theorem von Bayes nicht mehr her als eine Teiltheorie des Indizienbeweises.

1. Die Fragestellungen unter dem Theorem von Bayes

Was das Theorem von Bayes so attraktiv macht, ist die Tatsache, daß es im Rahmen der mit Denkgesetzeigenschaften ausgestatteten klassischen Theorie der Wahrscheinlichkeit das einzige Modell für die Auswertung mehrerer einzelner Wahrscheinlichkeitsinformationen zu einem Gesamtbeweiswert für die festzustellende Tatsache hergibt. Will man im Rahmen der klassischen Wahrscheinlichkeitstheorie bleiben, müssen die Fragen so gestellt werden, wie das OLG Stuttgart sie gestellt hat:

Nicht (erstes Indiz):

Wie wahrscheinlich ist es, daß ein siebter Unfall vorsätzlich herbeigeführt wurde, wenn der Verdächtige an derselben Stelle innerhalb von vier Monaten schon drei gleichartige Unfälle hatte, an denen jeweils der Unfallgegner anscheinend schuldig war?

Sondern:

Wenn der siebte Unfall vom Verdächtigen vorsätzlich herbeigeführt worden ist, wie oft tritt dann das Indiz auf: “Der Verdächtige hatte an derselben Unfallstelle innerhalb von vier Monaten schon drei gleichartige Unfälle, an welchen jeweils der Unfallgegner anscheinend schuldig war”

und

Wenn der siebte Unfall vom Verdächtigen nicht vorsätzlich herbeigeführt worden ist, wie oft tritt dann das Indiz auf: “Der Verdächtige hatte an derselben Unfallstelle innerhalb von vier Monaten schon drei gleichartige Unfälle, an welchen jeweils der Unfallgegner anscheinend schuldig war”?

Auch nicht (zweites Indiz):

Wie wahrscheinlich ist die vorsätzliche Herbeiführung des siebten Unfalls durch den Verdächtigen, wenn der Bruder des Verdächtigen an derselben Unfallstelle vier Monate vorher einen Unfall mit gleichem Unfallhergang und die Verlobte des Bruders zwei Monate vorher dort einen gleichartigen Unfall und schließlich der Bruder neun Monate nach dem Verdächtigen einen weiteren gleichartigen Unfall an einer anderen Kreuzung hatten.

Sondern:

Wenn der siebte Unfall vom Verdächtigen vorsätzlich herbeigeführt worden ist, wie oft tritt dann das Indiz auf: “Der Bruder des Verdächtigen hatte an derselben Unfallstelle vier Monate vor dem Verdächtigen einen Unfall mit gleichem Unfallhergang. Die Verlobte des Bruders hatte zwei Monate vorher dort ebenfalls einen gleichartigen Unfall. Zudem hatte der Bruder neun Monate nach dem Verdächtigen einen weiteren gleichartigen Unfall an einer anderen Kreuzung”

und

Wenn der siebte Unfall vom Verdächtigen nicht vorsätzlich herbeigeführt worden ist, wie oft tritt dann das Indiz auf: “Der Bruder des Verdächtigen hatte an derselben Unfallstelle vier Monate vor dem Verdächtigen einen Unfall mit gleichem Unfallhergang. Die Verlobte des Bruders hatte zwei Monate vorher dort ebenfalls einen gleichartigen Unfall. Zudem hatte der Bruder neun Monate nach dem Verdächtigen einen weiteren gleichartigen Unfall an einer anderen Kreuzung”?

2. Das Mehrdeutigkeitsdilemma bei abweichenden Fragestellungen

Die Fragen, die das OLG Stuttgart stellt und “vorsichtig schätzend” beantwortet, sind keineswegs leichter beantwortet als die sich in der gegebenen Informationslage aufdrängenden Fragen. Warum das OLG Stuttgart die sich aufdrängenden Fragen nicht stellt, mag in folgendem Dilemma begründet liegen. Für die Auswertung von Informationen “Wenn A, dann E mit der Wahrscheinlichkeit r” und “Wenn B, dann E mit der Wahrscheinlichkeit s” zu dem Wert für “Wenn A und B, dann E mit der Wahrscheinlichkeit ?” hält die klassische Wahrscheinlichkeitstheorie kein Modell bereit, wenn nicht r oder s gleich 1 sind. In allen anderen Fällen stoßen wir auf das Problem der Mehrdeutigkeit statistischer Systematisierungen. Darunter versteht man folgendes: Es ist möglich, aus ausschließlich zutreffenden statistischen Einzelaussagen Ergebnisse abzuleiten, die nicht miteinander verträglich sind und deshalb nicht zugleich zutreffen können. Das macht man sich schnell an einem Beispiel klar [14].

Wir interessieren uns für die Religionszugehörigkeit einer bestimmten Person a, die wir selbst nicht mehr fragen können, weil sie inzwischen verstorben ist. Die einzigen Informationen, die wir über a besitzen, sind die, daß a ein Schwede war und in einem bestimmter Jahr nach Lourdes pilgerte. Von den Schweden gelte der Erfahrungssatz, daß sie zu 90% nicht katholisch sind [p(K|S) = 0,1], und von den Lourdespilgern gelte der Erfahrungsatz, daß sie zu 90% katholisch sind [p(K|L) = 0,9]. Alle diese Informationen, die Anknüpfungstatsachen und die Erfahrungssätze, sind miteinander verträglich, und doch führen sie, wenn man sie getrennt auswerten würde, zu miteinander unverträglichen Aussagen, daß nämlich a mit hoher Wahrscheinlichkeit Katholik und mit ebenso hoher Wahrscheinlichkeit nicht Katholik ist.

Wir stehen vor einem Informationsdilemma, das man theoretisch am einfachsten dadurch behebt, daß man die fehlende Information herbeischafft. Es ist die statistische Information über die Religionszugehörigkeit schwedischer Lourdespilger. Die theoretische Lösung macht uns deutlich, was mit der Forderung nach maximaler Bestimmtheit einer statistischen Systematisierung gemeint ist. Man benötigt im statistischen Bereich für den Einsatz der statistischen Einzelfallregel immer Erfahrungssätze, die über die Gesamtmenge der relevanten Indizien als Bezugsklasse und die fragliche Sachverhaltbehauptung als Ereignisklasse gebildet sind. In der Praxis hilft die theoretische Lösung freilich wenig, weil die erforderlichen Informationen häufig nicht zur Verfügung stehen. Eine mathematische Lösung des Informationsdilemmas im Rahmen der klassischen Wahrscheinlichkeitstheorie ist nicht in Sicht.

Das ändert sich, wenn wir für die Auswertung mehrerer Indizien auf das Bayestheorem zurückgreifen. Der Rückgriff zwingt dann zu den Fragestellungen des OLG Stuttgart. Ein Einklang mit den Denkgesetzen kann jedoch auch unter diesen Fragestellungen nur erreicht werden, wenn die oben bezeichneten weiteren Voraussetzungen für den Einsatz des Bayestheorems gegeben sind.

III. Alternativen für die Theorie des Indizienbeweises jenseits des Theorems von Bayes

Zwei Fragen sind noch offen. Die eine ist die, ob es nicht eine auf Beweiswerten und Wahrscheinlichkeiten basierende Theorie des Indizienbeweises jenseits der Möglichkeiten gibt, die die klassische Wahrscheinlichkeitstheorie mit dem Bayestheorem bietet [15], die andere die, ob nicht jede auf Wahrscheinlichkeiten basierende Theorie des Indizienbeweises unangemessen und etwa durch eine Theorie des Alternativhypothesenausschlusses [16] zu ersetzen ist.

Beide Fragen machen allein dadurch, daß man sie ernsthaft stellt, deutlich, daß die Zeit für die (vorläufig-)endgültige Absegnung der maßgeblichen Theorie des Indizienbeweises noch lange nicht reif ist. Mit dieser Einschätzung verbinde ich beileibe kein Plädoyer für eine unkontrollierte intuitive Gesamtschau anstelle einer regelgeleiteten Beweiswürdigung. Jeder Richter sollte mit den Grundlagen der klassischen Wahrscheinlichkeitstheorie vertraut sein und etwa das Bayestheorem zur Kontrolle seiner Überlegungen dort einsetzen können, wo die Anwendungsvoraussetzungen gegeben sind. Dazu zwingt den Richter schon das Gebot, die Denkgesetze nicht zu verletzen. Aber nicht jede Informationssituation ist auf den Einsatz des Bayestheorems zugeschnitten. Für die anderen Informationssituationen bedarf es anderer (zusätzlicher) Modelle und Regelwerke, die für eine rationale Kontrolle der nur als ultima ratio akzeptablen intuitiven Gesamtschau Sorge tragen können. Hier mag ein Blick über den Zaun in eine noch junge Nachbardisziplin Aufschlüsse gewähren, die sich ebenfalls den durch den Indizienbeweis aufgeworfenen Fragen stellen muß, ohne auf die intuitive Gesamtschau ausweichen zu können.

1. Theorie und Praxis der Expertensysteme

Ich spreche die im Rahmen der Forschungen zur Künstlichen Intelligenz traktierte Theorie der Expertensysteme und ihre praktischen Umsetzungen im vornehmlich medizinisch-diagnostischen Bereich an [17]. Hier sind die Befundtatsachen die Indizien, und die Diagnose ist die zu beweisende Tatsache. Befundtatsachen und Diagnose sind ebensowenig ausnahmslos miteinander verknüpft, wie dies Indizien und zu beweisende Tatsache bei der richterlichen Sachverhaltsfeststellung zu sein pflegen. Die intuitive Gesamtschau kann man keinem Computer beibringen. Das mag seine Intelligenz von der des menschlichen Experten unterscheiden. Für unsere Fragestellung kann das nur von Vorteil sein, weil man sich nun explizit formulierbare Regeln einfallen lassen muß, nach denen aus einer Vielzahl von Einzelinformationen über den Zusammenhang der Befundtatsachen mit einer fraglichen Diagnose eine Gesamteinschätzung der fraglichen Diagnose wird. Zwei Grundmodelle stehen zur Diskussion. Das eine bewegt sich im Rahmen von Wahrscheinlichkeits- und Beweiswertanalysen [18]. Das andere ist ein Regel/Ausnahmemodell ohne Wahrscheinlichkeitsanalysen [19]. Die Parallelen zur juristischen Diskussion springen da geradezu ins Auge.

a) Das Dempster-Shafer-Modell

Bei den Modellen, die sich im Rahmen von Wahrscheinlichkeits- und Beweiswertanalysen bewegen, steht das Theorem von Bayes an prominenter Stelle [20]. Aber es steht durchaus nicht allein. Ein anderes Modell ist etwa das Dempster-Shafer-Modell [21]. Mit ihm geht man über die klassische Wahrscheinlichkeitstheorie hinaus. Das hat namentlich dann einige Plausibilität für sich, wenn die Verbindung der Anknüpfungstatsachen mit der Haupttatsache nicht einfach auf einer Abzählung von Merkmalen beruht, sondern eine inhaltliche Qualifikation anspricht, die man mit den Ausdrücken “weil” oder “Ursache/Wirkung” bezeichnen könnte. In der Festschrift für Nagel [22] bin ich dieser Frage für die Auswertung mehrerer Zeugenaussagen nachgegangen und habe für das Zusammenfassen der Einzelbewertung solcher Verknüpfungen [23] ein Modell vorgestellt, das die Regeln der klassischen Wahrscheinlichkeitsmathematik transzendiert. Es liegt nahe, das Modell zu verallgemeinern und seine Gültigkeit für alle (möglichen) Wirkungen eines fraglichen Ereignisses reklamieren, die untereinander unabhängig sind. Nicht ausgeschlossen scheint es auch, bei voneinander unabhängigen (möglichen) Ursachen für ein fragliches Ereignis die jeweiligen Wirkungswahrscheinlichkeiten in derselben Art zusammenzurechnen, wie das für unabhängige Zeugenaussagen gezeigt worden ist.

Im Dempster-Shafer-Modell werden positive und negative Hinweise auf ein gesuchtes Merkmal (die Haupttatsache) getrennt bewertet. Die Grundbewertungen, auch Evidenzen genannt, sind bedingte Anknüpfungstatsachen-Haupttatsache-Wahrscheinlichkeiten, in der die Anknüpfungstatsachen in der Wennkomponente stehen, und nicht bedingte Haupttatsache-Anknüpfungstatsachen-Wahrscheinlichkeiten, in der die Anknüpfungstatsachen in der Dannkomponente stehen wie bei der Anwendung des Bayestheorems. Allerdings wird die Restevidenz (1 - r) einer Evidenz r nicht gegen die Haupttatsache bewertet, sondern als Unsicherheitsintervall interpretiert, d.h. die Wahrscheinlichkeit der Haupttatsache ist nicht r, sondern liegt zwischen r und 1. Eine Wahrscheinlichkeit gegen die Haupttatsache aus einem anderen Indiz wird als Evidenz für das Komplement der Haupttatsache, d.h. für die Menge aller übrigen Zustände ohne die Haupttatsache, repräsentiert und bewirkt eine Verkleinerung des Unsicherheitenintervalls vom oberen Ende her. Die Maximalwahrscheinlichkeit für das gesuchte Merkmal wird entsprechend kleiner als 1.

Testen wir das Modell am Schwedenbeispiel! Für Beispiele dieser Art ist es zwar nicht entwickelt worden, weil das Schwedenbeispiel zum einen wenig komplex [24] ist und zum anderen keine expliziten Ursache/Wirkungsrelationen enthält. Dennoch könnten die Ergebnisse interessant sein, wenn sie im Einklang mit unserer Intuition stehen sollten: Entscheidungslosigkeit bei den gleichstarken Informationen in beide Richtungen, aber Veränderung zur Entscheidungsfähigkeit bei ungleichgewichtigen Informationen in die verschiedenen Richtungen. Dabei gehen wir davon aus, daß die Nationalität und die Eigenschaft als Lourdespilger im Hinblick auf die Religionszugehörigkeit unabhängig voneinander sind. Statistisch müßten also die folgenden Irrelevanzannahmen begründet sein:

und

und

Umgangssprachlich ausgedrückt: Nationalität (S) und Pilgereigenschaft (L) sind im Hinblick auf die Religionszugehörigkeit in dem Sinne unabhängig voneinander, daß die Wahrscheinlichkeit, bei Katholiken oder Protestanten auf Schweden zu stoßen, nicht dadurch verändert wird, daß die Personen auch Lourdespilger sind, und die Wahrscheinlichkeit, bei Katholiken oder Protestanten auf Lourdespilger zu stoßen, nicht dadurch verändert wird, daß die Personen auch Schweden sind. Es handelt sich um dieselbe Unabhängigkeitsvoraussetzung, die auch für den Einsatz des Bayestheorems gefordert wird.

Nehmen wir die Auswertung im Dempster/Shafer-Modell in Angriff!

Mit der Nationalität haben wir einen positiven Hinweis auf Protestant (P), mit der Lourdespilgerschaft einen positiven Hinweis auf Katholik von jeweils 0,9. Die “Restevidenz” wird immer der Menge aller Zustände zugeschrieben: hier {K,P}, wenn wir uns eine Welt nur aus Katoliken und Protestanten vorstellen. Das bedeutet nun im einzelnen:

Bei der Verknüpfung der Hinweise werden die Wahrscheinlichkeiten multipliziert und die Mengen miteinander geschnitten. Daraus ergibt sich die folgende Matrix

L
S
{K} = 0,9{K,P} = 0,1
{P} = 0,9

{K,P} = 0,1

{} = 0,81

{K} = 0,09

{P} = 0,09

{K,P} = 0,01

Unter der Annahme der Vollständigkeit der Ereignismenge kann die Wahrscheinlichkeit der leeren Teilmenge {} eliminiert werden, indem alle anderen Wahrscheinlichkeiten durch einen entsprechenden Faktor (1-(Wahrscheinlichkeit der leeren Teilmenge), hier 1 - 0,81 = 0,19) geteilt werden.

Dadurch verändern sich die Werte für

Die Gesamtwahrscheinlichkeit einer Menge möglicher Zustände gibt man durch ein Unsicherheitsintervall [a,b] an, das die untere und die obere Wahrscheinlichkeitsgrenze abschätzt:

Für die Mengen {P} und {K} ergibt sich also folgendes:

Das bringt genau unsere Ratlosigkeit zum Ausdruck und entspricht damit unserer Intuition.

Was aber ergibt sich, wenn die Schweden nur zu 50% Protestanten wären?

Bei der Verknüpfung der Hinweise werden wieder die Wahrscheinlichkeiten multipliziert und die Mengen miteinander geschnitten. Daraus ergibt sich die folgende Matrix

L
S
{K} = 0,9{K,P} = 0,1
{P} = 0,5

{K,P} = 0,5

{} = 0,45

{K} = 0,45

{P} = 0,05

{K,P} = 0,05

Unter der Annahme der Vollständigkeit der Ereignismenge kann die Wahrscheinlichkeit der leeren Teilmenge {} eliminiert werden, indem alle anderen Wahrscheinlichkeiten durch einen entsprechenden Faktor (1-(Wahrscheinlichkeit der leeren Teilmenge), hier 1 - 0,45 = 0,55) geteilt werden.

Daraus wird dann für

Die Gesamtwahrscheinlichkeit für die Mengen {P} und {K} liegen in den Intervallen:

Das ist nun in der Tat ein Ergebnis, das sich wiederum mit unseren Intuitionen deckt. Weitere Forschungen zum Dempster-Shafer-Modell sind angezeigt. Wir wenden uns dem zweiten Grundmodell zu.

b) Nicht monotone Schlußverfahren und Kausalanalysen

Das zweite Grundmodell will sich von den Schwierigkeiten der Verrechnung von Einzelwahrscheinlichkeiten befreien. Mittel sind die Repräsentation der Unsicherheiten in der Verknüpfung von Indizien und Haupttatsache als Ausnahme von Regeln einerseits und die vertiefende Kausalanalyse andererseits. Bei der Repräsentation der Unsicherheiten als Ausnahme von Regeln spricht man auch von nicht monotonen Schlußverfahren. Die heißen deshalb so, weil traditionell die Schlußmöglichkeiten aus einer Informationsmenge gleich (monoton) bleiben, auch wenn die Informationsmenge erweitert wird. Beim Regel/Ausnahmemodell ist das nicht so. Ein zunächst gegebener Schluß kann aufgrund einer weiteren Information, die eine Ausnahme erfüllt, zurückgenommen werden. In traditionellen Modellen wäre der zurückgenommene Schluß von vornherein nicht möglich gewesen, weil man die bekannten Ausnahmen als negative Voraussetzungen hätte formulieren und für die Ausführung des Schlusses ihr Nichtvorliegen hätte feststellen müssen.

Dem Juristen ist das nicht monotone Schließen vielleicht nicht vom Namen her, aber aus seiner alltäglichen Praxis durchaus vertraut. Der Beweislast des Anpruchsgegners für anspruchshindernde Tatsachen liegt genau dieses Schlußmodell zugrunde. Es steht überdies bei der Praxis des Anscheinsbeweises Pate. Nicht das bewiesene Nichtvorliegen eines atypischen Geschehensablaufs läßt die Anscheinsregel - in der Sprache der Informatiker - feuern, sondern schon die Anscheinssituation. Erst der bewiesene atypische Geschehensablauf nimmt das Feuer zurück, verbietet den bis dahin zulässigen Schluß aus der Anscheinssituation.

Die Modelle, mit denen die Informatiker im Regel/Ausnahmemodus arbeiten sind um einiges komplexer als die von der Rechtspraxis anerkannten Anscheinsbeweislagen. Ihr besonderes Merkmal sind Systeme, die als Truth-Maintenance-System oder als Reason-Maintenance-System die Informationen auszeichnen, die nach dem Feuern einer Ausnahmeregel in der Informationsbasis gehalten werden können. Inwieweit derartige Verfahren auch für die richterliche Informationsverarbeitung genützt werden können, ist bisher nicht untersucht worden.

2. Das Alternativhypothesenausschlußmodell

Die in der Theorie der Expertensysteme geforderte Ablösung der Wahrscheinlichkeitsauswertungen durch vertiefende Kausalanalyse findet dagegen eine Paralelle in der juristischen Diskussion. In jüngerer Zeit hat sich namentlich Freund dafür stark gemacht, sein Alternativhypothesenausschlußmodell als das normativ einzig adäquate Modell für die Beweiswürdigung auszuzeichnen [25]. Für die Praxis des Strafverfahrens, in der es nicht um irgendwelche generellen Gesetzmäßigkeiten, sondern um die Entscheidung eines konkreten Falles gehe, seien Wahrscheinlichkeiten irrelevant. Für den Nachweis eines vergangenen singulären Ereignisses komme es allein auf die sich hinter den Wahrscheinlichkeiten verbergenden Ausnahmen an - oder allgemeiner ausgedrückt: relevant seien allein denkbare Alternativen von Hypothesen. In den Worten Freunds [26]:

“Kann der Strafrichter aufgrund eines Erfahrungssatzes der Psychologie etwa sagen, daß der subjektive Tatbestand mit sehr hoher Wahrscheinlichkeit gegeben ist, so verbergen sich hinter dem “mit sehr hoher Wahrscheinlichkeit” Ausnahmen, Alternativen von der Hypothese, daß der subjektive Tatbestand in concreto erfüllt sei, deren Eingreifen für den vollen empirischen Nachweis der subjektiven Seite ausgeschlossen werden muß. Nicht anders ist die Lage des Richters, wenn er zwar einen zwingenden Erfahrungssatz zur Verfügung hat, aber nur mit sehr hoher Wahrscheinlichkeit sagen kann, daß dessen Bedingungen tatsächlich erfüllt sind. Statistisch gesehen träfe eine “Feststellung” in solchen Fällen zwar in der Regel zu, wäre aber in einer bestimmten Anzahl von Fällen mit Sicherheit falsch. Der empirisch allein haltbare Nachweis im Einzelfall kann daher nur dann geführt werden, wenn auch die “Ausnahmen”, also die Alternativen von der Hypothese des Vorliegens in concreto, aufgrund von Erfahrungssätzen ausgeschlossen werden können. Hierbei wird es häufig so sein, daß dies wiederum nur mit einer bestimmten Wahrscheinlichkeit möglich ist, so daß auch die Ausnahmen vom Ausschluß der Ausnahmen ausgeschlossen werden müssen usw. - Leicht ersichtlich ist die Grundstruktur dieses Nachweismodells: Beim empirisch allein haltbaren Nachweis vergangener Tatsachen ist der Richter gezwungen, mit einem Alternativenausschlußmodell zu arbeiten, weil sich nur auf diese Weise ein vergangenes singuläres Ereignis individuell begründen läßt.”

Der Ausschließlichkeitsanspruch, mit der das Alternativenausschlußmodell gegen ein Wahrscheinlichkeitsmodell propagiert wird, beruht m.E. auf einer Verkennung dessen, was auch das Wahrscheinlichkeitsmodell fordert.

Das Wahrscheinlichkeitsmodell fordert zum einen die Auswertung aller für eine singuläre Sachverhaltsfeststellung relevanten Informationen (maximale Bestimmtheit der statistischen Systematisierung). Dazu gehören selbstverständlich auch Informationen über den Ausschluß von Ausnahmen. Liegen Informationen über den Ausschluß von Ausnahmen nicht vor, bleibt es also bei der Unsicherheit, die in jedem Wahrscheinlichkeitsendwert unter 1 liegt, dann ist es eine Frage des Beweismaßes (oder des tolerierbaren Fehlurteilsrisikos), ob man sich damit für eine Verurteilung begnügt. Es kann auch eine Frage der Beweislast oder doch wenigstens einer Mitwirkungslast werden, wenn man beim Fehlen von Informationen über Ausnahmen solange vom Nichtvorliegen von Ausnahmen ausgeht, bis der von der Verurteilung Bedrohte Ausnahmen geltend macht und mit Informationen unterlegt: ein Modell, dem, wie sich später zeigt, Freund auch im Strafprozeß begrenzten Raum geben möchte.

Das um das Bayestheorem errichtete Wahrscheinlichkeitsmodell ist zum anderen nichts anderes als ein Alternativhypothesenausschlußmodell, weil seine Grundüberlegung dahin geht, die Alternative auszuwählen, die mit den festgestellten und vollständig ausgewerteten Indizien des konkreten Falles am ehesten verträglich ist, die m.a.W. besser als alle anderen in die festgestellten und vollständig ausgewerteten Indizien des konkreten Falles hineinpaßt. Wie schlecht die anderen Alternativen sich einpassen lassen müssen, um ausgeschlossen werden zu können, ist abermals eine Frage des Beweismaßes: des tolerierbaren Fehlurteilsrisikos.

IV. Ein (vorläufiges) Fazit

Der nur flüchtige Blick in eine Nachbardisziplin, die sich der Theorie des Indizienbeweises dringender stellen muß, als die Rechtswissenschaft, der als Zuflucht immer das intuitive Gesamturteil des erfahrenen Praktikers bleibt, hat vielleicht eine Ahnung davon vermittelt, wie recht der BGH tat, als er sich nicht dazu hergab, die zukünftige Praxis auf ein einziges Modell des Indizienbeweises im Sinne des Theorems von Bayes festzulegen. Zugleich sollte deutlich geworden sein, daß Versuche, die intuitive Gesamtschau zurückzudrängen und die Beweiswürdigung durch Regeln kontrollierbar zu gestalten, der Aufmerksamkeit der (Prozeß-)Rechtswissenschaft wert sind. Das OLG Stuttgart tat einen mutigen Schritt, als es seine Überlegungen offenbarte und der Kritik zugänglich machte [27]. Mitunter setzt ja auch ein Fehltritt fruchtbare Entwicklungen in Gang.