Die Stimme bringt es an den Tag

Der "digitale Stimmabdruck" verheißt Hilfe bei der Verbrechensbekämpfung - So sicher wie ein Fingerabdruck oder eine DNA-Analyse ist er aber noch lange nicht - Einblick in die Arbeit bei der Wissenschafts-Pressekonferenz in Bonn

Bonn. Im alten Rom gab es Gebäude, die so konstruiert waren, dass man von einer bestimmten Stelle hinter der Wand hören konnte, was in allen Zimmern gesprochen wurde. Und auch heute noch kann die menschliche Stimme zur wichtigen Spur werden: Nicht erst seit den Terroranschlägen in New York und auf Djerba hat die Auswertung von Telefongesprächen beim internationalen Kampf gegen Verbrechen und Terrorismus deutlich an Bedeutung gewonnen.

Die entsprechenden Experten heißen "forensische Phonetiker" - und in Deutschland gibt es an Unis und Kriminalämtern zusammen allenfalls ein gutes Dutzend. Über ihre Arbeit berichteten einige von ihnen jetzt vor der Wissenschafts-Pressekonferenz in Bonn.

Die Stimm-Detektive haben es ungleich schwerer als etwa die elektronische Sprechererkennung. Dieser "akustische Pförtner" kennt die Stimmen, denen er Einlass gewähren soll, und hat es mit willigen Sprechern zu tun: Erkennungsraten von über 90 Prozent sind bei diesen automatischen Systemen denn auch die Folge. Der Kriminalist, der einen Sprecher identifizieren oder zumindest beschreiben soll, hat einen anderen Ansatz und eine komplexere Aufgabenstellung, weiß Gerd Osten vom Bundesgrenzschutz in Swisttal.

Die Täter sind verständlicherweise nicht kooperativ. Sie versuchen alles, um die durch die Telefonübertragung schon beeinträchtigte Tonqualität durch Verzerrer oder das berühmte Taschentuch noch weiter zu verschlechtern. Trotzdem gelingt es Experten des Bundeskriminalamtes (BKA) oft, überraschend genaue Aussagen zu einem anonymen Sprecher oder auch zur Umgebung, etwa dem Versteck der Entführer, zu machen.

Wissenschaftler warnen allerdings vor Illusionen: "Den digitalen Stimmabdruck, den man Menschen in den Ausweis schreiben oder bei der Bank statt der Geheimzahl verwenden kann, gibt es nicht", sagt die Phonetikerin Angelika Braun. Sie leitete bis zum Jahr 2000 das Referat "Sprechererkennung, Tonbandauswertung und Linguistische Textanalyse" beim BKA; jetzt forscht und lehrt sie an den Unis Marburg und Trier. "Es gibt eine sehr große Konstanz von stimmlichen und sprachlichen Merkmalen innerhalb einer Person", erläutert die Phonetikerin. "Aber die Präzision eines Finger- oder DNA-Abdrucks hat ein Stimmabdruck nicht."

Dafür ist das Sprachverhalten nicht konstant genug: Man muss sich bloß die eigene Stimme nach einer ausgiebigen Karnevalsnacht vergegenwärtigen, oder wenn man seine Lieblingsmannschaft 90 Minuten lang zum Sieg gebrüllt hat.

Für ein gutes Analyseergebnis braucht es deshalb eine lange Textpassage. Günstig sind auch individualtypische spezifische Charakteristika, also ein Lispeln, Stottern oder eine Wortfindungsstörung. "Stößt man auf Allerweltsstimmen, ist es schwer, relevante Kriterien herauszuarbeiten", so Braun. Die Stimmprobe wird zunächst von allen Verrauschungen, Störungen, Verstümmelungen und Hintergrundlärm befreit sowie mittels hochwertiger Softwareprogramme zum Idealsignal umgeformt.

"Man muss das Material aufschönen, um die Stimme des Täters möglichst klar zu haben, aber nicht soweit, dass man in die typischen sprecherspezifischen Merkmale eindringt oder sie verändert", erklärt Jens-Peter Köster, Professor in Trier. "Wir Phonetiker wollen ja nicht wissen, was gesagt wird, sondern wie." Deshalb wird die Stimme zeit- und frequenzmäßig in kleinste Einheiten zerlegt. Alle potenziellen Eigentümlichkeiten - Atmung, Stimmgebung, Artikulation, Rhythmus, Intonation und Schnelligkeit - werden akribisch durchgearbeitet, protokolliert und zum Teil visuell aufbereitet.

In der Auswertung arbeiten Mensch und Maschine Hand in Hand. Das trainierte Gehör des Sachverständigen ist zum Beispiel besser darin, einen Menschen regional zuzuordnen. "Es gibt keine Technologie, die einen Berliner von einem Sachsen oder Baiern unterscheiden kann", sagt Braun.

Der Computer ist im Quantifizieren überlegen: Bei zwei Leuten mit pfeifendem "s" kann er genau messen, dass der eine es mit 2 380 Hertz pfeift, der andere mit 5 460. "Bei dem Terroristen Peter-Jürgen Broock beispielsweise war das ''sch'' ein ganz knackiges Merkmal, im Polizistenmord von Holzminden die weit überdurchschnittliche Höhe der Stimme", erläutert Braun.

Auch fremdsprachige Stimmproben können die deutschen Experten mit ihrer Methodik untersuchen, die heute internationaler Standard ist und das amerikanische Voice-Print-Verfahren (visualisierte Sprachschallanalyse) verdrängt hat. Dolmetscher oder Muttersprachler helfen ihnen - etwa beim Erkennen, ob ein Lispeln in dieser Sprache ein phonologisches Merkmal ist oder nicht.

Eine hundertprozentig sichere Identifizierung enthalten die Gutachten nie. Sie drücken das Ergebnis der stimmenvergleichenden Arbeit, die pro Fall zwischen 20 und 30 Stunden dauert, immer mit einer neunstufigen Wahrscheinlichkeitsskala aus. Auf krasse Fehlleistungen entfallen so höchstens zwei bis drei Prozent.

"Die Identifikation einer Person als Teilnehmer im Kommunikationsprozess ist ein Baustein in den Ermittlungen, nicht mehr, aber auch nicht weniger", sagt Osten. Von großer Wichtigkeit bei der Überführung eines Täters sei immer noch der klassische kriminalistische Spürsinn.

Meistgelesen
Neueste Artikel
Zum Thema
Aus dem Ressort