Das Sprachmodell

Wie kann man alchemistische Rezepte einem Computer verständlich machen oder wenigstens computertauglich codieren? Viele der Sprachmodelle, die die Computerlinguistik in den vergangenen Jahrzehnten entwickelt hat, sind in der Lage, relativ komplexe Bereiche der menschlichen Sprache wie verschachtelte syntaktische Strukturen oder Sprecherintentionen zu beschreiben. Für die Codierung alchemistischer Rezepte sind diese Modelle in den meisten Fällen viel zu anspruchsvoll, da sich diese Rezepte häufig kaum von den Anweisungen eines haushaltsüblichen Kochbuchs unterscheiden:

"Man nehme Schwefel und Quecksilber, zerreibe und erhitze diese beiden Substanzen."

Alchemistische Rezepte werden deshalb mit einem einfachen Verb-Valenz-Modell codiert. Jedes Rezept besteht aus einer Aneinanderreihung von Verben, die mit passenden Valenzen (Subjekt, Objekt, ...) zu wohlgeformten sprachlichen Äusserungen ergänzt werden. Der Beispielsatz lässt sich mit diesem Modell in folgende Form überführen:

(1. Schritt) Verb zerreiben
Sub. N.N.
Obj.
Quecksilber
Schwefel
(2. Schritt) Verb erhitzen
Sub. N.N.
Obj.
Quecksilber
Schwefel

Diese Verb-Valenz-Abfolgen kann natürlich um viele weitere Informationsklassen wie z.B. "Adjektive" ("Man nehme reinen Schwefel ..."), Mengenangaben ("Man nehme 5 Anteile Schwefel ...") oder Zeitangaben ("... und erhitze sie drei Tage lang.") erweitert werden. Trotzdem bilden Verben und Valenzen das Grundgerüst der Codierung. Nachdem ein Rezept mit diesem Sprachmodell codiert worden ist, wird es in der Datenbank des Sprachprogramms gespeichert und kann jetzt genauer philologisch untersucht werden.

Eng mit dem Sprachmodell verknüpft ist die sogenannte Ontologie, in der diejenigen Konzepte, die in alchemistischen Texten auftreten, in ein systematisches Verhältnis zueinander gesetzt werden. Diese Ontologie kann man sich am besten als eine Art Baum vorstellen, der sich von allgemeinen zu immer spezielleren Konzepten hin verästelt. So sind Schwefel und Quecksilber in dieser Ontologie dem Konzept "anorganische Substanz", dieses wiederum der "Substanz" usw. untergeordnet. Die "Blätter" dieses Baums, die Konzepte, liefern dann den Inhalt der Verben, Valenzen und der restlichen Sprachelemente; d.h.: Wann immer das Konzept "Quecksilber" in der Katalogisierung eines Rezepts auftritt, verweist dieses Konzept auf dasselbe "Blatt" im Ontologie-Baum. Umgekehrt kann man ein "Blatt" in diesem Baum auswählen und sich z.B. sämtliche Fundstellen des entsprechenden Konzepts anzeigen lassen. Die Anordnung der Konzepte in der Ontologie liefert so die Grundlage für eine Suche nach typischen Sequenzen und für den automatischen Vergleich alchemistischer Rezepte.

Nächste Seite