
In der Session “Vision des Webs der Zukunft - Neuronale Netze und künstliche Intelligenz” spricht Roy Uhlmann und Dr. Klaus Holthausen von Queap über die Zukunft des Webs. Bisher war die kontextuelle Suche im Internet Standard. Das Problem an dieser ist, dass der vollständige Inhalt einer Seite nicht erkannt wird. Beispiel Moby Dick: Weight Watchers oder Walfänger? Kontextuelle Suche kann das nicht beantworten. Selbst das kontextuelle Auffinden des Wortes “Wal” sagt hierzu nichts aus, denn es könnte sich ja auch lediglich um eine Beleidigung handeln.
Ziel ist es, dass eine Suchmaschine eine Webseite so erkennt wie ein Mensch, wenn er eine Buchseite liest. Das würde dazu führen, dass man eine wirkliche inhaltliche Suche hätte und eben nicht mehr nur EIN oder MEHRERE Worte auf einer Webseite findet. Hierdurch entsteht dann im nächsten Schritt eine Suche nach Inhalt und Sinn. Und dieser kann dann auch kategorisiert werden. Beides zusammen emuliert die Struktur des menschlichen Gehirns, was dazu führt, dass Inhalte und Webanwendungen miteinander verknüpft werden können. Und das nennt man dann wiederum semantisches Web!
Die Frage ist nun, wie man dieses Ziel erreicht.
Bisheriger Ansatz war es, Daten bzw. Webseiten durch Metadaten bzw. Ontologien, RDF und Microformats miteinander zu verbinden. Genau dies versteht man bis heute als semantisches Web. Zu unterscheiden ist aber das semantisches Web als Ziel und die Erzeugung des semantischen Webs. Genau hier besteht in der Öffentlichkeit ein großes Missverständnis. Denn sobald ein semantisches Web besteht, denkt selbst jeder Informatiker, dass dies nur durch das Hinzufügen von Daten entstehen kann.
Denn, vereinfacht gesagt, das Hinzufügen erzeugt ein statisches Web. Man müsste die Daten immer wieder pflegen und erweitern. So wusste man bis vor 2 Jahren z. B. nicht, was ein Asus EEE PC ist. Was passiert dann aber mit Daten, die ein gewisses Alter aufweisen und nicht mehr gepflegt werden? Diese verlieren ihre Semantik oder spiegeln die Wirklichkeit nicht mehr wieder. Das Todesargument für die Erzeugung von Semantik durch das Hinzufügen von Daten! Das Beispiel Lehman Brothers verdeutlicht es. Vor gut 2 Monaten wurde Lehman noch nicht mit Insolvenz assoziiert. Jetzt schon! Das manuelle Hinzufügen von Daten ist also nicht praktikabel, da es keine dynamische Semantik erzeugt. Jeden Tag werden jedoch Unmengen von Daten im WWW erzeugt.
Das menschliche Gehirn hingegen erzeugt eine dynamische Verknüpfung durch das ihm eigene neuronale Netz, als selbstreferentiell und operational geschlossenes System. Dieses neuronale Netz lässt sich, wie oben beschrieben, nun erstellen. Es heißt ANI - artificial natural intelligence. Der Output einer Webseite, also der dort enthaltenen Texte wird durch den Algorithmus automatisch erkannt und dann mit anderen Inhalten abgeglichen und in Zusammenhang gebracht. Dies bedeutet nicht nur, dass alle Webseiten und Inhalte miteinander verknüpft werden, sondern auch, dass eine darauf aufsetzende Suchmaschine vollkommen ohne “Tags” arbeitet und ein rein inhaltliches Ranking von Webseiten erstellt. Der beste Inhalt ist auch das beste Suchergebnis! Der Pagerank, wie auch Black-SEO ist somit überflüssig geworden.
Dieser Ansatz führt dazu, dass man nicht nur Text, sondern auch die Pixel eines Bildes, Musik, letztlich jegliche Arten von Daten hiermit semantisch (im Sinne einer Verknüpfung) abbilden kann. Denn er arbeitet exakt so wie das neuronale Netz des Gehirns und dieses kann gleichfalls jede Art von Daten verarbeiten. Eben ohne das Hinzufügen von Daten.