Stand: 26.04.2017 17:24 Uhr

Künstliche Intelligenz in Suchmaschinen? von Hartmut Grawe

Was im Internet häufig zitiert und diskutiert wird, landet bei Google weit oben. Oft erkennt die Suchmaschine aber nicht so richtig, was wir eigentlich wissen wollen. In Zukunft könnten Suchmaschinen deshalb künstliche Intelligenz nutzen, um uns besser zu verstehen.

Ein Vergleich: Wer die Suchmaschinen Google und Yewno nach dem Begriff "World Wide Web" befragt, erhält unterschiedliche Resultate. Auf der Google-Ergebnisliste finden sich auf Seite eins einige Verweise auf Wikipedia, ein Lexikon-Eintrag, Links auf zwei Glossare und einige Magazinartikel. Die Ergebnisse bei Yewno: Web-Browser, Web-Page, Hyperlink, HTML, Tim Berners-Lee - sowie mehr als 15 weitere verwandte Begriffe, deren Beziehungen untereinander und eine kurze Definition des Ausdrucks "World Wide Web".

"Um dieses Ergebnis zu liefern, musste Yewno sehr viel lesen", sagt Berthold Gillitzer, Abteilungsleiter in der Bayerischen Staatsbibliothek München. Die Bibliothek, die ihrerseits einen Bestand von gut zehn Millionen Büchern hat, kooperiert als erste Institution in Europa mit dem Suchmaschinenanbieter Yewno. Das Unternehmen ist Nebenprodukt eines Biotechnologie-Start-ups. Dort keimte der Gedanke, wissenschaftliche Literatur automatisch nach unbekannten Zusammenhängen zu durchforsten. Yewno befindet sich noch im Versuchsstadium, ist aber auf dem Weg zum Heiligen Gral der Suchmaschinen: zur sogenannten semantischen Suche, einer Suche anhand von Sinnzusammenhängen.

Suche nach Zeichenfolgen nicht immer genau

"Alle Suchmaschinen arbeiten mit Zeichenfolgen", sagt Gillitzer. Da habe man schon immer das Problem der Doppeldeutigkeit. "Wenn man den Begriff 'Bank' eingibt, dann weiß die Suchmaschine einfach nicht, ob ich ein Kreditinstitut oder ein Sitzmöbel suche." Websites oder Bücher, die das gesuchte Wort enthalten, haben also zum Teil gar keinen Bezug zueinander. Über dieses Problem zerbrechen sich Informatiker und Linguisten seit Jahrzehnten die Köpfe.

Einige haben versucht, den Sinngehalt von Websites unsichtbar mit zu integrieren. Hinter den Kulissen der Website sollten Kategorien aus einem Bedeutungskatalog aufgelistet sein. Es würde sich allerdings im Grunde nur um Schlagworte handeln. Und diesen zusätzlichen Code nachträglich in alle Inhalte des World Wide Web einzufügen, ist nicht praktikabel. Yewno braucht eine solche Hilfe nicht mehr. "Bei Yewno steht keine Datenbank mit Fachwörtern oder ein Lexikon im Hintergrund", sagt Gillitzer. Vielmehr lerne die Suchmaschine allein aus Texten und aus einer linguistischen Analyse der Texte.

Eine Suchmaschine, die immer schlauer wird

Yewno lernt tatsächlich wie ein Kind: Je mehr das Computerprogramm liest, desto mehr versteht es. Die Suchmaschine wird in München ergänzend zum Bibliothekskatalog angeboten. Im Moment kennt Yewno nur die englische Sprache und lernt ausschließlich aus wissenschaftlichen Magazinen, aber das soll sich natürlich ändern. Schon jetzt ist offensichtlich, welchen gewaltigen Sprung die Technik darstellt: Wer mit Yewno sucht, erhält Unmengen sinnvoller Querverweise, man stößt auf nützliche Zusammenhänge, an die man vielleicht gar nicht gedacht hatte.

Semantische Suchmaschinen: Die Archivare der Zukunft?

Im Grunde ist die Software die künstliche Ausgabe eines aussterbenden Berufs. "Früher konnte man einfach mit dem Bibliothekar reden", sagt Gillitzer. Dem habe man sein Anliegen vorgetragen, und er habe dann verstanden, was man suchte - weil er einen einschätzen konnte und weil er den Bestand kannte. Das weltweite Wissen nimmt heute aber so schnell zu, dass kein Bibliothekar mehr mithalten kann. Allein die Bayerische Staatsbibliothek wächst pro Jahr um rund 100.000 Bücher.

Yewno gibt eine Ahnung vom Potenzial einer Suchmaschinentechnik, die mithilfe künstlicher Intelligenz selbstständig Wissen aufnehmen und einordnen kann. Man darf gespannt sein, wann dieser Ansatz in die bestehenden Internetsuchmaschinen integriert wird.

Dieses Thema im Programm: NDR Info | Netzwelt | 27.04.2017 | 08:08 Uhr