Die Suchmaschine die Jakob, unser Team und ich damals (1999-2007) installierten verfügte über simple Algorithmen (Bayes und Shannon) zur „Erkennung“ und „Optimierung“ von Sprache – dumm nur dass die Personen die suchten meistens nur ein Wort eingaben und dennoch genau die passenden Ergebnisse haben wollten ;) Aber heute geben Menschen wohl auch Sätze in das Suchfeld ein. Google geht nun deshalb den umgekehrten Weg und startet mit einer Umstellung auf BERT, einem neuen Spracherkennung-Algorythmus welcher zum Teil wesentlich bessere und passendere Ergebnisse liefern soll, vor allem bei „Such-Sätzen“, Beispiele findet Ihr hier:
Quelle: Understanding searches better than ever before
Diese neue BERT-Technik will nun also Texte und vor allem Textzusammenhänge besser erkennen, ein Umstand den Google im Gegensatz zu der Konkurrenz wie Bing, DuckDuckGo usw. ohnehin bereits besser umsetzt (zumindest nach eigener Erfahrung), weshalb das Quasi-Monopol Google wohl vorerst weiterhin bestehen bleibt….
Technisch interessant ist aber auch vor allem, dass kleine Zwischenworte so wie Präpositionen, die bei vielen Suchmaschinen quasi „weggeworfen“ werden/aus dem Suchindex entfernt werden um keinen Platz zu verschwenden und die Performance zu steigern, diese Worte wie „zu“, „nach“ usw. verändern die Bedeutungen einer Suchanfrage teils erheblich und Google „erkennt“ dies nun zum Teil…
Das ist durchaus interessant, auch wenn man über die Suchtechnik hinaus denkt und davon ausgeht dass wir – noch zu unseren Lebzeiten – mit Robotern vermutlich in ganzen Sätzen kommunizieren können werden. Dazu wäre diese Erkennung nämlich essentiell. Nicht für Menschen wie mich, solche Nerds sprechen auch sorglos mit dümmeren Robotern, aber zur Akzeptanz in der breiten Masse führt nur eine vermeintlich „echte“ Konversation.
Google’s Technik, welche übrigens bereits vor einem Jahr „open source“‚d wurde, könnte technisch solch eine Grundlage zur „Kommunikation“ mit Maschinen auf ein neues Level heben, erst einmal unabhängig davon ob man dieser Entwicklung positiv oder negativ gegenübersteht…