· News

Das Neuste von Google

Wie jedes Jahr hat Google an der Google I/O seine neusten Produkte, Entwicklungen und Forschungsergebnisse präsentiert.

Neben der Vorstellung der neusten Version von Android, neuer Hardware wie dem Pixel Phone, Pixel Watch, EarPods etc. gab es auch interessante Neuigkeiten aus der Ecke der künstlichen Intelligenz. Diese möchten wir dir kurz zeigen. So erhältst du einen Einblick in die neusten Entwicklungen in den Bereichen NLP und Computer Vision.

Natural Language Processing

Google setzt NLP Technologien bereits in vielen seiner Produkte ein. Vielleicht kennst du die Möglichkeit der automatisch generierten Video-Transkripte auf YouTube bereits. Neu übersetzt Google diese Transkripte sogar automatisch in 16 Sprachen übersetzt.

Eine weitere Neuerung im Bereich NLP betrifft Google Docs. Das neue Auto-Summary Feature generiert eine kurze Zusammenfassung der wichtigsten Themen aus einem Dokument. Laut Sundar Pichai, dem CEO von Google, wird diese Funktionalität in Zukunft auch in Chat-Tools integriert. Dies erlaubt es neuen Mitgliedern eines Gruppenchats schnell in die Konversation zu finden. Ohne den ganzen Verlauf durchzulesen, erhalten sie, dank der automatischen Zusammenfassung, direkt einen Überblick über die wichtigsten Ereignisse.

Beispiel einer automatischen Chat-Zusammenfassung
Beispiel: Automatische Chat-Zusammenfassung

Google erweitert seinen Übersetzungsservice Google Translate um 24 Sprachen. Die Herausforderung für die neuen Sprachen war insbesondere, dass diese im Internet unterrepräsentiert sind.

Klassische Übersetzungsmodelle werden mit zweisprachigem Text trainiert. Dies ist jedoch bei diesen Sprachen nicht möglich, da schlicht zu wenig zweisprachige Texte existieren. Um dieses Hindernis zu überwinden, entwickelte Google einen einsprachigen Ansatz. Hier lernt das Modell eine neue Sprache zu übersetzen, ohne jemals eine direkte Übersetzung davon zu sehen.

Pathways Language Model

PaLM (Pathways Language Model) ist ein Transformer basiertes Sprachmodell, ähnlich wie BERT oder GPT-3. Das spezielle and PaLM ist, dass es mit der „chain-of-thought prompting“ Technik trainiert wurde. Das Training nutzt Frage-Antwort Paare. Zusätzlich zur Antwort wird dem Modell noch eine Erklärung, wie die Antwort zustande gekommen ist, mitgeliefert. Das erlaubt es, dem Modell ein mehrstufige Probleme als eine Reihe von Zwischenschritten zu beschreiben. Schauen wir diese technische Beschreibung an einem Beispiel an:

Beispiel chain-of-thought prompting
Beispiel: Chain-of-thought prompting

Multisearch

Im Bereich Websuche hat Google Multisearch angekündigt. Mit Multisearch kann die Texteingabe mit einem Bild ergänzt werden. Das Bild dient dann als Kontext für die Suche. So findest du beispielsweise Online-Shops welche ein Kleid verkaufen, welches dir gefällt.

Alles was du dafür tun musst ist, ein Foto des Kleides hochladen. Dieses wird als Kontext identifiziert und die Suche startet. Wenn du ein das Kleid lieber in einer anderen Farbe hast, kannst du die Suche mit dem entsprechenden Suchtext ergänzen und verfeinern. Der Kontext (das Kleid) bleibt dabei erhalten.

Computer Vision

Mithilfe von Computer Vision hat Google die Satellitenbilder aus Google Maps analysiert und so Gebäude und Strassen identifiziert. Dies hört sich erstmal nicht weiter spektakulär an, da wir uns gewohnt sind, dass die Karten in Europa sehr genau sind. In Ländern, welche nicht über dieses detaillierte Kartenmaterial verfügen hat dies jedoch grossen Einfluss. In Afrika hat Google die Anzahl der kartographierten Häuser seit 2020 auf fast 300 Millionen Gebäude verfünffacht.

Satellitenbild mit markierten Gebäuden
Quelle: https://sites.research.google/open-buildings/#explore

Zudem hat Google den Datensatz, der Gebäude in Afrika öffentlich zugänglich gemacht. Wer sich selbst ein Bild davon machen möchte findet diesen hier.

Schlusswort

Dies waren nur einige Highlights, welche wir aus der Konferenz herausgepickt haben. Bestimmt werden wir das eine oder andere Thema in einem separaten Blogbeitrag detailliert diskutieren.

Zögere nicht, uns zu kontaktieren, wenn du Fragen zu einem Thema hast. Wir geben dir gerne detailliert Auskunft.

Wenn du alle präsentierten News sehen möchtest, findest du hier die gesamte Keynote oder Developer Keynote. Das gesamte Programm mit allen Talks der Konferenz findest du hier.

  • artificialintelligence
Share:
Zurück zum Blog