KI-Anwendungen machen einen riesigen Schritt in unser aller Alltag – insbesondere in den von PC- und Smartphone-Anwendern. Die großen KI-Themen des vergangenen Jahres 2023 von ChatGPT über Midjourney bis DeepL brachten zwar auch schon konkreten Nutzen, aber sie waren noch stark vom Ansatz „Schaut mal, was KI schon alles kann“ geprägt. In der Zwischenzeit oder parallel haben sich die Entwickler Gedanken darüber gemacht, wofür alles man diese Technologie noch einsetzen könnte. Und das Jahr 2024 startet mit den ersten konkreten Ergebnissen durch.
Aufmacherbild: (C) Microsoft
Nicht ohne Grund haben wir in unserem Ausblick auf die Technologie-Trends 2024 Künstliche Intelligenz als die wohl am meisten prägende Entwicklung für die nächsten Monate und Jahre identifiziert. Schon im Januar wurde diese Prognose eindrucksvoll bestätigt – nämlich von den Ankündigungen auf der US-Technik-Messe CES und darum herum.
In der Microsoft-Welt bekommt KI eine eigene Taste – und eigene Prozessor-Kerne
Überaus deutlich wurde dies etwa bei den Neuvorstellungen von Notebooks und Desktop-PCs: Nachdem Microsoft angekündigt hatte, KI-Funktionen unter dem Namen „Copilot“ tief in alle seine Anwendungen und Systeme zu integrieren – vom Browser Edge bis zur Suchmaschine Bing, vom Betriebssystem Windows bis zur Bürosoftware-Suite Office 365 –, haben die PC-Hersteller darauf reagiert: Fast alle Notebook-Neuvorstellungen des Jahres 2024 weisen eine „Copilot“-Taste auf, mit der sich die neuen KI-Helferlein direkt aufrufen lassen. Verpflichtend ist dies bis auf Weiteres allerdings nicht – auch wenn praktisch alle CES-Neuvorstellungen von Acer, Asus, HP, Lenovo, LG und Samsung sie schon an Bord hatten, und auch künftige Microsoft-Surface-Modelle damit ausgestattet sein sollen.
Aktuell startet ein Druck auf diese Taste übrigens das Programm „CoPilot“ (unter Windows 11) oder die Windows-eigene Suchfunktion (unter Windows 10). Künftig soll die von der neuen Taste aufgerufene Copilot-Funktion aber deutlich tiefer ins System integriert werden.
Weil der Platz auf der Tastatur beschränkt ist, muss dafür in der Regel eine andere Taste weichen. Kandidaten dafür sind in der Regel Tasten, die es ohnehin doppelt auf der Tastatur gab: Einige Hersteller sparen eine der beiden Windows-Tasten ein, während andere eine der Tasten ALT oder STRG durch den neuen KI-Drücker ersetzen. Übrigens: Fast immer lässt sich die Funktion der so ersetzen Taste reanimieren, indem man FN gemeinsam mit dem „Copilot“-Key drückt.
Die neue Taste ist im Übrigen nicht die einzige Hardware-Änderung, mit der sich die neueste Rechner-Generation auf den KI-Siegeszug vorbereitet. Sowohl Intel als auch AMD haben ihren Prozessoren sogenannte „Neural Processing Units“ hinzugefügt. Zu CPU (Zentral-Prozessor) und GPU (Grafik-Prozessor) kommt damit auch noch eine „NPU“. Diese Rechenkerne sind eigens für das Abarbeiten komplexer KI-Berechnungen optimiert.
Auch in der Smartphone-Welt steht KI im Zentrum der Entwicklung
Mit diesen Entwicklungen vollzieht die Welt der Notebooks und Desktop-Rechner im Übrigen nach, was in der Smartphone-Welt schon länger gang und gäbe ist: Auch in den Mobil-Prozessoren von Qualcomm, Apple und anderen Herstellern sind spezielle neuronale Rechenkerne schon seit Jahren enthalten. Mit jeder Chip-Generation werden sie leistungsfähiger und häufig auch zahlreicher.
Diese KI-Rechenkerne in den Smartphone-Chips unterstützen schon seit längerem Funktionen, die längst im mobilen Alltag angekommen sind, aber zumindest teilweise auf KI basieren: Dies beginnt bei den Korrekturvorschlägen der virtuellen Tastaturen, setzt sich fort mit der Sprach-Erkennung und -Ausgabe von Voice-Assistenten und reicht bis zur KI-gestützten Verbesserung von Kamera-Fotos. Bei der sogenannten „Computational Photography“ analysiert KI die Bildinhalte und sorgt dann dafür, dass der Himmel noch ein wenig blauer strahlt, das Gras noch ein wenig grüner leuchtet und Hauttöne noch ein wenig gesünder und natürlicher wirken. Auch wenn Puristen unter den Fotografen von einer Überzeichnung der Wirklichkeit sprechen, gefällt den meisten Smartphone-Hobby-Fotografen das so getunete Ergebnis besser als das vom Kamerasensor aufgenommene Original.
In diesem Zusammenhang hat sich übrigens längst eine Diskussion entwickelt, ab welchem Punkt von KI bearbeitete Fotos als solche gekennzeichnet werden sollten – oder durch entsprechende Gesetzgebung künftig vielleicht sogar müssen. Wenn KI-basierte Tools störende Mit-Touristen, Autos oder Strommasten aus dem Bild verschwinden lassen oder einen betonierten Parkplatz in eine saftige Wiese verwandeln, ist der Fall noch relativ klar. Aber verläuft die Grenze diesseits oder jenseits von automatisch wegretuschierten Pickeln, Falten und Haarsträhnen?
Vielzahl neuer KI-gestützter Funktionen auf den neuesten Android-Smartphones
Doch von solchen Diskussionen und Überlegungen lässt sich die Entwicklung nicht stoppen. So wartet etwa die neueste Version des Mobil-Betriebssystems Android auf den neuesten Smartphones wie der von Samsung im Januar 2024 vorgestellten Galaxy-S24-Serie mit neuen KI-gestützten Funktionen auf. Die größte Aufmerksamkeit erfuhr dabei „Circle to Search“: Durch längeren Druck auf die Home-Taste beziehungsweise deren Pendant am unteren Android-Bildschirmrand lässt sich damit aus beliebigen Apps oder Systemfunktionen die Displaydarstellung quasi einfrieren. Der Smartphone-Nutzer zeichnet dann einen Kreis um ein Objekt oder markiert ein Stück Text, zu dem zusätzliche Informationen gewünscht sind. Worum handelt es sich, welche Details gibt es dazu noch zu wissen? Die Antworten liefert dann eine Suchanfrage bei Google. Neben den neuen Samsung-Phones wurde „Circle to Search“ im Übrigen auch per Systemupdate auf den Google-eigenen Modellen Pixel 8 und Pixel 8 Pro ausgerollt.
Doch die KI-gestützten Anwendungen, die etwa Samsung bei der Vorstellung seiner neuen S24-Serie und deren „Galaxy AI“-Funktionen vorgestellt hat, gehen noch viel weiter. Zu ihnen zählt beispielsweise eine Live-Übersetzung von Telefongesprächen. Dies funktioniert bereits in 13 Sprachen, darunter auch Deutsch. Die Funktion läuft übrigens direkt auf dem Smartphone und braucht keinen Rückgriff auf Rechenkapazitäten im Internet – das zugehörige „Large Language Model“ hat der koreanische Hersteller selbst entwickelt beziehungsweise trainiert. Am Anfang eines solchen Dolmetscher-Telefonats wird der Gesprächspartner darüber informiert, dass ein KI-Übersetzer zwischengeschaltet ist. Das ist schon deshalb sinnvoll, damit man sich weniger über die langen Gesprächspausen und gelegentliche merkwürdige Fehlinterpretationen wundert.
Über diese Funktion hinaus kann der Sprachrekorder auf den neuesten Samsung-Smartphones gesprochene Notizen in Text transkribieren. Zu getippten Nachrichten kann die KI Formulierungsvorschläge machen, um die gewünschte Tonalität besser zu treffen. Getippte Notizen formatiert die KI auf Wunsch mit automatischen Gliederungen um. Und Samsungs hauseigene Chat-App bietet einen Dialog-Modus, mit dem man sich beispielsweise im Ausland mit Servicepersonal oder anderen Gesprächspartnern in der dortigen Landessprache austauschen kann.
Jede Menge Produktideen mit KI-Unterstützung
Zusätzlich zu diesen übergeordneten Trends, die sich sicherlich bald auch bei anderen Herstellern und in anderen Systemwelten wiederfinden dürften, zeigte insbesondere die CES in Las Vegas noch jede Menge speziellerer KI-basierte Produktideen.
Beispielsweise die KI-gestützte elektronische Katzenklappe „Flappie„: Die identifiziert per Infrarot-Beleuchtung und -Kamera nicht nur den eigenen Stubentiger. Sondern lässt sich auch so einstellen, dass sie diesem dem Zutritt ins Haus verwehrt, wenn das Haustier eine Beute wie eine Maus oder einen Vogel im Maul hat. Das aus der ETH Zürich entstandene Start-up hinter Flappie legt übrigens Wert auf die Feststellung, dass die gesamte Erkennungsalgorithmik lokal auf der Katzenklappe läuft, also keine Unterstützung durch einen Server im Internet benötigt. Weitere Funktionen beinhalten unter anderem einen „Tierarztmodus“ – darf die Katze wegen einer Verletzung oder Krankheit das Haus nicht verlassen, sperrt die Katzenklappe in diesem Fall auch den Weg nach draußen. Noch befindet sich das Gerät im Prototypen-Stadium, eine Serienfertigung soll idealerweise im Lauf von 2024 starten.
Ein anderes Beispiel ist das „smarte Fernglas“ AX Visio vom Hersteller Swarovski Optik. Das Kürzel AX steht dabei für „Augmented Experience“. Dank eingebauter Bilderkennung und KI-Chip erkennt und identifiziert das Gerät 10.000 Vogelarten und blendet deren Bezeichnung ins Bild ein. Hinzu kommen rund 300 Säugetierarten, deren Anzahl der Hersteller künftig noch ausbauen will. Das smarte Fernglas kann auch Bilder oder Videos lokal abspeichern, die sich dann später aufs Smartphone übertragen lassen. Zudem hat sich der Hersteller zwei praxisgerechte Sharing-Funktionen ausgedacht: Ist ein Paar mit zwei AX Visio unterwegs, kann man einen Fund auf das Fernglas des Partners schicken – dort helfen dann eingeblendete rote Pfeile, die richtige Stelle zu finden. Und größere Gruppen, wie sie etwa an entsprechenden Urlaubsorten von Tour Guides herumgeführt werden, können das aktuelle Bild des smarten Fernglases per App auf ihren Smartphones verfolgen. Mit einem UVP von 4600 Euro dürfte das smarte Fernglas allerdings bis auf Weiteres nur sehr ambitionierten und finanziell gut bestückten Naturbeobachtern vorbehalten bleiben.