
neue Kopfhörer, die Text übersetzen und Objekte identifizieren
Forscher der University of Washington haben ein System entwickelt, das die Interaktion mit künstlicher Intelligenz in unserem täglichen Leben verändern könnte. Gerufen VueBuds, integriert es kleine Kameras in Standard-WLAN-Kopfhörer, so dass Benutzer Fragen an ein IA-Modell über die Welt um sie in fast Echtzeit stellen.
Die Konzept Es ist einfach, aber mächtig. Ein Benutzer kann ein Objekt wie ein Lebensmittelpaket in einer Fremdsprache betrachten und die IA bitten, es zu übersetzen. In etwa einer Sekunde reagiert das System mit einer Reaktion durch die Kopfhörer, wodurch eine flüssige Interaktion und freie Hände.
Eine neue Möglichkeit, mit der IA zu interagieren
Die System verwendet niedrige Auflösung, schwarze und weiße Kameras, die in Kopfhörer integriert sind, um feste Bilder anstelle von kontinuierlichem Video zu erfassen. Diese Bilder werden über Bluetooth an ein angeschlossenes Gerät übertragen, wo ein kleines Modell von IA sie lokal verarbeitet.
Dies stellt sicher, dass Daten muss nicht an die Cloud gesendet werden, die eine der wichtigsten Anliegen über tragbare Kameras anspricht. Um die Privatsphäre weiter zu verbessern, umfassen Kopfhörer ein sichtbares Anzeigelicht, wenn aufgezeichnet und ermöglichen Benutzern sofort erfasste Bilder zu entfernen.
Technische Herausforderungen überwinden
Einer der ältesten Herausforderungen die dem Forschungsteam gegenüber stand, war der Energieverbrauch. Die Kameras benötigen viel mehr Energie als die Mikrofone, was es unpraktisch macht, hochauflösende Sensoren wie die in der Smart-Brille gefunden zu verwenden.
Um dies zu lösen, Ausrüstung Er benutzte eine Kamera, die Größe eines Reiskorns, der niedrigauflösende graue Skalenbilder erfasst. Dieser Ansatz reduziert die Batterienutzung und ermöglicht eine effiziente Bluetooth-Übertragung, ohne die Ansprechkapazität zu beeinträchtigen.
Viel Spaß!
In Tests verglichen 74 Teilnehmer VueBuds mit smarten Gläsern wie den Ray-Ban-Modellen von Meta. Trotz der Verwendung von niedrigen Auflösungs- und lokalen Verarbeitungsbildern arbeitete VueBuds im Allgemeinen ähnlich.
Der Bericht zeigte, dass die Teilnehmer VueBuds vorbeugten Aufgaben Übersetzung, während intelligente Brille besser funktioniert, um Objekte zu zählen. In separaten Tests erreichte VueBuds Genauigkeitsraten von etwa 83-84% für die Übersetzung und Identifizierung von Objekten und bis zu 93% für die Identifizierung von Titeln und Buchautoren.
