KI-Brillen dienen als „Augen“ für Sehbehinderte und bringen die Welt in den Fokus
Chinesische Forscher haben KI-gestützte Brillen entwickelt, die wie künstliche Augen funktionieren. Sie wandeln visuelle Daten in akustische Signale um und helfen blinden und sehbehinderten Menschen, die Welt mit größerer Klarheit und Selbstständigkeit „zu sehen“.
Cai Qionghui verlor ihr Augenlicht im Alter von sieben Jahren. Heute ist sie eine versierte Klavierstimmerin, die jedes Detail eines Instruments präzise erkennen kann. Dennoch fühlt sie sich in der physischen Welt oft verloren, wenn sie alleine unterwegs ist.
„Die meisten Navigationsprogramme versagen tatsächlich in den letzten zehn Metern, deshalb verirre ich mich oft und finde mein Ziel nicht. Sehbehinderte Menschen möchten eigentlich sehr gerne rausgehen, aber wir können es nicht, weil wir diese Situation fürchten“, sagte Cai.
In diesem Jahr hat Cai einen Neujahrswunsch: eigenständig ein Konzert zum Frühlingsfest zu besuchen.
Um ihren Traum zu verwirklichen, haben Forscher eines Herstellers von KI-Brillen in Hangzhou in der ostchinesischen Provinz Zhejiang große Anstrengungen unternommen, um die Hindernisvermeidungsfunktion des Geräts zu perfektionieren. Das Team verbrachte mehr als ein halbes Jahr damit, die Straßen der Stadt zu erkunden und Daten über Fußgängerüberwege, Stufen und andere Gefahren zu sammeln, um ihre KI zu trainieren.
Über die bloße Erkennung der Straßenverhältnisse hinaus musste das System auch schnell genug Warnungen ausgeben. Durch beharrliche Verbesserungen reduzierten sie die Reaktionszeit der Brille von 500 Millisekunden auf 300 Millisekunden und rückten Cais Wunsch damit einen Schritt näher.
„Nachdem die Reaktionszeit optimiert wurde, hatte ich weniger Angst, mich mit ihrer Hilfe draußen zu bewegen“, sagte Cai.
Mithilfe von Bildanalyse und Szenenverständnis können die KI-Brillen Speisekarten und die Umgebung sofort erkennen und visuelle Informationen in gesprochene Worte für Sehbehinderte umwandeln. Diese durchdachte Funktion wird von einem einheimischen großen KI-Modell unterstützt.
„Da ein großes KI-Modell fast wie ein Mensch mit der Umgebung interagiert, kann es für sehbehinderte Menschen oder Personen, die Hilfe benötigen, als ihre Augen, ihr Mund und ihre Ohren dienen und dadurch letztlich ihre Lebensqualität verbessern“, erklärte Xu Dong, General Manager des Tongyi Qianwen LLM-Dienstes von Alibaba Cloud.
Kürzlich setzte Cai die mehrfach getesteten und optimierten KI-Brillen auf und ging zum ersten Mal selbstbewusst und allein auf eine unbekannte Straße, um ihren Weg zum Theater für ihren Auftritt zu finden.
„Gib niemals leicht auf! Tatsächlich gibt es immer mehr Lösungen als Schwierigkeiten, besonders bei der rasanten Entwicklung von Wissenschaft und Technologie. Alle Schwierigkeiten können Schritt für Schritt gelöst werden, solange wir nicht aufgeben“, sagte Cai.











