Google rozpoczęło wdrażanie nowych funkcji dla swojego asystenta AI, Gemini, umożliwiając interakcję w czasie rzeczywistym za pośrednictwem wideo na żywo i udostępniania ekranu. Te udoskonalenia, wspierane przez Project Astra, pozwalają użytkownikom na bardziej intuicyjną obsługę swoich urządzeń, co stanowi znaczący krok naprzód w technologii wspomaganej sztuczną inteligencją.
Dzięki nowej funkcji wideo na żywo użytkownicy mogą wykorzystywać kamery w smartfonach do interakcji wizualnych w czasie rzeczywistym z Gemini. Na przykład użytkownik może pokazać Gemini obraz swojego otoczenia na żywo i zadawać pytania lub szukać pomocy w oparciu o obserwacje sztucznej inteligencji. Ta funkcja zwiększa użyteczność Gemini w zapewnianiu kontekstowego wsparcia i informacji.
Funkcja udostępniania ekranu umożliwia użytkownikom udostępnianie ekranu swojego urządzenia Gemini, umożliwiając sztucznej inteligencji analizę i dostarczanie wglądu w wyświetlaną treść. Ta funkcja jest szczególnie przydatna do zadań takich jak nawigacja w złożonych aplikacjach, rozwiązywanie problemów lub wyszukiwanie rekomendacji na podstawie informacji wyświetlanych na ekranie.
Funkcje te są częścią inicjatywy Google Project Astra, której celem jest zwiększenie zdolności sztucznej inteligencji do rozumienia prawdziwego świata i interakcji z nim w czasie rzeczywistym. Integrując możliwości Astry, Gemini może teraz efektywniej przetwarzać dane wizualne, oferując użytkownikom bardziej wciągające i interaktywne doświadczenia.
Dowiedz się więcej:Microsoft Teams wprowadza superrozdzielczość opartą na sztucznej inteligencji, która zapewnia ostrzejsze rozmowy wideo
Nowe funkcjonalności są obecnie udostępniane subskrybentom Gemini Advanced w ramach planu Google One AI Premium. Użytkownicy zgłaszali pojawienie się tych funkcji na swoich urządzeniach, wskazując na ich stopniowe wdrażanie.
Wprowadzenie tych funkcji przez Google stawia firmę Gemini na czele konkurencyjnego krajobrazu asystentów AI. Podczas gdy inni giganci technologiczni, tacy jak Amazon i Apple, opracowują podobne możliwości, funkcje udostępniania wideo i ekranu w czasie rzeczywistym oferowane przez Gemini zapewniają użytkownikom bardziej dynamiczne i responsywne środowisko sztucznej inteligencji.
Pierwsi użytkownicy podzielili się pozytywnymi opiniami na temat nowych funkcji. Na przykład użytkownik RedditazademonstrowanoZdolność Gemini do czytania i interpretowania treści wyświetlanych na ekranie, prezentująca praktyczne zastosowania udostępniania ekranu. Oczekuje się, że w miarę jak funkcje te staną się szerzej dostępne, zmienią one sposób interakcji użytkowników ze swoimi urządzeniami, sprawiając, że pomoc AI będzie bardziej kontekstowa i zintegrowana z codziennymi zadaniami.
Źródło:Krawędź
