구글의 순다르 피차이 CEO는 자사의 AI 모델인 제미나이(Gemini)가 주력 검색 제품을 비롯한 다양한 제품과 서비스에 적용되고 있다고 밝혔습니다.
구글의 인공 지능(AI) 모델인 제미나이는 이 거대 기술 기업의 많은 기술에 접목되고 있습니다. 이 AI는 곧 지메일, 유튜브 및 구들의 스마트폰에 탑재될 예정입니다.
5월 14일에 열린 I/O 2024 개발자 콘퍼런스 기조연설에서 순다르 피차이 구글 CEO는 향후 AI 모델이 등장할 몇 가지 장소를 공개했습니다.
피차이는 110분 동안 진행된 기조연설에서 AI를 121번 언급했는데, 2023년 12월에 출시된 제미나이가 가장 큰 주목을 받았습니다.
구글은 대규모 언어 모델(LLM)을 Android, 검색, Gmail 등의 서비스에 통합하고 있습니다. 앞으로 사용자가 기대할 수 있는 기능은 다음과 같습니다.
기대되는 구글 제미나이 기능
앱 상호 작용
제미나이는 애플리케이션과 상호 작용할 수 있다는 점에서 더 많은 맥락을 확보하고 있습니다. 향후 업데이트에서는 사용자가 Gemini를 호출하여 AI가 생성한 이미지를 메시지로 끌어다 놓는 등 앱과 상호 작용할 수 있게 됩니다.
또한 유튜브 사용자는 ‘이 동영상에 질문하기’를 탭 하여 동영상 내 AI로부터 특정 정보를 얻을 수 있습니다.
지메일의 제미나이
구글의 이메일 플랫폼인 지메일에도 AI가 통합됩니다. 사용자는 Gemini를 사용하여 이메일을 검색하고 요약하고 초안을 작성할 수 있습니다.
받은 편지함을 검색하고 영수증을 찾고 온라인 양식을 작성하여 전자상거래 반품 처리를 지원하는 등 복잡한 작업을 위해 이메일에 대한 조치를 취할 수 있는 AI 어시스턴트입니다.
제미나이 라이브
구글은 또한 사용자가 스마트폰에서 AI와 ‘심층적인’ 음성 채팅을 할 수 있는 Gemini Live라는 새로운 경험을 공개했습니다.
챗봇은 명확히 설명하기 위해 답변 도중에 중단할 수 있으며, 사용자의 음성 패턴에 실시간으로 적응합니다. 또한 제미니는 장치에서 캡처한 사진이나 동영상을 통해 물리적 주변 환경을 보고 이에 반응할 수도 있습니다.
멀티모달 발전
구글은 사용자를 대신하여 복잡한 다단계 작업을 추론하고 계획하며 완료할 수 있는 지능형 AI 에이전트를 개발하기 위해 노력하고 있습니다. 멀티모달이란 AI가 텍스트를 넘어 이미지, 오디오 및 비디오 입력을 처리할 수 있음을 의미합니다.
쇼핑 반품 자동화, 새로운 도시 탐색 등의 예시와 초기 사용 사례가 있습니다.
구글의 AI 모델에 대한 다른 업데이트에는 Android의 Google 어시스턴트를 모바일 운영 체제에 완전히 통합 될 Gemini로 대체하는 것이 포함됩니다.
새로운 ‘사진에 질문’ 기능을 통해 Gemini가 제공하는 자연어 쿼리를 사용하여 사진 라이브러리를 검색할 수 있습니다. 문맥을 이해하고, 사물과 사람을 인식하며, 질문에 대한 응답으로 사진의 기억을 요약할 수 있습니다.
구글 지도는 플랫폼의 매핑 데이터에서 얻은 인사이트를 활용하여 장소와 지역에 대한 AI 생성 요약을 표시합니다.
< 참고 : 4 things Google Gemini users will be able to do soon >