1. 개발자 키노트
이 Google I/O '25 개발자 키노트에서는 다양한 플랫폼에서 개발자를 위한 새로운 도구와 발전 사항을 중점적으로 다루며, 특히 Gemini AI 모델 통합에 중점을 둡니다. 주요 내용은 다음과 같습니다.
AI 및 Gemini:
- Gemini 2.5 Pro 및 Flash: 업데이트가 발표되었으며, 코딩 에이전트 "Jewels"와 같은 도구에 통합되어 속도와 효율성이 강조되었습니다 [00:15].
- Project Astra와 유사한 기능: AI를 더욱 자연스럽게 만드는 기능이 이제 라이브 API에서 제공됩니다 [04:20].
- AI Studio: 개발자가 Gemini를 탐색하고 빌드하는 데 도움이 되는 플랫폼으로, 웹 애플리케이션 생성을 위해 2.5 Pro가 통합된 기본 코드 편집기를 제공합니다 [04:01, 06:24].
- 함수 호출 및 URL 컨텍스트: 함수 호출 기능이 개선되었고 새로운 "URL 컨텍스트" 도구를 통해 Gemini 모델이 링크를 통해 웹 페이지의 정보에 액세스하고 사용할 수 있습니다 [05:02, 05:09].
- 멀티모달 기능: Gemini 모델은 이제 오디오를 처리할 수 있으며 음성 에이전트와 같은 작업에 통합되고 있습니다 [04:28].
- 비동기 함수 실행: 함수 호출이 백그라운드에서 실행되도록 하여 원활한 대화가 가능합니다 [11:59, 12:07].
- Gemini Code Assist: 개인 정보 보호 및 보안에 중점을 둔 기업을 위해 Android Studio에서 Gemini에 대한 액세스를 제공하는 구독 서비스입니다 [29:30, 29:37].
웹 개발:
- Chrome DevTools AI 지원: 통합된 Gemini AI는 개발자가 자연어를 사용하여 DevTools 내에서 직접 코드 문제를 디버그하고 수정하는 데 도움을 줍니다 [39:54, 40:14].
- 새롭게 디자인된 성능 패널: 레이아웃 이동과 같은 성능 병목 현상을 식별하고 수정하기 위한 AI 기반 통찰력을 제공합니다 [42:59, 43:15].
- Chrome의 Gemini Nano: 새로운 멀티모달 기능은 기기 내 AI 경험을 위해 오디오 및 이미지 입력을 허용합니다 [43:30, 46:13].
- 새로운 CSS 기능: 광범위한 JavaScript 없이 캐러셀(스크롤 스냅, 스크롤 버튼, 스크롤 마커) 및 호버 카드(관심 호출자, 앵커 위치 지정, 팝오버 API)를 보다 효율적으로 구축하기 위한 CSS 기본 요소 도입 [32:41, 36:38].
- 기준선 통합: VS Code와 같은 개발자 도구에 기준선 기능 가용성이 직접 표시됩니다 [38:31, 38:54].
Android 개발:
- Gemini 및 Imagine 3를 사용한 Androidify: 사진에서 Android 아바타를 생성하는 데 AI를 사용하는 방법을 시연했습니다 [16:20, 17:18].
- Gemini Nano를 사용한 기기 내 AI: 요약 및 이미지 설명과 같은 작업을 위한 API를 로컬 처리용으로 사용할 수 있습니다 [18:08, 18:17].
- Material 3 Expressive: 새로운 UI 요소와 재미있는 기능을 갖춘 디자인 시스템 업데이트입니다 [18:53, 19:02].
- 실시간 업데이트: Android 16의 새로운 기능으로 다양한 앱에 대한 시간 민감성 정보를 표시합니다 [19:35, 19:44].
- 교차 기기 호환성: 폴더블, 태블릿, Chromebook, 자동차 및 XR 기기에서 앱이 원활하게 작동하도록 하기 위한 노력 [20:28, 22:20].
- Jetpack Compose 업데이트: 성능 향상과 CameraX 및 Media3용 새 라이브러리에 중점을 둡니다 [24:13, 24:55].
- Compose 내비게이션 라이브러리: 다양한 화면 크기에서 더 간단하고 강력한 탐색을 위해 재구축되었습니다 [25:10, 25:16].
- Android Studio의 Gemini: 자연어를 사용한 엔드투엔드 테스트 및 자동화된 종속성 업데이트를 위한 AI 기반 기능 [25:42, 27:51].
Firebase:
- Firebase Studio: 단일 프롬프트로 풀스택 앱을 만들기 위한 클라우드 기반 AI 작업 공간으로, 이제 Figma 통합 및 자동화된 백엔드 프로비저닝 기능을 제공합니다 [48:45, 54:40].
Gemma 오픈 모델:
- Gemma 3N: 오디오 이해 기능을 갖춘 2GB RAM만큼 적은 용량의 기기에서 실행할 수 있는 새롭고 더 효율적인 모델입니다 [57:22, 57:50].
- Med Gemma: 의료 분야에서 멀티모달 텍스트 및 이미지 이해를 위한 오픈 모델 모음입니다 [58:14, 58:24].
- AI 우선 Collab: 코딩 작업을 위한 동적 대화를 가능하게 하는 Google Colab에서 AI로 빌드하는 새로운 방법입니다 [59:41, 01:00:49].
- SGEMA: 수화를 음성 언어로 번역하기 위한 새로운 모델 제품군입니다 [01:03:54, 01:04:00].
- Dolphin Gemma: 돌고래의 의사소통을 이해하기 위해 개발된 세계 최초의 돌고래용 대규모 언어 모델입니다 [01:04:38, 01:04:47].
키노트에서는 AI 통합, 새로운 플랫폼 기능 및 오픈 소스 모델을 통해 개발을 더 빠르고 쉽고 강력하게 만드는 것을 강조합니다.
2. 일반 키노트
Google I/O '25 키노트에서는 AI, 특히 Gemini 모델의 빠른 발전과 다양한 Google 제품 및 이니셔티브 전반에 걸친 통합을 강조합니다. 주요 발표 내용과 주제는 다음과 같습니다.
Gemini의 발전과 기능:
- 더 빠른 개발: Google은 전례 없는 속도로 AI 모델과 기능을 출시하고 있습니다 [03:12].
- 성능 향상: Gemini 2.5 Pro는 ELO 점수와 코딩 벤치마크에서 이전 모델을 능가했습니다 [03:45], [04:09].
- 효율적인 모델: Gemini Flash는 빠른 속도와 저렴한 비용을 제공하며 성능 면에서 Pro에 이어 두 번째입니다 [21:11], [21:20], [21:27].
- 멀티모달리티: 텍스트, 이미지, 오디오, 비디오 등 다양한 유형의 정보를 이해하고 처리하는 Gemini의 능력은 코딩, 이미지 생성(Imagine 4), 비디오 생성(기본 오디오 포함 V3)에서 입증된 핵심 강점입니다 [28:41], [01:19:00], [01:21:21].
- 딥 씽크 모드: 복잡한 추론 작업의 성능 한계를 뛰어넘는 Gemini 2.5 Pro의 새로운 모드입니다 [34:23], [34:31].
- 월드 모델 비전: Google은 Gemini를 현실 세계의 측면을 계획하고 시뮬레이션할 수 있는 "월드 모델"로 발전시키는 것을 목표로 합니다 [36:12], [36:19].
제품 전반의 AI 통합:
- Google Beam: 2D 비디오를 현실적인 3D 경험으로 전환하는 새로운 AI 우선 비디오 커뮤니케이션 플랫폼입니다 [08:48].
- Google Meet: 구독자는 이제 실시간 음성 번역(초기에는 영어와 스페인어)을 사용할 수 있습니다 [11:20], [11:29].
- Gemini Live (Project Astra): 범용 AI 어시스턴트를 위한 카메라 및 화면 공유 기능으로 Android 및 iOS에 출시됩니다 [12:05], [13:17], [01:15:12], [01:15:19].
- Project Mariner: 웹과 상호 작용하고 작업을 수행할 수 있는 에이전트로, 컴퓨터 사용 기능이 Gemini API를 통해 개발자에게 제공됩니다 [13:34], [14:31], [14:39].
- Gemini 앱: Gemini Live, 파일 업로드를 통한 딥 리서치, 공동 생성을 위한 캔버스, Chrome의 Gemini, 이미지 생성을 위한 Imagine 4, 오디오 포함 비디오 생성을 위한 V3와 같은 기능을 갖춘 중앙 범용 AI 어시스턴트가 됩니다 [01:13:36], [01:14:41], [01:16:21], [01:16:59], [01:17:58], [01:18:42], [01:20:30].
- Google 검색:
- AI 개요: 현재 월간 사용자가 15억 명이 넘으며 검색어 증가를 주도하고 있습니다 [07:40], [46:45], [46:55].
- AI 모드: 고급 추론, 더 긴 검색어, 후속 질문을 통해 새롭게 구상된 AI 검색 경험을 제공하는 검색의 새로운 탭으로 미국에서 출시됩니다 [07:59], [48:07], [48:41], [50:20], [50:39].
- 검색의 개인 컨텍스트: 과거 검색 및 연결된 Google 앱(Gmail부터 시작)을 기반으로 한 맞춤형 제안 [53:27], [53:42].
- 딥 서치: 전문가 수준의 인용된 보고서를 통해 더욱 철저한 답변을 제공합니다 [54:40], [54:55].
- 복잡한 분석 및 데이터 시각화: 스포츠 및 금융 질문용 [57:12], [57:34].
- 검색의 에이전트 기능: 이벤트 티켓 찾기 및 레스토랑 예약과 같은 작업을 위한 Project Mariner 통합 [57:56], [58:22], [59:18].
- Search Live: 실시간 정보 및 지원을 위해 카메라 사용 [01:00:08], [01:00:24], [01:00:32].
- AI 기반 쇼핑: 시각적 영감, 쇼핑 그래프의 제품 정보, 의류 가상 착용, 에이전트 체크아웃 [01:02:23], [01:03:14], [01:04:37], [01:06:47].
- Android: Android 생태계(휴대폰, 시계, 자동차, TV) 전반에 걸친 Gemini 통합 및 헤드셋과 안경을 위한 Android XR 도입 [01:37:50], [01:38:35], [01:38:54], [01:39:10]. Project Muhan 헤드셋을 위한 Samsung과의 파트너십, 스타일리시한 Android XR 안경을 위한 Gentle Monster 및 Warby Parker와의 파트너십 [01:40:32], [01:41:27], [01:50:31].
- Jules: 현재 공개 베타 버전인 AI 코딩 에이전트입니다 [31:29], [31:53], [32:02].
개발자 도구 및 생태계:
- Gemini API 업데이트: 다중 화자 지원 텍스트 음성 변환, 향상된 보안, 투명성을 위한 생각 요약, 비용 및 지연 시간 제어를 위한 생각 예산에 대한 새로운 미리보기를 포함합니다 [23:52], [24:02], [25:37], [25:47], [26:29], [26:39].
- AI Studio의 Gemini: 코딩 지원 및 3D 웹 앱 생성 시연 [27:23], [28:13], [29:32], [30:56].
- 개방형 에이전트 간 프로토콜: AI 에이전트 간의 통신을 가능하게 합니다 [14:55], [14:59].
- MCP 도구와의 Gemini SDK 호환성: 에이전트가 다른 서비스에 액세스하도록 지원합니다 [15:08], [15:17].
책임감 있는 AI 및 창의적 표현:
- SynthID: AI 생성 미디어에 보이지 않는 워터마크를 삽입하는 기술과 SynthID 콘텐츠를 식별하는 새로운 감지기입니다 [01:26:36], [01:26:53], [01:27:18].
- 아티스트와의 협업: 음악가(LIA 2) 및 영화 제작자(대런 애러노프스키의 원시 수프를 사용한 VO 및 Flow AI 영화 제작 도구)와 협력하여 창의적인 프로세스를 강화합니다 [01:24:12], [01:25:56], [01:27:40], [01:31:21].
Google AI 구독 요금제:
- Google AI Pro: 더 높은 속도 제한과 특별 기능을 갖춘 전 세계적으로 사용 가능합니다 [01:36:08], [01:36:18], [01:36:24].
- Google AI Ultra: 최첨단 AI, 가장 높은 속도 제한, V3를 사용한 Flow, YouTube Premium, 증가된 저장 공간에 대한 조기 액세스를 위해 처음에는 미국에서 출시되며 곧 전 세계적으로 출시될 예정입니다 [01:36:31], [01:36:40], [01:36:49], [01:36:57], [01:37:11].
선을 위한 AI:
- Project Firesat: 거의 실시간으로 산불을 감지하기 위해 AI와 위성 이미지를 사용합니다 [01:52:33], [01:52:46], [01:52:56].
- 재해 구호를 위한 드론 배송: Wing, Walmart, 적십자와의 AI 지원 노력 [01:53:31], [01:53:39].
- 접근성: Project Astra가 시각 장애가 있는 개인을 어떻게 지원할 수 있는지 강조합니다 [44:18], [01:46:11].
키노트에서는 AI 연구의 한계를 뛰어넘고 이러한 발전을 개발자, 크리에이터, 일반 사용자가 다양한 기기와 애플리케이션에서 접근하고 유용하게 사용할 수 있도록 하려는 Google의 노력을 강조합니다.
'Dev > AI & LLM' 카테고리의 다른 글
텍스트 전처리 심화 : 더욱 정교한 자연어 처리를 위한 필수 과정 (1) | 2024.11.20 |
---|---|
텍스트 데이터 전처리 심화: 오타 수정, 도메인별 전처리, 딥러닝 모델 특화 전처리 (0) | 2024.11.19 |
데이터 불균형 문제 해결: 오버샘플링, 언더샘플링, SMOTE 등 (0) | 2024.11.16 |
LLM을 위한 데이터 전처리: 모델의 성능을 높이는 필수 과정 (0) | 2024.11.16 |
LangChain으로 쉽게 만들어보는 나만의 LLM 애플리케이션: 상세 가이드 (1) | 2024.11.15 |