Chapter 1~14 를 따라오면서, 우리는 AI 가 만들 수 있는 거의 모든 매체를 다뤘습니다.
텍스트(Ch.1), 이미지(Ch.2), 영상(Ch.3), 발표자료(Ch.4), 분석 보고서(Ch.5), AI 비서(Ch.6), 문서 변환(Ch.7), 웹 조작(Ch.8), 파일 처리(Ch.9~10), 업무 자동화(Ch.11), AI 챗봇(Ch.12), 웹/앱(Ch.13), 음악(Ch.14) — 프로그래밍 없이 이 모든 것을 만들어 왔습니다.
이번 장은 시선을 "현재"에서 "미래"로 돌리는 장입니다. Chapter 1~14 에서 배운 도구들은 "이미 실용적인" 것들이었습니다. 이번 장에서는 "지금 이 순간 가장 앞서 있는" AI 기술을 직접 체험합니다. Google 이 운영하는 AI 연구(DeepMind), 최신 모델(AI Studio), 실험적 기능(Labs) — 이 세 가지 채널을 통해 AI 기술의 최전선에 서보겠습니다.
왜 Google 인가? Google 은 AI 기술의 연구(DeepMind) → 모델 개발(Gemini) → 실험(Labs) → 실사용(AI Studio) 전 과정을 하나의 회사 안에서 운영하는 거의 유일한 기업입니다. 그리고 이 모든 것을 무료로 공개합니다. 구글 계정(Gmail)만 있으면 누구나 접속할 수 있습니다.
Chapter 1 에서 ChatGPT, Claude, Gemini, Perplexity 를 비교 체험했습니다. 이번 장은 그중 Gemini(Google AI)의 "뒷마당"을 탐험하는 것입니다. Gemini 가 어떻게 만들어지는지, 최신 버전은 무엇이 다른지, 앞으로 어떤 기능이 나올지를 직접 확인합니다.
| 한계 | 구체적 상황 |
|---|---|
| 처리 분량 제한 | 한 번에 처리할 수 있는 문서 분량이 제한적. 수백 페이지 보고서를 한꺼번에 넣을 수 없음 |
| 최신 기술 접근 어려움 |
최신 AI 기술을 체험하려면 비용 필요. 무료 플랜으로는 최신 모델 사용 불가한 경우 많음 |
| 실험적 기능 비공개 | 출시 전 실험적 기능은 일반 사용자에게 공개되지 않음 |
| 기술 방향 파악 어려움 |
AI 기술이 어디로 향하는지, 다음에 무엇이 나올지 비전공자가 파악하기 어려움 |
| 강점 | 구체적 내용 |
|---|---|
| 100 만 토큰 | 수백 페이지를 한 번에 분석 가능. A4 약 1,500 페이지 분량을 한꺼번에 처리 |
| 최신 모델 무료 사용 | AI Studio 에서 최신 Gemini 를 무료로 직접 사용. Chapter 1 에서 쓴 Gemini 보다 더 강력한 최신 버전 |
| 실험 기능 미리 체험 | Labs 에서 출시 전 베타 기능을 미리 체험 가능. AI 기술의 미래를 가장 먼저 경험 |
| 기술 방향 파악 | DeepMind 의 최첨단 연구를 직접 확인. AI 기술이 어디로 향하는지 감을 잡을 수 있음 |
Google AI 생태계는 "자동차 회사의 전체 파이프라인"과 같습니다.
① DeepMind = 자동차 연구소 (새로운 엔진·기술을 개발하는 곳)
② Labs = 시험 주행장 (신기술을 테스트하고 피드백받는 곳)
③ AI Studio = 대리점 전시장 (최신 모델을 누구나 시승할 수 있는 곳)
보통 사람은 ③ 대리점(일반 AI 서비스)만 갈 수 있지만,
Google 은 ①② 연구소와 시험 주행장까지 무료로 공개합니다.
이번 장에서 세 곳을 모두 방문합니다.
Google 의 AI 기술을 직접 체험할 수 있는 세 가지 채널을 비교합니다.
| 구분 | AI Studio | DeepMind | Labs |
|---|---|---|---|
| 한 줄 요약 | 최신 Gemini 모델을 직접 사용하는 곳 |
Google 의 AI 연구소 기술 소개 |
출시 전 실험 기능을 미리 체험하는 곳 |
| 핵심 기능 | 최신 Gemini 2.5 무료 사용 100 만 토큰 대용량 멀티모달 지원 |
세계 최고 AI 연구 Gemini·AlphaFold· Veo·Seedream 개발 논문·데모 공개 |
베타 AI 기능 미리 체험 피드백으로 기능 개선 참여 |
| 접근 방식 | 웹에서 직접 프롬프트 입력 |
논문·데모·블로그 탐색 (읽기 중심) |
베타 기능을 직접 체험 |
| 비용 | 무료 (일일 한도 있음) |
무료 (공개 자료) |
무료 (베타 접속) |
| 난이도 | ● 쉬움 (바로 사용) |
● 보통 (기술 이해 필요) |
● 쉬움 (체험 중심) |
| 추천 용도 | 대용량 분석 실무 활용 |
기술 동향 파악 연구 참고 |
최신 기능 선제 체험 |
AI Studio 는 이번 장에서 가장 많이 사용하게 될 도구입니다. Chapter 1 에서 Gemini 를 처음 써봤다면, AI Studio 는 그 Gemini 의 "최신·최강 버전"을 직접 만지는 것입니다.
| 특징 | 내용 |
|---|---|
| 최신 모델 무료 사용 | Gemini 2.5 Pro/Flash 등 최신 모델을 무료로 직접 사용 |
| 100 만 토큰 | 한 번에 약 70 만 단어 = A4 약 1,500 페이지 분량 처리 가능 |
| 멀티모달 입력 | 텍스트 + 이미지 + 영상 + 오디오를 동시에 입력·분석 가능 |
| 파라미터 조정 | 온도·토큰 수 등을 직접 조절하며 실험 가능 |
| API 키 발급 | 자체 서비스에 Gemini 를 연결하는 API 키를 무료로 발급 가능 |
Chapter 1 에서 "토큰"을 택시 미터기에 비유했습니다. 100 만 토큰이 얼마나 큰 양인지 체감해 보겠습니다.
| 서비스 | 세션 용량 | 대략적 분량 |
|---|---|---|
| GPT-4o (Ch.1 기준) |
약 12.8 만 토큰 | A4 약 200 페이지 |
| Claude (Ch.1 기준) |
약 20 만 토큰 | A4 약 300 페이지 |
| Gemini AI Studio |
약 100 만 토큰 | A4 약 1,500 페이지 = 단행본 한 권 이상 |
단행본 한 권을 통째로 올려서 "이 책의 핵심을 30 가지로 정리해줘"라고 할 수 있습니다. Chapter 7 의 NotebookLM 도 대용량 문서를 처리했지만, AI Studio 는 한 번의 대화에서 실시간으로 질문·분석·비교가 가능합니다.
Chapter 1 의 일반 AI = "A4 200 장짜리 칠판" — 많이 쓰면 앞부분이 지워짐
AI Studio = "A4 1,500 장짜리 초대형 칠판" — 단행본 전체를 한 번에 올려놓고 대화 가능
수백 페이지 규정집을 한꺼번에 올리고 "5 장과 8 장의 규정을 비교해줘"라고 할 수 있습니다.
"멀티모달"은 여러 형태의 입력을 동시에 처리하는 능력입니다. Chapter 1 에서는 텍스트만 입력했지만, AI Studio 에서는 텍스트와 함께 이미지·영상·오디오를 동시에 넣을 수 있습니다.
| 입력 형태 | 무엇을 할 수 있나 | 활용 예시 |
|---|---|---|
| 텍스트 + 이미지 | 이미지를 보고 분석·설명 도표 해석, 사진 속 텍스트 추출 |
"이 도표의 트렌드를 분석해줘" "이 사진 속 텍스트를 추출해줘" |
| 텍스트 + 영상 | 영상을 보고 내용 요약 강의 핵심 추출 |
"이 강의 영상의 핵심을 요약해줘" "이 영상에서 언급된 데이터를 정리해줘" |
| 텍스트 + 오디오 | 음성을 듣고 텍스트로 변환 회의 내용 정리 |
"이 회의 녹음 내용을 정리해줘" "이 인터뷰의 핵심 발언을 추출해줘" |
DeepMind 는 Google 산하 세계 최고 수준의 AI 연구소입니다. 이 책에서 사용한 많은 기술 — Gemini(Ch.1), Veo(Ch.3), Seedream(Ch.2~3) — 이 모두 DeepMind 에서 개발되었습니다.
| 기술 | 설명 | 관련 Chapter |
|---|---|---|
| Gemini | 텍스트·이미지·영상·오디오 통합 AI 모델 |
Ch.1 (텍스트 생성) Ch.15 (AI Studio) |
| AlphaFold | 단백질 3D 구조 예측 노벨 화학상 수상 기술 |
(과학 연구 분야) |
| Veo | 텍스트 → 시네마틱 영상 생성 모델 |
Ch.3 (영상 생성) |
| Seedream | 고품질 이미지 생성 모델 |
Ch.2 (이미지 생성) Ch.3 (영상 생성) |
| Robotics | AI 기반 로봇 제어·조작 기술 |
(미래 기술 분야) |
DeepMind 는 "자동차 회사의 R&D 센터(연구소)"입니다. 우리가 매일 타는 자동차(Gemini, Veo, Seedream)의 엔진과 기술이 이곳에서 개발됩니다. 일반인이 연구소에 직접 갈 일은 없지만, 연구소가 어떤 기술을 개발하고 있는지 알면 "다음에 어떤 자동차가 나올지" 감을 잡을 수 있습니다.
deepmd.google 에서 최신 연구 논문과 기술 데모를 직접 확인할 수 있습니다.
Google Labs 는 Google 이 개발 중인 실험적 AI 기능을 미리 체험하는 공간입니다. 정식 출시 전 베타 단계의 기능이 공개되며, 사용자 피드백을 받아 개선한 뒤 정식 출시됩니다.
| 특징 | 내용 |
|---|---|
| 베타 기능 체험 | 정식 출시 전 최신 AI 기능을 가장 먼저 경험 |
| 무료 접속 | Google 계정만 있으면 누구나 무료 접속 |
| 수시 업데이트 | 실험 프로젝트가 수시로 추가·변경됨 |
| 피드백 참여 | 사용 후 피드백을 남기면 기능 개선에 반영 |
| 프로젝트 | 설명 |
|---|---|
| NotebookLM Plus | Ch.7 에서 배운 NotebookLM 의 고급 기능 (팟캐스트·요약 등 확장 기능 실험) |
| AI 기반 검색 실험 | Google 검색에 AI 요약·분석이 결합된 차세대 검색 경험 |
| 생성형 이미지/영상 | 최신 이미지·영상 생성 모델의 베타 버전을 미리 체험 |
| AI 코딩 어시스턴트 | 코드 자동 생성·디버깅 등 개발 보조 AI 기능 실험 |
Labs 는 "자동차 시승 센터"입니다. 아직 시판되지 않은 신모델을 미리 타보고, "이런 점이 좋았다, 저런 점은 개선해달라"고 피드백을 줄 수 있습니다. 그 피드백이 반영되어 정식 출시됩니다.
labs.google 에 접속하면 현재 공개된 실험 프로젝트를 확인할 수 있습니다.
Chapter 1~14 에서 매 장마다 프롬프트의 핵심 요소를 정리한 것처럼, Google AI 도구 활용에도 고유한 레시피가 있습니다. AI Studio 에서 최적의 결과를 얻으려면 다음 5 가지를 고려하세요.
| 요소 | 뜻 | 질문 | 예시 |
|---|---|---|---|
| ① 대상 모델 (Model) |
어떤 모델을 사용할 것인가 |
Gemini 2.5 Pro? Flash? 실험 모델? |
"Gemini 2.5 Pro 사용" "Flash 모델로 빠르게" "최신 실험 모델" |
| ② 작업 유형 (Task) |
무엇을 시킬 것인가 |
분석? 요약? 번역? 비교? 생성? |
"이 문서의 핵심을 30 가지로" "5 장과 8 장의 주장을 비교" "이 도표의 트렌드를 분석" |
| ③ 파라미터 (Parameters) |
모델 설정을 어떻게 조정할 것인가 |
온도는? 토큰 수는? 안전 설정은? |
"온도 0.3 으로 정확하게" "온도 0.9 로 창의적으로" "최대 토큰으로" |
| ④ 입력 형태 (Input Type) |
텍스트만? 이미지도? 영상도? 오디오도? |
어떤 형태의 자료를 넣을 것인가? |
"PDF 문서 3 건 업로드" "이미지+텍스트 동시 입력" "영상 URL 입력" |
| ⑤ 실험 목적 (Purpose) |
왜 이 도구를 쓰는 것인가 |
일반 AI 로도 가능한 일인가? AI Studio 만의 강점이 필요한가? |
"100 만 토큰이 필요한 대용량 분석" "멀티모달 분석이 필요" "파라미터 비교 실험" |
AI Studio 활용 5 요소는 "실험실 연구 계획서"와 같습니다.
| 키워드 계열 | 키워드 예시 | 적합한 상황 |
|---|---|---|
| 모델 선택 | • "Gemini 2.5 Pro" — 최고 성능 • "Gemini 2.5 Flash" — 빠른 속도 • "실험 모델" — 최신 베타 |
성능 vs 속도 선택 시 |
| 대용량 분석 | • "이 문서 전체를 분석해줘" • "수백 페이지를 한 번에" • "단행본 전체를 요약해줘" |
100 만 토큰 활용 시 |
| 멀티모달 | • "이 이미지를 분석해줘" • "이 영상의 내용을 요약해줘" • "이 오디오를 텍스트로 변환해줘" |
텍스트 외 입력 활용 시 |
| 파라미터 실험 | • "온도 0.3 으로" "온도 0.9 로" • "같은 질문으로 두 설정 비교" • "토큰 수를 최대로" |
Ch.1 용어를 실제로 실험할 때 |
| 비교·검증 | • "일반 Gemini 와 결과 비교" • "ChatGPT 답변과 비교" • "파라미터별 결과 차이 확인" |
도구·설정 간 비교 실험 |
Chapter 1~14 와 동일한 직원/학생 분리 구조입니다.
| 업무 상황 | 활용 도구 | 구체적 시나리오 |
|---|---|---|
| 학사 — 학칙 전체 교차 분석 |
AI Studio (100 만 토큰) |
"학칙 전문(300 페이지)을 업로드하고 '졸업 관련 조항을 모두 추출해서 표로 정리해줘' → 한 번에 처리" |
| 재정 — 다년도 결산 보고서 비교 |
AI Studio (대용량 분석) |
"3 년치 결산 보고서(각 100 페이지)를 동시에 업로드하고 '연도별 변화 추이를 비교해줘'" |
| 행정 — 회의 녹음 자동 정리 |
AI Studio (멀티모달) |
"회의 녹음 오디오를 업로드하고 '핵심 결정 사항과 담당자를 표로 정리해줘'" |
| 기획 — 최신 AI 기술 동향 파악 |
DeepMind + Labs |
"DeepMind 블로그에서 최신 연구 확인 → Labs 에서 관련 실험 기능 체험 → 기획 보고서에 트렌드 반영" |
| 전공 분야 | 활용 도구 | 구체적 시나리오 |
|---|---|---|
| 경영/경제 — 대용량 보고서 분석 |
AI Studio | "산업 보고서 3 건(총 500 페이지)을 한 번에 업로드하고 '3 개 보고서의 공통 결론을 비교해줘'" |
| 호텔/관광 — 영상 분석 |
AI Studio (멀티모달) |
"호텔 서비스 교육 영상을 입력하고 '이 영상에서 강조하는 서비스 원칙 5 가지를 추출해줘'" |
| 인문/사회 — 논문 대량 분석 |
AI Studio (100 만 토큰) |
"논문 PDF 10 편을 동시에 업로드하고 '각 논문의 방법론·결론을 비교 표로 정리해줘'" |
| 미술/디자인 — 이미지 분석 |
AI Studio (멀티모달) |
"전시 작품 이미지 5 장을 업로드하고 '각 작품의 스타일·기법·색채를 분석해줘'" |
| 통계 — 파라미터 실험 |
AI Studio (파라미터 조정) |
"같은 데이터 분석 질문을 온도 0.2 vs 0.8 로 비교하고 '어떤 설정이 더 정확한지 분석해줘'" |
Chapter 2~14 에서 배운 수정 전략이 Google AI 도구에도 적용됩니다.
| 문제 상황 | 원인 | 해결 방법 |
|---|---|---|
| 분석 결과가 피상적이다 |
질문이 모호하거나 범위가 너무 넓음 |
범위를 좁히기: "전체 요약" → "5 장의 핵심 논거만" |
| 대용량 문서 업로드 후 응답이 느리다 |
Pro 모델은 처리 시간이 김 |
Flash 모델로 전환하여 속도 확보. 정밀 분석이 필요한 부분만 Pro 사용 |
| 이미지 분석이 부정확하다 |
이미지 해상도가 낮거나 복잡함 |
고해상도 이미지 사용. 이미지의 특정 영역을 지정하여 질문 |
| 파라미터를 바꿔도 차이를 못 느끼겠다 |
변화 폭이 작음 |
온도를 극단적으로 설정: 0.0 vs 1.0 으로 비교하면 차이 확연 |
| 일일 사용 한도에 도달했다 |
무료 플랜의 일일 한도 초과 |
다음 날 다시 시도. 또는 Flash 모델(한도 더 넉넉)로 전환 |
| Labs 의 특정 기능이 사라졌다 |
실험 기능이 종료·변경됨 |
Labs 기능은 수시로 바뀜. 정기적으로 방문하여 새 기능 확인 |
이제 직접 해볼 차례입니다. aistudio.google.com 에 접속하여 구글 계정으로 실습합니다.
| 항목 | 내용 |
|---|---|
| 준비물 | 수백 페이지 PDF 또는 긴 문서 |
| 과제 | 100 만 토큰의 위력을 직접 체감해 보세요 |
| 실습 순서 |
① aistudio.google.com 접속 ② 대용량 문서(수백 페이지) 업로드 ③ "이 문서의 핵심 내용을 30 가지로 정리해줘" 질의 ④ "5 장과 8 장의 주장을 비교해줘" 질의 ⑤ 온도 설정을 바꿔가며 결과 차이 비교 |
| 포인트 | Chapter 7 (NotebookLM)에서는 불가능했던 "실시간 대화형 대용량 분석"을 체험하세요. |
| 시간 | 5 분 |
| 항목 | 내용 |
|---|---|
| 준비물 | 이미지·텍스트 혼합 자료 (도표, 차트 캡처 등) |
| 과제 | 텍스트+이미지를 동시에 입력하여 분석해 보세요 |
| 실습 순서 |
① AI Studio 에서 Gemini 모델 선택 ② 이미지+텍스트를 동시에 입력 "이 도표의 트렌드를 분석해줘" ③ 영상 URL 을 입력하여 "이 강의 영상의 핵심 내용 요약" ④ 오디오 파일 업로드하여 "이 회의 녹음 내용 정리해줘" |
| 포인트 | 텍스트만 입력하던 Ch.1 과 비교하여 멀티모달 AI 의 가능성을 체험합니다. |
| 시간 | 5 분 |
| 항목 | 내용 |
|---|---|
| 준비물 | Google 계정 로그인 |
| 과제 | Labs 에서 현재 공개된 최신 기능을 체험해 보세요 |
| 실습 순서 |
① labs.google 접속 ② 현재 공개된 실험 프로젝트 목록 확인 ③ 관심 있는 프로젝트 선택하여 체험 ④ 기존 AI 도구(Ch.1~14)와 차이점 비교 ⑤ DeepMind 블로그에서 관련 기술 배경 확인 |
| 포인트 | "아직 출시되지 않은 기능"을 가장 먼저 경험하는 것이 이 실습의 핵심입니다. |
| 시간 | 5 분 |
| 항목 | 설명 |
|---|---|
| 일일 사용 한도 | AI Studio 는 무료이지만 일일 사용 한도가 있습니다. Pro 모델보다 Flash 모델의 한도가 넉넉합니다. 한도에 도달하면 다음 날 초기화됩니다. |
| Labs 기능의 변동성 |
Labs 의 실험 기능은 예고 없이 추가·변경·종료될 수 있습니다. 특정 기능에 의존하지 말고, 정기적으로 방문하여 새 기능을 체크하세요. |
| 데이터 보안 | AI Studio 에 업로드한 문서는 Google 서버에서 처리됩니다. 개인정보·기밀 문서를 업로드하기 전 학교 정보보안 정책을 확인하세요. |
| 상용 서비스와 차이 인지 |
AI Studio 는 "개발자·실험자용 도구"입니다. 일반 사용자용 Gemini(gemini.google.com)와 인터페이스·기능이 다를 수 있습니다. |
| API 사용 시 비용 발생 가능 |
AI Studio 에서 발급한 API 키를 외부 서비스에 연결하면 사용량에 따라 비용이 발생할 수 있습니다. API 는 이 책의 범위를 넘으므로, 관심 있으면 별도 학습하세요. |
| AI 기술의 빠른 변화 |
이 장에서 소개한 모델·기능은 수개월 내에 업데이트될 수 있습니다. AI 기술은 매우 빠르게 진화하므로, "현재 가능한 것"보다 "탐색하는 습관"이 더 중요합니다. |
이 절은 이 챕터의 마지막 절입니다. 다시 한번 Chapter 1 에서 시작한 여정을 정리합니다.
| 단계 | Chapter | 핵심 주제 |
|---|---|---|
| 1 단계 생성형 AI 입문 |
Ch.1~6 | AI 에게 콘텐츠를 만들게 하고, 심층 분석을 시키고, 나만의 AI 비서를 만드는 법 |
| 2 단계 생성형 AI 활용 |
Ch.7~10 | 문서·웹 서비스·내 컴퓨터까지 AI 활용 범위를 확장하고, 지침 파일로 반복 자동화 |
| 3 단계 생성형 AI 심화 |
Ch.11~15 | 업무 흐름 자동화, AI 챗봇 구축, 웹/앱 서비스 제작, AI 음악 생성, 그리고 AI 기술의 최전선 탐색 |
열다섯 장을 관통하는 세 가지 핵심 원칙:
첫째, "AI 에게 구체적으로 지시할수록, 원하는 결과에 가까워진다." Chapter 1 의 텍스트 프롬프트에서 Chapter 15 의 멀티모달 분석까지, 이 원칙은 한 번도 변하지 않았습니다.
둘째, "반복을 없앤다." 매 단계마다 AI 가 반복적이고 기계적인 일에서 사람을 해방했습니다.
셋째, "작게 시작하여 점진적으로 확장한다." 프롬프트 한 줄(Ch.1)에서 시작하여 업무 자동화(Ch.11), AI 챗봇(Ch.12), 웹 서비스(Ch.13), 음악(Ch.14), 그리고 AI 기술의 최전선(Ch.15)까지 도달했습니다.
Chapter 15 가 다른 장들과 결정적으로 다른 점은 "미래를 바라본다"는 것입니다. Chapter 1~14 에서는 "지금 쓸 수 있는 도구"를 다뤘지만, Chapter 15 에서는 "앞으로 나올 기술"을 미리 체험합니다. AI 기술은 매우 빠르게 진화합니다. 이 책에서 배운 특정 도구보다 더 중요한 것은, "새로운 도구가 나왔을 때 두려움 없이 시도해 보는 습관"입니다. 그 습관을 만드는 것이 Chapter 15 의, 그리고 이 책 전체의 궁극적 목표입니다.