Chapter 1 에서 AI 에게 "글"을 쓰게 했고, Chapter 2 에서 "이미지"를 만들게 했습니다. 이번 장에서는 한 단계 더 나아가, AI 에게 "동영상"을 만들게 하는 방법을 다룹니다.
"동영상을 만들려면 카메라, 편집 프로그램, 전문 인력이 필요하지 않나?" 그랬습니다. 하지만 지금은 웹 브라우저에서 문장 하나를 입력하면 몇 초~몇 분 만에 영상 클립이 생성되는 시대입니다. 캠퍼스 홍보 영상 시안, 수업 인트로 영상, 행사 안내 클립 — 이 모든 것을 촬영 장비 없이 만들 수 있습니다.
물론 AI 가 만드는 영상이 전문 촬영팀의 결과물을 완전히 대체하지는 않습니다. 하지만 "시안 단계에서 방향을 잡거나", "짧은 클립으로 분위기를 전달하거나", "발표·수업 자료에 움직이는 비주얼을 넣는 용도"로는 이미 충분히 실용적입니다. 지금부터 하나씩 따라와 주세요.
원리는 Chapter 2 의 이미지 생성과 크게 다르지 않습니다. 여러분이 원하는 장면을 문장으로 설명하면, AI 가 그 문장을 분석하여 움직이는 영상을 생성합니다. 이때 입력하는 문장을 "영상 프롬프트"라고 부릅니다.
Chapter 2 에서 배운 이미지 프롬프트가 "한 장의 사진을 의뢰하는 것"이었다면, 영상 프롬프트는 "움직이는 장면을 의뢰하는 것"입니다. 따라서 이미지 프롬프트의 5 요소(주제·스타일·구도·색감·용도)에 더해, "무엇이 움직이는가"와 "카메라가 어떻게 움직이는가"를 추가로 알려줘야 합니다.
또 하나 알아둘 점이 있습니다. 현재 AI 영상 생성 도구는 대부분 5 초~15 초 내외의 짧은 클립을 만듭니다. 30 분짜리 다큐멘터리를 한 번에 만들 수는 없습니다. 하지만 짧은 클립 여러 개를 이어 붙이면 충분히 의미 있는 영상을 구성할 수 있습니다.
현재 대표적인 AI 영상 생성 도구는 세 가지입니다. Chapter 2 에서 이미지 도구를 비교한 것과 같은 방식으로, 각 도구의 성격과 추천 용도를 살펴봅니다.
Veo 는 Google 이 만든 영상 생성 모델로, 영화 같은 분위기의 영상을 만드는 데 가장 뛰어납니다. 카메라가 천천히 이동하거나, 하늘에서 내려다보는 드론 샷 같은 역동적인 움직임을 자연스럽게 표현합니다.
| 항목 | 내용 |
|---|---|
| 핵심 강점 | 시네마틱 품질의 영상 자동 생성, 카메라 움직임 제어에 탁월 |
| 작동 방식 | 장면·카메라 움직임을 포함한 프롬프트 입력 → 영상 생성 |
| 영상 품질 | ★★★ — 영화·광고급 분위기 연출 가능 |
| 카메라 제어 | 패닝(좌우 이동)·줌·트래킹(추적 촬영) 등 세밀한 제어 가능 |
| Image→Video | 지원 — 이미지를 넣으면 그 이미지가 움직이는 영상으로 변환 |
| 난이도 | ● 보통 — 카메라 키워드를 알면 결과가 크게 향상 |
| 상황 | 프롬프트 예시 |
|---|---|
| 캠퍼스 홍보 영상 | "경희대 캠퍼스를 드론으로 촬영한 듯한 시네마틱 영상, 봄 벚꽃 배경" |
| 수업 인트로 영상 | "우주 배경에서 지구로 줌인하는 과학 다큐멘터리 스타일 오프닝" |
| 시즌 분위기 클립 | "가을 단풍이 떨어지는 캠퍼스 벤치, 따뜻한 조명, 슬로우모션" |
| 학과 소개 비주얼 | "도서관 내부를 천천히 걸어가는 듯한 트래킹 샷, 따뜻한 실내 조명" |
Kling 은 인물이 등장하는 영상에 특히 강한 도구입니다. 사람의 자연스러운 동작, 표정 변화, 심지어 입 모양까지 동기화하는 "립싱크" 기능을 지원합니다. 또한 이미 만들어 둔 이미지를 영상으로 변환하는 기능도 뛰어납니다.
| 항목 | 내용 |
|---|---|
| 핵심 강점 | 인물의 자연스러운 동작·표정 표현, 립싱크 기능 지원 |
| 작동 방식 | 프롬프트 또는 이미지 입력 → 인물 중심 영상 생성 |
| 영상 품질 | ★★☆ — 풍경보다 인물 영상에서 품질이 높음 |
| 카메라 제어 | 기본 제어 — Veo 보다 카메라 움직임 옵션은 제한적 |
| Image→Video | 지원 (강점) — 정지 이미지를 넣으면 인물이 움직이는 영상으로 변환 |
| 난이도 | ● 쉬움~보통 — 빠른 생성 속도로 여러 번 시도하기 좋음 |
| 상황 | 프롬프트 예시 |
|---|---|
| 안내 영상 | "도서관 이용 안내를 설명하는 캐릭터가 손짓하며 말하는 영상" |
| 행사 초대 클립 | "축제 포스터 이미지에서 불꽃놀이가 터지는 애니메이션 영상으로 변환" |
| 인사·환영 영상 | "정장 차림의 인물이 카메라를 보며 인사하는 3 초 클립" |
| 이미지→영상 변환 | "Chapter 2 에서 만든 AI 이미지를 넣으면 그 이미지 속 요소가 움직이는 영상 생성" |
Seedream 은 Chapter 2 에서 이미지 도구로도 소개한 Google DeepMind 기반 모델입니다. 이미지뿐 아니라 영상도 생성할 수 있으며, 포토리얼리즘(사진처럼 사실적인) 수준의 화질이 가장 큰 특징입니다. 생성 시간이 다소 길지만, 최종 결과물의 품질은 세 도구 중 가장 높습니다.
| 항목 | 내용 |
|---|---|
| 핵심 강점 | 포토리얼리즘 수준의 고품질 화질, 이미지+영상 동시 지원 |
| 작동 방식 | 프롬프트 입력 → 고품질 영상 생성 (시간 다소 소요) |
| 영상 품질 | ★★★ — 방송·인쇄급 결과물에 적합 |
| 카메라 제어 | 기본 제어 — Veo 만큼 세밀하지는 않으나 충분히 활용 가능 |
| Image→Video | 지원 — 고품질 이미지를 고품질 영상으로 변환 |
| 난이도 | ● 보통 — 고품질 키워드 활용이 핵심 |
| 상황 | 프롬프트 예시 |
|---|---|
| 공식 홍보 영상 | "경희대 캠퍼스 전경, 사실적 영상, 가을 단풍 배경, 시네마틱 색감" |
| 고품질 배경 영상 | "미래 도시 풍경, 야경, 네온 조명이 반사되는 유리 건물, 4K 수준" |
| 학과 소개 영상 | "호텔경영학과 — 고급 호텔 로비에서 손님을 맞이하는 장면, 전문적 분위기" |
| 행사 오프닝 영상 | "경희대 로고가 빛나며 등장하는 고급스러운 오프닝 모션, 다크 배경" |
Midjourney 는 이미지 생성에 특화된 대표적 AI 도구로, 특히 예술적·회화적 스타일에 탁월한 품질을 보여줍니다. 영상 생성 기능은 아직 제한적이지만, "영상의 핵심 장면을 이미지로 먼저 만드는" 용도로 매우 유용합니다.
어떤 도구를 선택할지 고민될 때, 아래 표를 기준으로 판단하세요.
| 구분 | Veo | Kling | Seedream |
|---|---|---|---|
| 한 줄 요약 | 시네마틱 영화 감독 | 인물 전문 배우 | IMAX 촬영 감독 |
| 핵심 강점 | 시네마틱 품질 카메라 움직임 제어 |
인물 동작·립싱크 이미지→영상 변환 |
최고 화질 사실적 표현 |
| 생성 속도 | ★★ 보통 | ★★★ 빠름 | ★ 다소 느림 |
| 영상 품질 | ★★★ | ★★☆ | ★★★ |
| 카메라 제어 | 패닝·줌·트래킹 (가장 세밀) |
기본 제어 | 기본 제어 |
| Image→Video | 지원 | 지원 (강점) | 지원 |
| 추천 용도 | 풍경·홍보·인트로 분위기 영상 |
인물·안내·인사 이미지 변환 영상 |
공식 홍보·고품질 최종 결과물 |
Chapter 1 에서 텍스트 프롬프트의 4 요소를, Chapter 2 에서 이미지 프롬프트의 5 요소를 배웠습니다. 영상 프롬프트에도 비슷한 "레시피"가 있습니다. 이미지와 달리, 영상에는 "움직임"이 추가되므로 요소가 약간 달라집니다.
| 요소 | 뜻 | 질문 | 예시 |
|---|---|---|---|
| ① 장면 (Scene) |
화면에 무엇이 보이는가 |
어떤 배경과 대상이 있는가? |
"벚꽃 핀 캠퍼스 중앙광장" "고급 호텔 로비" "야경이 보이는 도시 전경" |
| ② 동작 (Motion) |
무엇이 어떻게 움직이는가 |
사람·사물·자연이 어떻게 움직이는가? |
"학생들이 걸어가고 꽃잎이 날린다" "물결이 잔잔히 흐른다" "인물이 카메라를 보며 인사한다" |
| ③ 카메라 (Camera) |
카메라가 어떻게 움직이는가 |
어떤 앵글·움직임 으로 촬영할 것인가? |
"드론 샷으로 천천히 줌아웃" "왼쪽에서 오른쪽으로 패닝" "인물을 따라가는 트래킹 샷" |
| ④ 분위기 (Mood) |
조명·색감·톤 | 어떤 느낌의 영상인가? |
"따뜻한 오후 햇살, 시네마틱 색감" "네온 조명, 미래적 분위기" "부드러운 새벽 안개" |
| ⑤ 길이·형식 (Format) |
영상 길이와 화면 비율 |
몇 초짜리, 가로형/세로형? |
"5 초, 16:9 가로형" "3 초, 9:16 세로형(릴스용)" "10 초, 루프 가능" |
Chapter 2 의 이미지 프롬프트와 비교하면, 핵심 차이는 "동작"과 "카메라 움직임"이 추가된다는 점입니다.
| 구분 | 이미지 프롬프트 (Ch.2) | 영상 프롬프트 (Ch.3) |
|---|---|---|
| 결과물 | 정지된 한 장의 이미지 | 움직이는 영상 클립 (3~15 초) |
| 공통 요소 | 주제·스타일·구도·색감·용도 | 장면(=주제)·분위기(=색감)·형식(=용도) |
| 추가 요소 | 없음 | 동작 + 카메라 움직임 |
| 핵심 질문 | "어떤 그림을 그릴까?" | "어떤 장면이 어떻게 움직일까?" |
영상 프롬프트에서 카메라 움직임은 결과에 큰 영향을 미칩니다. 아래 키워드를 참고하여 프롬프트에 넣어 보세요. 영어 키워드를 그대로 사용해도 되고, 한글 설명으로 써도 AI 가 이해합니다.
| 키워드 | 움직임 설명 | 적합한 장면 |
|---|---|---|
| Pan left / Pan right (패닝) |
카메라가 제자리에서 좌우로 회전하며 촬영 |
넓은 풍경을 훑어볼 때 건물 전체를 보여줄 때 |
| Zoom in / Zoom out (줌) |
화면을 점점 확대하거나 축소 |
특정 대상을 강조할 때 전체 → 상세 또는 상세 → 전체 |
| Tracking shot (트래킹) |
카메라가 대상을 따라 함께 움직이며 촬영 |
걷는 인물을 따라갈 때 복도·길을 따라 이동할 때 |
| Drone shot (드론 샷) |
하늘에서 내려다보는 조감도 느낌의 촬영 |
캠퍼스 전경, 건물 외관 넓은 공간의 규모감 표현 |
| Slow motion (슬로우모션) |
동작을 느리게 재생 | 꽃잎·눈·물방울이 떨어지는 장면 감성적 분위기 강조 |
| Fixed / Static (고정 촬영) |
카메라를 고정하고 대상만 움직임 |
인물 인터뷰 느낌 안정적인 안내 영상 |
Chapter 1·2 와 동일한 패턴으로, 영상 프롬프트도 비교해 보겠습니다.
| 구분 | 짧은 프롬프트 (❌) | 구조화된 프롬프트 (✓) |
|---|---|---|
| 입력 예시 | "캠퍼스 영상 만들어줘" | "벚꽃이 만개한 경희대 중앙광장을 드론으로 촬영한 듯한 홍보 영상. 광장에서 시작해 도서관 방향으로 천천히 이동. 따뜻한 오후 햇살, 시네마틱 색감, 5 초, 16:9 가로형." |
| 결과 | AI 가 임의로 판단한 평범한 캠퍼스 클립. 카메라·분위기 제각각. |
5 요소가 모두 지정되어 원하는 구도·동작·분위기의 영상을 한 번에 획득. |
이 절에서는 대학 구성원이 실제로 필요한 영상 유형별로, 어떤 도구를 선택하고 프롬프트를 어떻게 쓰면 좋은지 구체적인 예시를 제공합니다. Chapter 1 의 텍스트 예시, Chapter 2 의 이미지 예시와 같은 구조입니다.
| 업무 상황 | 추천 도구 | 프롬프트 예시 |
|---|---|---|
| 학사 — 수강신청 안내 영상 | Kling | "수강신청 안내 캐릭터가 화면 중앙에서 노트북을 펼치며 안내하는 모션. 밝고 깔끔한 배경, 정면 고정 촬영, 3 초 클립, 16:9." |
| 행정 — 캠퍼스 홍보 영상 시안 | Veo | "경희대 정문에서 시작하여 캠퍼스 안으로 천천히 진입하는 드론 샷. 봄 벚꽃 배경, 시네마틱 색감, 5 초, 16:9." |
| 인사 — 신임 직원 환영 영상 클립 | Kling | "밝은 사무실에서 직원들이 박수치며 환영하는 장면. 카메라 고정, 따뜻한 조명, 자연스러운 분위기, 3 초 클립." |
| 교무 — 졸업식 오프닝 영상 | Seedream | "학사모를 공중에 던지는 졸업생들의 뒷모습. 푸른 하늘, 슬로우모션, 시네마틱 색감. 고품질 사실적 스타일, 5 초, 16:9." |
| 전공 분야 | 추천 도구 | 프롬프트 예시 |
|---|---|---|
| 경영/경제 — 발표 오프닝 | Veo | "글로벌 비즈니스를 상징하는 세계 지도 위에 연결선이 하나씩 생기는 모션 그래픽. 다크 네이비 배경, 네온 포인트, 3 초, 16:9." |
| 호텔/관광 — 서비스 홍보 클립 | Seedream | "5 성급 호텔 로비에 손님이 들어오고 직원이 맞이하는 장면. 은은한 조명, 고급스러운 분위기, 트래킹 샷, 5 초, 16:9, 사실적 스타일." |
| 인문/사회 — 학술 발표 비주얼 | Veo | "오래된 도서관에서 책장을 따라 카메라가 천천히 이동하는 장면. 따뜻한 조명, 먼지 입자 효과, 빈티지 분위기, 5 초." |
| 미술/디자인 — 전시 티저 영상 | Seedream | "어두운 갤러리에서 스포트라이트가 하나씩 켜지며 작품을 비추는 장면. 미니멀한 공간, 드라마틱 조명, 슬로우모션, 5 초." |
| 통계 — 데이터 시각화 인트로 | Veo | "숫자와 그래프가 떠다니는 디지털 공간에서 카메라가 줌인하며 핵심 차트에 도달. 다크 배경, 네온 글로우 효과, 3 초, 16:9." |
Chapter 2 에서 이미지 프롬프트의 수정 전략을 배웠습니다. 영상 프롬프트도 동일한 원칙이 적용됩니다. 다만, 영상은 이미지보다 변수가 많으므로(동작, 카메라 움직임 등) 수정이 필요한 경우가 더 잦습니다.
| 문제 상황 | 원인 | 해결 방법 (프롬프트 수정) |
|---|---|---|
| 영상이 너무 정적이다 (사진처럼 멈춰 있음) |
동작 키워드를 넣지 않았음 |
"바람에 나뭇잎이 흔들린다" "사람들이 걸어간다" 등 구체적 동작 추가 |
| 카메라가 너무 빠르게 움직인다 |
카메라 속도를 지정하지 않았음 |
"천천히", "slowly", "gentle movement" 추가 |
| 인물 동작이 부자연스럽다 |
Veo/Seedream 은 인물에 상대적으로 약함 |
Kling 으로 도구 변경, 또는 인물 대신 풍경 위주로 전환 |
| 전체적으로 어두운 영상이 나온다 |
조명·시간대를 지정하지 않았음 |
"밝은 낮", "화창한 오후", "스튜디오 조명" 추가 |
| 원하는 장면과 전혀 다른 결과 |
프롬프트가 너무 모호했음 |
5 요소(장면·동작·카메라·분위기·형식) 중 빠진 요소를 채우기 |
| 영상 길이가 너무 짧다 |
길이를 명시하지 않았음 |
"5 초", "10 초" 등 원하는 길이 명시 (도구별 최대 길이 상이) |
이미지와 같은 3 단계 루틴을 영상에도 적용합니다.
이제 직접 해볼 차례입니다. Chapter 1 에서 텍스트 프롬프트를, Chapter 2 에서 이미지 프롬프트를 만들었던 것과 같은 방식으로, 이번에는 영상 프롬프트를 작성합니다.
| 항목 | 내용 |
|---|---|
| 과제 | 우리 대학 캠퍼스의 아름다운 풍경을 담은 5 초 홍보 클립을 AI 로 만들어 보세요 |
| 추천 도구 | Veo (시네마틱 풍경 영상에 최적) |
| 참고 프롬프트 | "경희대 캠퍼스를 드론으로 촬영한 듯한 홍보 영상을 만들어줘. 봄 벚꽃 배경, 중앙광장에서 시작해 도서관 방향으로 천천히 이동, 시네마틱 색감, 5 초, 16:9." |
| 시간 | 5 분 |
| 항목 | 내용 |
|---|---|
| 과제 | 수업이나 발표의 시작을 알리는 3 초 오프닝 영상을 만들어 보세요 |
| 추천 도구 | Veo 또는 Seedream (모션 그래픽 느낌에 적합) |
| 참고 프롬프트 | "AI 기술 강의의 오프닝 영상을 만들어줘. 디지털 회로 패턴이 흐르다가 'AI 입문' 텍스트가 나타나는 모션, 미래적 파란색 톤, 3 초, 16:9." |
| 시간 | 5 분 |
| 항목 | 내용 |
|---|---|
| 과제 | 학교 행사(축제·세미나·공연 등)를 알리는 5 초 안내 영상을 만들어 보세요 |
| 추천 도구 | Kling (인물 등장 시) 또는 Veo (풍경 중심 시) |
| 참고 프롬프트 | "경희대 가을축제 안내 영상을 만들어줘. 단풍 배경의 캠퍼스에서 학생들이 즐기는 장면, 축제 분위기 조명, 밝고 활기찬 톤, 5 초, 세로형." |
| 시간 | 5 분 |
Chapter 2 에서 AI 이미지 활용 시 주의사항을 다루었습니다. AI 영상에도 동일한 원칙이 적용되며, 영상 특유의 추가 고려사항이 있습니다.
| 항목 | 설명 |
|---|---|
| 영상 길이 제한 | 현재 AI 영상 도구는 대부분 3~15 초 내외의 짧은 클립을 생성합니다. 긴 영상이 필요하면 여러 클립을 만들어 영상 편집 도구로 이어 붙이세요. |
| 음성·음악 미포함 | AI 가 생성하는 영상에는 소리가 없습니다. 배경 음악이나 나레이션은 별도로 추가해야 합니다. (무료 음원 사이트나 AI 음악 생성 도구 활용 가능) |
| 인물 표현의 한계 | AI 가 만든 인물은 손가락·관절 등이 부자연스러울 수 있습니다. 인물이 핵심인 영상은 결과를 반드시 확인하고, 어색한 부분은 다시 생성하세요. |
| 저작권·초상권 | Chapter 2 와 동일 — 실존 인물의 영상 생성은 초상권 문제가 발생합니다. 공식 용도로 사용 전 서비스 이용약관을 확인하세요. |
| 파일 형식·호환성 | AI 가 생성한 영상 파일이 파워포인트·한글 등에 바로 삽입되지 않을 수 있습니다. 필요시 MP4 형식으로 변환 후 사용하세요. |
| 영상은 "시안"으로 활용 |
현재 AI 영상의 품질은 "전문 촬영을 대체"하기보다 "시안 확인·방향 제시·보조 소재"에 적합합니다. 공식 홍보 영상은 AI 시안을 기반으로 전문 촬영을 병행하는 것이 이상적입니다. |
Chapter 1 부터 3 까지 배운 내용을 한눈에 정리합니다. 세 장의 구조가 동일한 패턴으로 이어져 있음을 확인해 보세요.
| 구분 | Chapter 1 텍스트 생성 |
Chapter 2 이미지 생성 |
Chapter 3 영상 생성 |
|---|---|---|---|
| AI 에게 시키는 일 | 글을 쓰게 한다 | 이미지를 그리게 한다 |
영상을 만들게 한다 |
| 프롬프트 요소 | 역할·맥락·조건·형식 (4 요소) |
주제·스타일·구도· 색감·용도 (5 요소) |
장면·동작·카메라· 분위기·형식 (5 요소) |
| 비유 | 식당에서 주문하기 | 인테리어 의뢰서 | 영화 촬영 지시서 |
| 대표 도구 | ChatGPT·Claude Gemini·Perplexity |
Nano Banana GPT Image·Seedream |
Veo·Kling Seedream |
| 핵심 원칙 | 구체적으로 쓸수록 결과가 좋아진다 |
구체적으로 쓸수록 결과가 좋아진다 |
구체적으로 쓸수록 결과가 좋아진다 |
| 수정 전략 | Step 1~4 반복 | 3 단계 루틴 | 3 단계 루틴 (동일) |
세 장을 관통하는 핵심 원칙은 하나입니다: "AI 에게 구체적으로 지시할수록, 원하는 결과에 가까워진다." 글이든, 이미지든, 영상이든 이 원칙은 변하지 않습니다.