
Veo 3.1 업데이트로 '생성' 넘어 '연출'과 '편집'까지... AI 네이티브 편집 시대 개막
[2025년 10월 18일, 서울] 구글(Google)이 자사의 AI 영화 제작 도구 '플로우(Flow)'에 최신 비디오 생성 모델인 'Veo 3.1'을 통합하며 AI 영상 제작 시장의 판도를 뒤흔들고 있다. 단순한 '텍스트-투-비디오' 생성을 넘어, 이제는 영상 내 객체를 자유자재로 삽입·제거하고, 장면에 맞는 음향까지 생성해내는 '올인원(All-in-One)' 제작 환경을 선보인 것이다. 이는 아이디어 구상부터 최종 편집까지, AI가 영상 제작의 전 과정(workflow)을 주도하는 'AI 네이티브' 영화 제작 시대의 본격적인 개막을 알리는 신호탄으로 분석된다.
지난 5월 구글 I/O 2025에서 처음 공개된 '플로우'는 OpenAI의 '소라(Sora)'와 같은 단일 생성 모델이 아니다. 플로우는 구글 딥마인드(DeepMind)의 가장 강력한 AI 모델들을 한데 묶어 창작자가 실제 '작업'을 할 수 있도록 설계한 전문 인터페이스이자 플랫폼이다.
플로우의 핵심은 구글의 주력 모델 3인방의 통합에 있다:
Veo (베오): 고품질의 시네마틱 비디오를 생성하는 영상 모델 (최근 3.1로 업데이트)
Imagen (이마젠): 사실적인 이미지와 시각적 '재료(Ingredients)'를 만드는 이미지 모델
Gemini (제미나이): 창작자의 복잡하고 미묘한 자연어 프롬프트를 이해하고 전체 생성 과정을 조율하는 두뇌 역할
구글의 비즈니스용 AI 영상 도구인 '비드(Vids)'가 구글 워크스페이스 내에서 프레젠테이션용 영상을 만드는 데 초점을 맞춘다면, '플로우'는 영화감독, 광고 제작자, 아티스트 등 전문 '크리에이티브' 집단을 겨냥한 프리미엄 도구다. 현재 구글 AI 프로(Pro) 및 울트라(Ultra) 유료 구독 플랜을 통해 제공되며, 이는 플로우가 단순한 실험작이 아닌, 구글의 핵심 AI 수익 모델 중 하나임을 시사한다.
플로우의 진정한 가치는 이름 그대로 '작업 흐름(Workflow)'의 재정의에 있다. 기존 AI 영상 제작이 '프롬프트 입력 -> 결과물 확인 -> 외부 편집 툴(어도비 프리미어 등)에서 수정'의 단계를 거쳤다면, 플로우는 이 모든 과정을 단일 플랫폼 안으로 끌어들였다.
주요 기능은 다음과 같다:
다양한 생성 모드:
텍스트 투 비디오 (Text to Video): 기본적인 텍스트 명령으로 영상 클립 생성.
프레임 투 비디오 (Frames to Video): 영상의 시작과 끝 프레임(이미지)을 지정하여 그 사이를 AI가 자연스럽게 채우는 방식.
재료 투 비디오 (Ingredients to Video): 특정 캐릭터, 소품, 배경 이미지를 '재료'로 등록하면, AI가 이 요소들의 일관성을 유지하며 여러 다른 장면을 생성. 이는 AI 영상의 고질적인 문제였던 '인물 일관성'을 획기적으로 개선한다.
연출 및 편집 도구:
씬빌더 (Scenebuilder): 생성된 여러 클립을 타임라인에 붙여 하나의 내러티브로 '스티칭(stitching)'하고, 클립 길이를 연장('Extend')하며 이야기의 흐름을 구축한다.
카메라 제어: 줌(Zoom), 팬(Pan), 틸트(Tilt) 등 정교한 카메라 워크를 프롬프트로 제어하여 역동적인 연출이 가능하다.
최근(2025년 10월 중순) 적용된 Veo 3.1 모델 업데이트는 플로우를 단순한 편집기를 넘어 'AI 후반 작업 스튜디오'로 격상시켰다.
1. 네이티브 오디오 생성 (Native Audio): 가장 큰 변화는 '소리'다. 이전까지의 AI 영상이 '무성 영화'에 가까웠다면, Veo 3.1은 장면에 맞는 환경음, 효과음, 심지어 자연스러운 대화까지 영상과 동기화하여 생성해낸다. "비 내리는 거리"를 생성하면 빗소리와 차 지나가는 소리가 포함되는 식이다. 이는 '연출', '편집', '사운드'라는 영상 제작의 3대 요소가 처음으로 AI 안에서 통합되었음을 의미한다.
2. 인-비디오(In-Video) 편집: 획기적인 기능도 추가됐다.
'삽입(Insert)' 도구: 이미 생성된 영상 속 특정 위치에 새로운 객체를 추가할 수 있다. 예를 들어, "빈 테이블 위에 커피잔을 올려줘"라고 명령하면, 플로우가 주변 조명과 그림자를 자동으로 계산하여 마치 원래부터 그곳에 있었던 것처럼 자연스럽게 객체를 삽입한다.
'제거(Remove)' 도구: 영상 속 불필요한 인물이나 사물을 지우면, AI가 해당 공간의 배경을 완벽하게 재구성하여 빈자리를 메운다.
구글 플로우의 이러한 진화는 AI 영상 시장을 넘어 전통적인 영상 편집 소프트웨어 시장에도 막대한 파급력을 미칠 전망이다.
1. 경쟁 구도의 재편: OpenAI의 소라(Sora)가 '놀라운 생성 품질'로 시장의 기대감을 높였다면, 구글 플로우는 '실제 사용 가능한 워크플로우'로 응수했다. 런웨이(Runway), 피카 랩스(Pika Labs) 등 경쟁사들이 제공하던 개별 기능을 하나의 강력한 플랫폼으로 통합하며 '원스톱' 솔루션을 제시한 것이다.
2. '포스트 프로덕션'의 종말?: 플로우의 '삽입', '제거', '오디오 생성' 기능은 전통적인 영상 제작 과정에서 막대한 시간과 비용이 드는 '후반 작업(Post-Production)' 영역을 AI가 대체하기 시작했음을 보여준다. 복잡한 VFX(시각 특수 효과)나 사운드 디자인 작업이 AI 프롬프트 몇 줄로 단순화될 수 있다.
3. 새로운 창작자의 탄생: 전문적인 촬영 장비나 고가의 편집 소프트웨어 없이도, '아이디어'와 '연출력'만 있다면 누구나 시네마틱한 영상을 만들 수 있는 시대가 열리고 있다. 플로우는 기술의 장벽을 낮춰, '1인 영화 제작자' 또는 'AI 네이티브 아티스트'라는 새로운 직군을 탄생시킬 촉매제가 될 것이다.
AXINOVA(AI 전문 평생교원) R&D 원장 최득진 박사는 "구글 플로우는 AI가 단순히 영상을 '만들어주는' 도구가 아니라, 창작자와 함께 '고민하고 연출하며 편집하는' 창의적인 파트너가 될 수 있음을 증명했다"라며, "이는 콘텐츠 제작의 패러다임이 근본적으로 바뀌는 거대한 흐름(Flow)의 시작"이라고 평가했다.