STEP AI · Technical Architecture

기술 아키텍처 분석

AI 프로덕션 파이프라인, 보유 모듈, 기술 스택, 외부 API 연동 — 보유 자산 기반 시스템 설계

8
AI 프로덕션 파이프라인
5
보유 모듈
1
공통 스택
PWA
앱 배포
API
AI 모델 연동
1
공통 기술 스택
모든 모듈이 동일한 스택 — 통합 비용 최소화
Next.js
+ TypeScript
풀스택 프레임워크
SSR + API Routes
🗄️
Supabase
PostgreSQL + Auth
Realtime + Storage
Edge Functions
Vercel
배포 + CDN
서브도메인 라우팅
프로젝트당 50개 도메인 (무료)
📱
PWA
next-pwa
홈화면 설치 + 오프라인
카메라, GPS, 공유하기 API
PWA 선택 근거 (Fact)
네이티브 대비 개발비 40-60% 절감, 시장 출시 50-70% 단축 (Lovable 리서치). STEP의 기능은 PWA로 전부 충분.
2
보유 모듈 — 이미 만들어진 퍼즐 조각
전부 동일 스택. DTU와 STEP It은 Supabase 프로젝트 공유 (op_ 접두사 구분)
모듈상태설명STEP에서의 역할
STEP It v0.3 운영 중 (불안정) 대화 기반 AI 제작 + 6축 프로파일링 + 클릭 UX
Gemini 3.1 Pro Preview
AI 어시스턴트 + 프로파일링
시나리오 초안, 브리프 생성
DTU Operation View DB 완료, 프론트 미완 프로덕션 대시보드 — 태스크/리스크/의사결정 추적
Supabase DB 구축 완료
프로젝트 대시보드 / 파이프라인
DTU AI Collaboration 설계 완료, 미구현 4-Step: Key Message → Story → Scenes → Storyboard
AI 프로덕션 밸류체인 핵심
AI 콘텐츠 생성 파이프라인
AENA KT ENA 실운영 검증 영상 분석→클립 추천→메타데이터→YouTube 업로드
Gemini 영상 분석 + YouTube API
DELIVER + ANALYZE 엔진
STEP Bill 별도 개발 중 예산→지출→정산→세금계산서
네이버 OCR API
SETTLE 모듈 (Lock-in 핵심)
⚠️ 최대 변수
개별 모듈은 존재하나 하나로 묶는 통합 UX가 최대 변수. 기술적으로 동일 스택이라 통합 가능하지만, 사용자 경험 설계가 핵심 과제.
3
AI 프로덕션 파이프라인 — 8단계
각 단계별 AI 역할, 연동 API, 경쟁 도구 (Fact 기반)
💬
시나리오 초안
대화로 구체화
📝
시나리오 완성
전문가급 각본
🎨
콘티/스토리보드
장면분해+시각화
🖼️
웹툰/이미지
AI 이미지 생성
🎬
AI 영상
이미지→영상
🔍
메타데이터
AENA 분석
📤
자동 업로드
YouTube+SNS
📊
분석 보고
성과+리포트
항목내용
AI 역할대화 기반 아이디어 구체화 → LLM 시나리오 완성
STEP 모듈STEP It 프로파일링 + DTU AI Collab
경쟁 도구Sudowrite (Y Combinator, 소설/각본 특화), Saga (스크립트→previz)
각각 단일 기능 특화. 대화 기반 UX 없음.
STEP 차별점프롬프트 없이 대화로 시나리오 완성 + 다음 단계(콘티)로 데이터 자동 연결
항목내용
AI 역할스크립트→장면분해→샷리스트→스토리보드 자동 생성
STEP 모듈DTU AI Collab 4-Step: Key Message→Story→Scenes→Storyboard
경쟁 도구Storyboarder.ai, Boords (스크립트→프레임), Katalist, StoryboardHero
스크립트→시각화만. 시나리오 작성 기능 없음.
시장 규모$284M (2025) → $410M (2032), CAGR 5.5% (Jenova)
항목내용
AI 역할AI 이미지/웹툰 생성 — 외부 API 연동
연동 APIDALL-E 3 Stable Diffusion Midjourney
경쟁 도구Dashtoon (생성→퍼블리싱→수익화 통합), Tooning (삼성 C-Lab, 시리즈A ₩43억), LlamaGen, Anifusion
시장 규모$10.85B (2025) → $60.25B (2031), CAGR 33.1% (Jenova)
항목내용
AI 역할이미지→영상 변환 — 외부 API 연동 (직접 경쟁 X)
연동 APIRunway Gen-3 Kling AI Veo 3.1 Sora 2
경쟁 도구Runway, Kling, Pika Labs, Veo (Google), Sora (OpenAI)
수십억 달러 투자. 직접 경쟁 X → API 연동이 정답
시장 규모$3.67B (2026) → $24.89B (2036), CAGR 21.4% (Jenova)
항목내용
AI 역할영상 분석 + 메타데이터 자동 생성 + YouTube/SNS 업로드 + 예약 스케줄링
STEP 모듈AENA Gemini 영상 분석 + YouTube Data API v3 KT ENA 검증 완료
경쟁 도구n8n + YouTube API (오픈소스), Fliki (아이디어→영상→업로드), AutoTube (GitHub)
이미 무료 오픈소스로 가능. 차별점 = 밸류체인 연결.
항목내용
AI 역할YouTube Analytics + 크로스 플랫폼 대시보드 + AI 인사이트 + 프로젝트 ROI
연동 APIYouTube Analytics API Instagram Graph API TikTok API
경쟁 도구TubeBuddy, VidIQ, SocialBlade, Zapier/n8n
범용 도구로 커버 가능. 차별점 = 제작비(STEP Bill) vs 수익 자동 연결.
⚠️ 핵심 전략: STEP은 AI 모델을 직접 만들지 않는다
영상/이미지 생성은 API 연동. STEP의 가치 = 개별 AI 기능이 아니라 밸류체인 전체를 하나로 묶는 오케스트레이션 레이어.
4
AI API 연동 전략
멀티 모델 라우팅 — 단계별 최적 AI 선택
텍스트 / 시나리오
Claude — 분석, 장문 생성
GPT — UI/UX 기획, 대화
Gemini — 영상 분석, 멀티모달
현재: Gemini 3.1 Pro Preview
이미지 / 스토리보드
DALL-E 3 — OpenAI API
Stable Diffusion — 오픈소스/API
Midjourney — API (제한적)
영상 생성
Runway Gen-3
Kling AI
Google Veo 3.1
OpenAI Sora 2
영상 분석 (AENA)
Gemini — 영상→장면/클립/쇼츠/PPL 분석
메타데이터 자동 생성
KT ENA 검증 완료
OCR / 문서
네이버 OCR API — 영수증 인식→비용 자동 매칭
STEP Bill 정산 모듈
개발 중
5
시스템 아키텍처 — 레이어 구조
보유 모듈이 STEP 플랫폼에서 어떻게 결합되는가
CLIENT LAYER — PWA (Next.js + next-pwa)
📱 모바일 캡처 UI🖥️ PC 대시보드🎬 프로덕션 파이프라인 (DTU)✅ 리뷰 인터페이스💰 STEP Bill UI🌐 프로젝트 소개 페이지
API LAYER — Next.js API Routes + Edge Functions
캡처 APIAI 오케스트레이션프로젝트 CRUD팀 관리리뷰/승인정산 처리SNS 링크 파싱
AI LAYER — 멀티 모델 라우팅
LLM (Claude/GPT/Gemini)이미지 생성 API영상 생성 APIAENA 영상 분석네이버 OCRAI 분류 엔진
DATA LAYER — Supabase (PostgreSQL + Storage + Realtime)
프로젝트 DB미디어 Storage유저/팀 Auth정산 데이터Realtime 협업프로파일링 (op_ prefix)
EXTERNAL API — 외부 연동
YouTube Data API v3YouTube Analytics APIInstagram Graph APITikTok APIMeta Ads LibraryVercel (배포+도메인)
6
현재 밸류체인 — 끊어진 도구들
크리에이터/프로덕션 팀이 지금 쓰는 도구: 모두 밸류체인과 단절
밸류체인 단계기존 도구문제STEP 대응
기획/시나리오Google Docs, Notion밸류체인과 단절됨STEP It AI
스토리보드Storyboarder.ai, Boords시나리오와 별개 도구DTU AI Collab
이미지/웹툰Dashtoon, Midjourney또 별개 도구이미지 API
영상 제작Runway, Kling, Premiere또 별개 도구영상 API
리뷰/피드백Frame.io, KROCK.io영상 리뷰만 특화REVIEW 모듈
배포YouTube Studio, TubeBuddy또 별개 도구AENA
프로젝트 관리Monday, Asana, Trello크리에이티브와 단절DTU Operation
정산엑셀, 카톡수작업, 오류STEP Bill
STEP의 기술적 차별점
개별 AI에서 이기는 게 아니라, 밸류체인 전체를 하나의 데이터 파이프라인으로 묶는 오케스트레이션 레이어가 STEP의 핵심. end-to-end 풀파이프라인(시나리오→콘티→영상→배포→분석)을 하나로 묶은 제품 = 글로벌에도, 한국에도 없음.
신규 발견: Kuse AI
2024년 설립, 60일 만에 $9M ARR 달성 (VC/광고 없이 순수 제품 채택). 300K+ 유저, 100개국. "Figma meets ChatGPT meets Notion" 포지셔닝. AI 비주얼 캔버스 + 멀티미디어. 범용이지만 크리에이티브 워크플로우 타겟. 단, M&E 프로덕션 특화(정산, 타임코드, 프리랜서, 프로젝트 단위)는 없음.
STEP AI — 기술 아키텍처 분석 · 2026.03.05 · 모든 내용은 논의 기반 Fact + 시장 데이터 · 추측 없음