AutoVideo-RVC adalah generator video pendek vertikal (9:16) otomatis untuk TikTok, Instagram Reels, dan YouTube Shorts yang berjalan 100% lokal.
Aplikasi ini menggabungkan Edge-TTS (audio narasi), RVC V2 yang diakselerasi GPU NVIDIA (CUDA) untuk mengubah vokal secara offline, Pillow untuk me-render subtitle dinamis, dan MoviePy untuk penyusunan klip B-roll tanpa adegan ganda.
Antarmuka pemrosesan video massal secara real-time lengkap dengan progress bar dan terminal log:
Konfigurasi direktori masukan/keluaran, status aset, dan pengelola profil workspace:
- π Local RVC GPU Voice Changer: Mengubah suara narator bawaan menjadi karakter lain secara instan dan offline via GPU NVIDIA (CUDA).
- ποΈ Golden Balance Speech: Pengaturan tempo suara narator (+20% speed) agar durasi video pas dan menjaga perhatian penonton.
- π·οΈ Zero-Duplicate B-Roll Stitcher: Penyusunan klip produk dengan memilah bagian Hook (awal) dan CTA (akhir), serta menyaring klip yang sudah terpakai agar adegan tidak berulang.
- π¬ Dynamic Subtitles: Subtitle tebal dengan outline hitam kontras, dibatasi maksimal 2 kata per kemunculan dan tersinkronisasi presisi kata-per-kata.
- π΅ Auto-Music Mix & Ducking: Shuffle musik latar secara acak dengan penyesuaian volume otomatis (turun ke 8% saat narator berbicara).
- π Copywriting Framework: Naskah promosi disusun otomatis berdasarkan formula terstruktur: Promo, PAS, FAB, BAB, dan Hardselling.
Aplikasi dapat membaca nama produk dan memilah B-roll berdasarkan struktur subfolder di dalam folder video_input/:
- Pemetaan Subfolder: Folder di dalam
video_input/otomatis dicocokkan dengan produk yang diproses (contoh: subfoldervideo_input/POC Cabai/akan dipetakan untuk produk "POC Cabai"). - Dynamic B-Roll Isolation: Generator hanya akan mengambil klip dari subfolder produk aktif untuk menghindari penggunaan klip produk lain (cross-product leakage).
- Multi-Product Rendering: Mendukung rendering massal untuk beberapa produk berbeda sekaligus dalam satu antrean.
- Fallback System: Jika subfolder produk kosong, generator akan mengambil klip di folder utama
video_input/sebagai cadangan agar rendering tidak terputus.
Untuk menjaga kualitas naskah iklan dan retensi penonton, AI Copywriter Studio memformulasikan naskah video pendek menggunakan kerangka kerja copywriting standar industri:
- Attention (0-3 Detik): Pancing perhatian penonton di awal video lewat kalimat pembuka (hook) yang kuat.
- Interest (3-7 Detik): Bangun ketertarikan dengan memaparkan fakta, data, atau masalah yang relevan dengan penonton.
- Desire (7-12 Detik): Picu keinginan membeli dengan menyajikan transformasi nyata atau nilai unggul produk.
- Action (12-20 Detik): Ajakan bertindak (CTA) yang jelas untuk mengarahkan penonton melakukan pembelian (seperti klik keranjang kuning).
- Problem: Mengangkat masalah utama atau keresahan yang sering dialami calon pembeli.
- Agitate: Memperjelas efek buruk dari masalah tersebut agar terasa mendesak untuk diselesaikan.
- Solve: Memperkenalkan produk sebagai solusi praktis dan andal untuk mengatasi masalah tersebut.
- Features: Menyebutkan spesifikasi fisik, kandungan, atau fitur utama produk.
- Advantages: Menerangkan mengapa spesifikasi atau fitur tersebut lebih unggul dibanding opsi lain di pasar.
- Benefits: Menjelaskan manfaat nyata yang dirasakan langsung oleh pembeli dalam kehidupan sehari-hari.
- Before: Menggambarkan situasi sulit atau keluhan sebelum menggunakan produk.
- After: Menunjukkan situasi setelah menggunakan produk secara rutin.
- Bridge: Memosisikan produk sebagai kunci utama yang mewujudkan transformasi tersebut.
Kalimat pembuka di 3 detik pertama dirancang untuk memicu rasa penasaran penonton guna menekan angka geser (swipe-away rate) dan meningkatkan skor watch completion rate pada algoritma media sosial.
Alur kerja otomatisasi pemrosesan video:
graph TD
A[Naskah Pemasaran / scripts.json] --> B[Edge-TTS Pemandu WAV + Subtitle VTT]
B --> C[RTX GPU CUDA - Konversi ke Suara RVC Karakter]
C --> D[Pillow - Render Subtitle Montserrat-Bold presisi Kata-per-Kata]
D --> E[Smart B-Roll Stitcher - Hook, Tengah & CTA bebas Duplikasi]
E --> F[MoviePy - Multiplexing Audio RVC + BGM Ducking 8% + Video + Subtitle]
F --> G[Ekspor Video Final Portrait 1080x1920 24FPS]
Aplikasi desktop berbasis PySide6 (Qt6) dengan desain Dark Mode modern yang elegan memberikan kontrol penuh untuk:
- βοΈ AI Copywriter Studio: Menyusun puluhan naskah promosi secara dinamis menggunakan framework copywriting (AIDA, PAS, FAB, BAB).
- π¨ Live Layout Editor (9:16 Canvas Simulator): Kustomisasi font (.ttf), warna subtitle (kuning, putih, hijau, cyan), tebal stroke, posisi vertikal, watermark, dan jenis transisi video.
- ποΈ Cloud Trainer Bridge: Setelan pitch, index, dan jembatan ekspor dataset RVC langsung ke Google Colab.
- π Background Batch Renderer: Menjalankan komposisi MoviePy di background thread (QThread) agar GUI tidak freeze.
Langkah pemasangan secara lokal pada Python 3.12:
git clone https://github.com/brillianodhiya/AutoVideo-RVC.git
cd AutoVideo-RVC
python -m venv venv
venv\Scripts\activatePastikan GPU NVIDIA aktif dan CUDA Toolkit terinstal, kemudian jalankan:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121pip install numpy==1.26.4 edge-tts Pillow moviepy PySide6Instal rvc-python dan modul Fairseq menggunakan pre-compiled wheel Windows untuk mencegah error kompilasi C++:
pip install rvc-python
pip install https://github.com/BlueAmulet/fairseq/releases/download/ci_build/fairseq-0.13.2-cp310-cp310-win_amd64.whlJalankan script Python berikut sekali untuk mengunduh model dasar secara otomatis:
from rvc_python.dependency import download_dependencies
download_dependencies()Aplikasi ini dapat dibungkus menjadi file mandiri (standalone executable) menggunakan PyInstaller:
pip install pyinstallerpyinstaller --noconsole --onefile --name="AutoVideoRVC" --add-data "fonts;fonts" --add-data "icons;icons" --add-data "ind.traineddata;." app_gui.pypyinstaller --noconsole --onefile --windowed --name="AutoVideoRVC" --add-data "fonts:fonts" --add-data "icons:icons" --add-data "ind.traineddata:." app_gui.pypyinstaller --noconsole --onefile --name="AutoVideoRVC" --add-data "fonts:fonts" --add-data "icons:icons" --add-data "ind.traineddata:." app_gui.pyCatatan: Parameter --add-data memastikan font, ikon, dan file bahasa OCR ikut dibungkus ke dalam folder dist/.
Status pengujian komponen kecerdasan buatan (AI) dan rendering saat ini:
| Fitur / Komponen | Engine Integrasi | Status Pengujian | Keterangan |
|---|---|---|---|
| π€ LLM AI Generator | Ollama (gemma:2b / gemma4:31b) |
π’ Tested & Working! | Berhasil membuat naskah promosi secara lokal dengan format JSON secara cepat. |
| π€ LLM AI Generator | Google Gemini API | π‘ Implemented (Untested) | Integrasi API terpasang, siap digunakan setelah API Key dimasukkan. |
| π€ LLM AI Generator | OpenRouter API | π‘ Implemented (Untested) | Integrasi API terpasang, siap digunakan setelah API Key dimasukkan. |
| ποΈ RVC Settings | RVC GUI Local Inference | π’ Tested & Working! | Konversi suara VO bawaan menjadi karakter RVC berhasil menggunakan GPU NVIDIA lokal. |
| ποΈ RVC Settings | RVC Desktop Local Trainer | π‘ Implemented (Untested) | Dataset creator di GUI sudah siap, pelatihan lokal belum diuji karena keterbatasan dataset tes lokal. |
| βοΈ Cloud Trainer Bridge | Google Colab Notebook (RVC_Colab_Trainer.ipynb) |
π‘ Experimental (In Optimization) | Notebook menggunakan venv Python 3.10 mandiri untuk memintas ketidakcocokan dependensi numba di Python 3.12 bawaan Colab. |
Proyek ini bersifat open-source! Kontribusi untuk pengembangan fitur baru atau perbaikan bug sangat diterima:
-
π Layout Editor Drag-n-Drop: Penataan letak subtitle, logo watermark, dan stiker promosi secara visual pada simulator layar HP 9:16 di PySide6.
-
π Dukungan Multi-Bahasa (Upcoming): Penambahan suara narator selain Bahasa Indonesia lengkap dengan penyelarasan tanda batas kata (word boundary).
-
π€ Integrasi Multi-AI Provider: Akses ke model API eksternal (DeepSeek, Claude) serta inferensi lokal menggunakan Llama.cpp (GGUF).
-
π¦ Portable Standalone Executables: Pembangunan paket distribusi aplikasi mandiri yang dioptimalkan ukurannya:
- Portable Windows Standalone Installer &
.exe - Lightweight Linux AppImage & executable binary
- Fully packaged macOS
.dmginstaller &.appbundle - Smart Setup Wizard: Installer ringan (~100MB) dengan pendeteksi otomatis spesifikasi perangkat pengguna, serta fitur unduhan on-demand untuk library PyTorch/CUDA sesuai kebutuhan secara latar belakang (lazy loading).
- Portable Windows Standalone Installer &
-
π¨ SaaS-Themed Iconography & Logo Update: Pembaruan paket ikon antarmuka dan logo aplikasi bergaya minimalis modern.
-
βοΈ Cloud Trainer Bridge (Colab Optimization): Penyempurnaan alur ekspor dataset satu klik dan stabilitas lingkungan Google Colab.
-
ποΈ Local Voice Cloning UI (1-Click Trainer): Dasbor rekaman dataset suara mandiri untuk pembuatan klon suara kustom secara offline.
-
π― AI B-Roll Content-Aware Tagging: Integrasi model visi komputer ringan (YOLO/MobileNet) untuk memindai dan menandai klip video mentah agar sesuai dengan teks naskah.
-
β‘ Serverless Cloud Rendering Pipeline: Opsi rendering MoviePy menggunakan GPU cloud serverless (RunPod / Replicate) untuk pengguna dengan spesifikasi PC rendah.
-
π΅ Smart Sound FX Auto-Stitcher: Penyisipan efek suara transisi estetik secara otomatis pada setiap pergantian adegan atau kalimat.
-
π Automated Social Media Scheduler: Penjadwalan posting konten otomatis langsung ke API TikTok, Instagram, dan YouTube Shorts.
Silakan ajukan Pull Request atau buka Issue di repositori brillianodhiya/AutoVideo-RVC jika menemukan bug atau ingin berdiskusi mengenai fitur baru.
Proyek ini dilisensikan di bawah MIT License.
Dibuat dengan β€οΈ untuk kemajuan kreator konten lokal oleh brillianodhiya.

