GANYIQ
GANYIQ adalah AI Clip Discovery Engine untuk konten podcast Indonesia. Cukup paste link YouTube, dan AI akan menganalisis transkrip secara otomatis untuk menemukan 15 momen paling clip-worthy — lengkap dengan skor, judul AI, dan rekomendasi trim. Dib...
⚙️ Project Details
Tantangan Proyek
Membangun sistem AI yang bisa menganalisis video YouTube panjang (60-120 menit) dan secara cerdas mengidentifikasi momen-momen yang layak dijadikan klip pendek untuk Shorts/Reels. Tantangan utamanya: (1) Menentukan kriteria clip-worthiness secara algoritmik tanpa over-reliance pada LLM, (2) Memproses transcript panjang dengan format timestamp yang bervariasi dari YouTube, (3) Candidate extraction yang bisa menangkap hook, humor, dan momen emosional secara akurat, (4) Render pipeline yang membutuhkan koordinasi 7+ subproses Python/Node.js secara berurutan, (5) Face tracking multi-speaker dengan identitas yang stabil di tengah partial occlusion dan head turn, (6) Manajemen memory untuk rendering video yang intensif di VPS dengan RAM terbatas (2GB).
Pendekatan & Solusi
Menggunakan arsitektur hybrid deterministic + LLM. Candidate extraction menggunakan signal-based deterministik (keyword density, sentiment shift, laughter markers, question spikes) tanpa LLM — murni algoritma. Dilanjutkan multi-dimensional scoring oleh DeepSeek V4 mencakup 5 dimensi: hook strength, humor value, educational value, engagement potential, dan emotional impact. Pipeline analysis menggunakan 6 tahap paralel dengan concurrency 4 via Promise.allSettled untuk ketahanan terhadap partial failure — jika satu tahap gagal, tahap lain tetap berjalan. Ranking murni aritmetik deterministik tanpa LLM di jalur kritis, menjamin hasil yang konsisten. Render engine dipisahkan sebagai worker independen dengan feature flags untuk menonaktifkan stage bermasalah tanpa perubahan kode. ByteTrack + YOLOv8 untuk face tracking multi-speaker dengan ParticipantRegistry untuk konsolidasi identitas — menurunkan ID fragmentation dari 27+ menjadi ~7 per klip. Memory profiling bawaan untuk mendeteksi RAM exhaustion sebelum freeze.
Hasil & Dampak Proyek
✅ 749+ clip candidates diproses dari 100+ analisis video podcast\n✅ AI scoring multi-dimensi: hook strength, humor, educational, engagement, emotional\n✅ Pipeline deterministik memproses video 2 jam dalam <30 detik (tanpa render)\n✅ Face tracking multi-speaker dengan ByteTrack YOLOv8 + ParticipantRegistry\n✅ Video rendering engine: face tracking + diarization + subtitle + layout decision\n✅ Feature flags untuk zero-code debugging di production\n✅ 103+ conversations / analyses berhasil dilakukan\n✅ Arsitektur hybrid: deterministik + LLM untuk reliability dan akurasi