Platform AI

GANYIQ

GANYIQ adalah AI Clip Discovery Engine untuk konten podcast Indonesia. Cukup paste link YouTube, dan AI akan menganalisis transkrip secara otomatis untuk menemukan 15 momen paling clip-worthy — lengkap dengan skor, judul AI, dan rekomendasi trim. Dib...

https://ganyiq.ganys.me

Visit Live Site ↗

⚙️ Project Details

📌 Client Personal Project — Gany Labs

🏷️ Category Platform AI

🧰 Tech Stack

Next.js 16 (App Router) TypeScript PostgreSQL (Neon) DeepSeek V4 Deepgram nova-2 yt-dlp ffmpeg Python (YOLOv8

🔗 Live URL https://ganyiq.ganys.me

⚡ Approach Menggunakan arsitektur hybrid deterministic + LLM. Candidate extraction mengguna...

🌐 Visit Live Site ↗

🎯 THE CHALLENGE

Tantangan Proyek

Membangun sistem AI yang bisa menganalisis video YouTube panjang (60-120 menit) dan secara cerdas mengidentifikasi momen-momen yang layak dijadikan klip pendek untuk Shorts/Reels. Tantangan utamanya: (1) Menentukan kriteria clip-worthiness secara algoritmik tanpa over-reliance pada LLM, (2) Memproses transcript panjang dengan format timestamp yang bervariasi dari YouTube, (3) Candidate extraction yang bisa menangkap hook, humor, dan momen emosional secara akurat, (4) Render pipeline yang membutuhkan koordinasi 7+ subproses Python/Node.js secara berurutan, (5) Face tracking multi-speaker dengan identitas yang stabil di tengah partial occlusion dan head turn, (6) Manajemen memory untuk rendering video yang intensif di VPS dengan RAM terbatas (2GB).

💡 THE SOLUTION

Pendekatan & Solusi

Menggunakan arsitektur hybrid deterministic + LLM. Candidate extraction menggunakan signal-based deterministik (keyword density, sentiment shift, laughter markers, question spikes) tanpa LLM — murni algoritma. Dilanjutkan multi-dimensional scoring oleh DeepSeek V4 mencakup 5 dimensi: hook strength, humor value, educational value, engagement potential, dan emotional impact. Pipeline analysis menggunakan 6 tahap paralel dengan concurrency 4 via Promise.allSettled untuk ketahanan terhadap partial failure — jika satu tahap gagal, tahap lain tetap berjalan. Ranking murni aritmetik deterministik tanpa LLM di jalur kritis, menjamin hasil yang konsisten. Render engine dipisahkan sebagai worker independen dengan feature flags untuk menonaktifkan stage bermasalah tanpa perubahan kode. ByteTrack + YOLOv8 untuk face tracking multi-speaker dengan ParticipantRegistry untuk konsolidasi identitas — menurunkan ID fragmentation dari 27+ menjadi ~7 per klip. Memory profiling bawaan untuk mendeteksi RAM exhaustion sebelum freeze.

📊 THE RESULTS & IMPACT

Hasil & Dampak Proyek

✅ 749+ clip candidates diproses dari 100+ analisis video podcast\n✅ AI scoring multi-dimensi: hook strength, humor, educational, engagement, emotional\n✅ Pipeline deterministik memproses video 2 jam dalam <30 detik (tanpa render)\n✅ Face tracking multi-speaker dengan ByteTrack YOLOv8 + ParticipantRegistry\n✅ Video rendering engine: face tracking + diarization + subtitle + layout decision\n✅ Feature flags untuk zero-code debugging di production\n✅ 103+ conversations / analyses berhasil dilakukan\n✅ Arsitektur hybrid: deterministik + LLM untuk reliability dan akurasi

← Back to Portfolio