Awal: Ide Sederhana, Tantangan Nyata
Pada suatu malam Juni 2022 di apartemen kecil saya di Jakarta, saya duduk dengan secangkir kopi dingin dan layar penuh gambar garis-garis kasar dari seorang teman ilustrator. Saya ingin tahu: bisakah machine learning membantu mewarnai sketsa dengan rasa tangan manusia? Itu terdengar seperti proyek mini yang menyenangkan. Tapi kenyataannya: data sedikit, GPU terbatas, dan ekspektasi saya terlalu tinggi. Di situlah pelajaran pertama dimulai—ide yang bikin penasaran sering kali berujung pada masalah praktis yang mengasah kemampuan teknis dan rasa estetika sekaligus.
Proyek Mini yang Saya Coba
Saya memutuskan membuat proyek “Sketch-to-Color” sebagai eksperimen. Setting: akhir pekan selama tiga minggu, laptop dengan GPU GTX 1650, dan akses Colab buat training ketika diperlukan. Saya mengumpulkan sekitar 1.200 pasangan gambar sketsa–warna dari sumber terbuka dan beberapa hasil scan karya teman. Untuk variasi saya ambil juga set QuickDraw untuk bentuk kasar. Saya mulai dengan pendekatan transfer learning: encoder VGG pretrained sebagai fitur extractor dan decoder UNet sederhana untuk menghasilkan warna. Keputusan praktis seperti resize 256×256, batch size 8, learning rate 1e-4, dan optimizer Adam ternyata menyelamatkan eksperimen pertama saya dari overfit yang fatal.
Saat proses training, ada momen saya hampir menyerah. Loss turun perlahan, hasil visual pada epoch 5 terasa seperti cat air acak. Saya ingat berpikir, “Apa ini akan pernah terlihat natural?” Dialog internal itu mendorong saya mencoba dua perubahan kecil: menambahkan augmentasi warna (hue jitter) dan menggunakan loss perceptual (VGG feature loss) selain MSE. Perubahan ini, walau sederhana, langsung terasa—warna mulai mengikuti area yang wajar, bukan sekadar rata-rata pixel.
Langkah Teknis, Kesalahan, dan Trik yang Bekerja
Saya ingin berbagi hal konkret yang saya pelajari sehingga Anda bisa mempercepat kurva belajar. Pertama: mulai kecil. 500–1.000 pasangan gambar sudah cukup untuk prototipe. Kedua: pairing penting—pastikan sketsa dan versi berwarna align dengan baik; kecilnya misalignment menyebabkan artefak. Ketiga: gunakan transfer learning untuk bagian encoder, tapi jaga decoder sederhana agar tidak butuh data besar. Keempat: evaluasi bukan cuma angka—metrik seperti SSIM dan PSNR membantu, tapi human eval (minta teman ilustrator menilai) sering kali lebih menentukan. Saya meminta feedback langsung dari teman, termasuk portfolio inspiratif seperti silviapuccinelli, dan komentar mereka membuka perspektif komposisi warna yang tidak terpikir oleh metric otomatis.
Saya juga belajar soal pragmatisme teknis: jika GPU terbatas, latih pada patch 128×128 dulu. Gunakan checkpointing dan early stopping. Visualisasikan hasil tiap epoch—itu memberi indikasi cepat kapan model mulai “belajar” pola yang masuk akal. Dan jangan ragu eksperimen dengan loss campuran: kombinasi adversarial loss (GAN) dengan perceptual loss sering memberi hasil lebih hidup, meski GAN menambah kompleksitas training.
Hasil, Refleksi, dan Langkah Selanjutnya
Setelah beberapa iterasi, hasilnya mulai memuaskan: sketsa sederhana bisa berubah menjadi ilustrasi dengan palet yang masuk akal dan garis yang masih terasa organik. Bukan sempurna—kadang warna keluar di tempat yang aneh—tapi cukup untuk mempercepat workflow kreatif teman ilustrator saya. Lebih penting lagi, proses ini mengajarkan saya cara merancang eksperimen ML yang realistis: define scope, kontrol kompleksitas, dan prioritaskan iterasi cepat daripada ambisi fitur lengkap di awal.
Jika Anda tertarik memulai, coba pilih proyek mini yang memacu rasa ingin tahu—warna sketsa, style transfer pada ilustrasi, atau auto-tagging elemen gambar untuk katalog. Mulailah dengan data kecil, dokumentasikan asumsi, dan minta feedback manusia sejak awal. Proyek kecil bukan hanya latihan teknis; ini juga latihan taste. Di setiap iterasi, saya selalu bertanya: apakah output ini membantu alur kreatif? Jika iya, maka itu sudah sebuah kemenangan.
Terakhir, jangan takut gagal di malam-malam pertama. Jadikan rasa penasaran sebagai kompas, bukan pengalih perhatian. Proyek mini seperti ini membangun intuisi—bagaimana model bereaksi terhadap noise, bagaimana memperbaiki artefak, kapan butuh lebih banyak data—semua itu akan sangat berguna saat Anda siap naik ke proyek skala lebih besar. Saya masih menyimpan beberapa eksperimen yang belum rampung; suatu hari nanti akan menjadi bagian dari portofolio yang lebih matang. Sampai saat itu, mulai kecil, eksperimen sering, dan nikmati prosesnya.