Mengapa pengembangan di era AI menjadi cepat? Jawaban umum — “modelnya membaik” — bukanlah jawaban sesungguhnya. Mengunci satu AI untuk segalanya justru menciptakan hambatan baru. Mesin sesungguhnya ada di tempat lain: menempatkan AI di kursi project manager, mendelegasikan pekerjaan secara otomatis ke AI terkuat di setiap domain, dan menempatkan seorang pemimpin manusia berpengalaman di atas semuanya. Tulisan ini menelusuri bagaimana struktur itu bekerja melalui tiga peristiwa konkret dari Hawkeye, produk internal ClickEye yang sedang dibangun dengan metode ini. Sistem pada skala itu secara tradisional membutuhkan tim 15-20 orang selama 12-18 bulan. Pendekatan ClickEye memindahkannya ke tim inti kecil dalam 3-4 bulan — dan mekanisme di balik pergeseran itulah yang kami bedah.
0. Apa itu Hawkeye?
Mari menyiapkan panggung sebelum masuk ke argumen utama. Hawkeye adalah produk internal ClickEye, sebuah platform operasi AI untuk data center GPU berskala besar. Penyedia cloud dan operator infrastruktur AI memiliki masalah yang sama — ribuan server GPU menghasilkan aliran event tanpa henti (overheating, penurunan performa, kegagalan job, anomali jaringan) yang tidak bisa diikuti tim manusia secara manual. Hawkeye mengumpulkan, menganalisis, dan menilai event tersebut secara otomatis, dan ketika tindakan diperlukan, AI dapat menjalankannya langsung. Keputusan berdampak tinggi tetap memerlukan persetujuan operator (human-in-the-loop). Sementara alat monitoring konvensional berhenti pada “ini yang salah,” Hawkeye adalah sistem yang “memberitahu Anda apa yang salah, apa yang harus dilakukan, siapa yang harus menyetujui, dan kemudian menjalankannya.”
Sistem ini dirancang untuk menangani 5.000+ perangkat GPU, 50.000 event per detik, dan 3.300+ aturan deteksi secara bersamaan pada skala produksi. Sistem dengan ukuran ini dibangun cara SI tradisional berarti tim 15-20 orang selama 12-18 bulan. ClickEye mengonvergenkan sistem ini ke kondisi operable dalam sekitar 60 hari menggunakan pendekatannya sendiri, dan pendekatan yang sama diterapkan langsung pada proyek klien.
1. Empat lapis yang menghasilkan kecepatan
- Seorang pemimpin manusia berpengalaman duduk di lapisan strategi, memegang hanya arah produk, ruang lingkup, dan gate akhir.
- AI manajer proyek (dijalankan oleh Gemini dari Google) mendistribusikan setiap tugas dari pusat dan memutuskan AI mana yang akan menanganinya berdasarkan tingkat kesulitan. AI manajer ini tidak menulis kode sendiri — ia hanya mendistribusikan.
- AI spesialis menerima routing dari manajer dan bekerja paralel. Code review dan testing ke AI khusus kode OpenAI (Codex); arsitektur, database, keandalan sistem, dan review domain ke model terkuat Anthropic (Claude Opus). AI terbaik untuk domain itu menangani pekerjaan tersebut.
- ClickEye Workflow (Harness) mengikat tiga lapis di atas menjadi satu sistem yang dapat dieksekusi — janji tim, definisi peran, dan alur otomatisasi hidup di satu tempat yang dapat disalin ke proyek berikutnya.
Mekanismenya paling baik dijelaskan dengan melihat bagaimana setiap lapis sebenarnya bergerak selama 60 hari di Hawkeye.
2. Apa yang terjadi saat AI manajer proyek duduk di pusat
Keputusan desain paling menentukan di Hawkeye adalah peran manajer proyek itu sendiri dipegang oleh AI, bukan orang. AI manajer (Gemini) melakukan hal berikut:
- Membingkai arah produk dan kebutuhan, memecahnya menjadi tiket.
- Menetapkan ke setiap tiket sebuah tingkat kesulitan (1, 2, 3) secara otomatis — Tier 1 untuk tugas sederhana/rutin, Tier 2 untuk tugas yang sensitif desain, Tier 3 untuk tugas kompleksitas tinggi, lintas-domain, atau berisiko tinggi. Pekerjaan database selalu Tier 3; pekerjaan sensitif keamanan selalu Tier 3. Aturan ini tertanam di dalam AI manajer.
- Merutekan setiap tiket ke AI yang tepat berdasarkan tier — Tier 1 ke model ringan, Tier 3 ke model terkuat yang tersedia (Claude Opus dengan penalaran extended).
- Melakukan dual-review setiap rencana dan artefak kebutuhan dengan AI khusus kode (Codex).
Hasilnya adalah manusia tidak lagi memilih model untuk setiap tugas. AI manajer membaca domain dan memutuskan kekuatan model secara otomatis. Peran manusia bergerak satu lapis naik — konteks pasar, prioritas, scope freeze, dan persetujuan akhir. Itulah arti tagline ClickEye Execution by Experience sebenarnya. Pengalaman pemimpin dikodifikasi sebagai kebijakan; AI manajer menegakkannya.
3. AI spesialis menerima routing dan bekerja paralel
Setelah AI manajer mendistribusikan, pekerjaan mengalir ke AI juara domain itu segera. Hawkeye memiliki 14 peran spesialis yang didefinisikan, dan setiap peran sengaja diikatkan ke AI yang berbeda:
- Manajer proyek / dekomposisi tugas → Gemini dari Google (jendela konteks besar, perencanaan luas).
- Code review / testing / QA → Codex dari OpenAI (ketepatan kode, penalaran level diff).
- Arsitektur / database / keandalan sistem / ahli domain → Claude dari Anthropic (pekerjaan database khususnya membutuhkan model terkuat, Claude Opus). Penalaran horizon panjang, desain trade-off domain.
Empat peran inti (manajer, decomposer, code review, QA) adalah gate wajib yang harus dilewati setiap kebutuhan dan perubahan kode. Sepuluh peran sisanya — arsitektur, data pipeline, intelijen, platform, infrastruktur, keamanan, UI/UX, technical writing, monitoring — dipanggil otomatis saat domain tersebut disentuh. Tidak seperti SI tradisional di mana satu orang menserialisasi setiap tahap, di sini saat AI manajer mendistribusikan, 14 AI spesialis bergerak bersamaan.
4. ClickEye Workflow (Harness) mengikatnya
Routing model saja tidak cukup. Urutan, kontrak, dan kebijakan harus didefinisikan di tempat yang dapat dieksekusi. Itulah apa AI Workflow Execution System ClickEye sebenarnya. Ia datang dalam tiga bundel.
- Janji tim — 18 prinsip dikodifikasi sebagai kebijakan yang ditegakkan. Lima yang paling menentukan: usability first (akurasi backend tidak berarti jika layar operator membingungkan), tanpa penundaan (Anda tidak boleh menggunakan “kita kerjakan di Phase 2” untuk mengirim v1 parsial), desain dahulu (tidak ada kode ditulis sebelum review ahli), deploy dari sumber terbaru (setiap rilis dimulai dari pull baru cabang main), nilai yang dapat ditelusuri ke bukti (spek GPU harus dapat ditelusuri ke datasheet vendor dan pengukuran, tidak pernah hard-code). Masing-masing adalah kebijakan, bukan dokumentasi — pelanggaran memblokir perubahan kode itu sendiri.
- Definisi peran — 14 peran di atas, dengan AI yang diikat ke setiap peran dan tanggung jawab review tertulis di muka. Tidak ada tahap “kualitas berdasarkan firasat.”
- Alur otomatisasi — validasi lingkungan sebelum setiap pemanggilan tool, routing model, operasi yang dapat direproduksi dengan skrip.
Slogan hidup di catatan rapat dan terlupakan. Harness menyimpan janji dalam bentuk yang dapat disalin ke proyek berikutnya. Itulah arti baris “Workflow terverifikasi yang dapat digunakan ulang” dalam pemasaran kami sebenarnya.
5. Tiga peristiwa yang menunjukkan bagaimana ia beroperasi
Peristiwa ① — Dashboard operator menampilkan 0/0/0
Tiga metrik utama dashboard operasi AI menampilkan 0/0/0 selamanya, meskipun backend menghitung trust score dengan benar. Jawaban SI tradisional adalah “dokumen desain memisahkan ini; itu disengaja” atau “kita akan perkuat di Phase 2.” Janji usability-first melarang kedua respons itu. Pemimpin manusia melempar tiket ke AI manajer sebagai prioritas atas; manajer mengklasifikasikannya sebagai tugas Tier 3 lintas-domain dan secara bersamaan memanggil lima AI ahli — arsitektur, intelijen, UI/UX, monitoring, dan ahli platform (semuanya Claude). Hasilnya: desain backend diselaraskan ulang dan UI didesain ulang. Manusia memegang gate, AI manajer merutekan, dan lima instance Claude mengaudit domain mereka secara paralel.
Peristiwa ② — Sistem notifikasi tidak dikirim secara terpotong
Notifikasi operator adalah area SI yang paling sering ditunda ke “Phase 2.” Pola standar adalah mengirim email di v1, mendorong Slack ke siklus berikutnya, menyisakan rantai eskalasi untuk v2, memperlakukan audit sebagai “kalau ada waktu.” Hawkeye memutus pola itu. Janji tanpa penundaan memblokir rilis parsial apa pun; AI manajer mendekomposisi pekerjaan; AI spesialis mengeksekusi paralel. Satu rilis keluar berisi lima channel real (email, Slack, Teams, webhook, SMS), kebijakan retry per channel, kuota harian dan bulanan per tenant, eskalasi multi-tier, jejak audit, dan pelaporan pelanggaran SLA — semuanya operasional. Beberapa AI bekerja bersamaan di jalur masing-masing; rilis konvergen pada satu titik.
Peristiwa ③ — Lima gap ditutup dalam minggu yang sama
Agen privileged yang berjalan di setiap server GPU perlu dibangun. Karena ini sensitif keamanan, AI manajer otomatis mengklasifikasikannya sebagai tier kesulitan tertinggi; AI ahli arsitektur dan platform (keduanya Claude Opus) menulis dokumen desain formal dan meng-commit skeleton kode dalam perubahan kode yang sama (desain dahulu dan desain-dengan-kode-dibundel-bersama menyala bersamaan). Seminggu kemudian AI ahli platform melakukan audit dan menemukan lima gap — library mati tanpa pemanggil, logika recovery crash hilang, state terminasi hilang di schema health-check, dan dua lagi. SI tradisional mengatakan “backlog siklus berikutnya.” Di sini AI manajer mengubah setiap gap menjadi tiket baru dengan tier yang ditugaskan ulang, dan tiga rilis PATCH dikirim dalam minggu yang sama. Audit ahli di-injeksi ulang sebagai tiket babak berikutnya manajer secara langsung. Pengerjaan ulang tidak terbentang lintas siklus.
6. Mengapa konvergen dalam 3-4 bulan?
Dua hal yang memakan kecepatan SI — hambatan dan pengerjaan ulang. Struktur ini memblokir keduanya.
- Tanpa hambatan. Saat AI manajer mendistribusikan, 14 AI spesialis bergerak paralel. Tidak seperti struktur serial di mana satu orang memproses setiap tahap secara berurutan.
- Tanpa pengerjaan ulang. Design-first menghentikan desain hilang; desain-dengan-kode-dibundel menghentikan drift spec-ke-kode; usability-first menghentikan divergensi backend-versus-UI; tanpa-penundaan menghentikan biaya masa depan dari rilis parsial. Setiap titik umum di mana tim harus kembali dan memperbaiki diblokir di lapisan kebijakan.
Copy perbandingan ClickEye — “bergantung manusia, sulit diskalakan” vs “otomasi-pertama, langsung diskalakan”, “sering terlambat” vs “pengiriman ~3x lebih cepat”, “dibangun dari nol setiap kali” vs “workflow teruji digunakan ulang” — menggambarkan output mekanisme ini. Hawkeye menunjukkan mekanisme itu bekerja pada build nyata.
7. Apa yang dibawa ke proyek berikutnya
Setelah Hawkeye, asetnya tetap. 18 janji, 14 definisi peran, kebijakan penetapan tier AI manajer, dan alur otomatisasi disimpan dalam bentuk yang dapat disalin ke hari pertama proyek berikutnya. Itulah arti “Workflow terverifikasi yang dapat digunakan ulang” dalam praktik.
Empat lapis kerja sama, dalam ringkasan:
- Lapisan strategi — pemimpin manusia berpengalaman memegang arah produk, desain peran, scope freeze, gate akhir.
- Lapisan orkestrasi — AI manajer proyek (Gemini) mendistribusikan setiap tugas. Tidak menulis kode; hanya merutekan.
- Lapisan eksekusi — AI spesialis (Codex, Claude Opus, dll.) bekerja bersamaan di jalur masing-masing.
- Harness — janji, peran, dan otomasi terikat bersama sehingga tiga lapis di atas terhubung dengan bersih.
8. Penutup
Inovasi sesungguhnya bukan di AI tunggal mana pun. Itu ada di struktur berlapis — AI manajer di pusat, AI spesialis menerima auto-delegasi, Harness mengikat janji menjadi satu sistem, dan pemimpin manusia berpengalaman di lapisan strategi di atas. 60 hari Hawkeye menunjukkan struktur itu beroperasi. Kecepatan, biaya, dan keandalan yang kami janjikan adalah outputnya.
Jika Anda membutuhkan sistem pada skala yang serupa dengan keandalan yang serupa, kami mulai dari kebijakan yang sama dan Harness yang sama. Di mana SI tradisional mulai dari estimasi headcount, kami mulai dengan membawa AI manajer dan kebijakan routing-nya di hari pertama. Itulah cara kami mengirim hasil yang sama dengan biaya lebih sedikit dalam waktu lebih singkat.
Peristiwa, janji, dan pemetaan peran-ke-AI yang dikutip di atas diambil langsung dari dokumen internal dan catatan desain proyek internal (Hawkeye) yang sedang dibangun dengan workflow ClickEye. Hitungan mentah seperti baris kode, commit, migrasi, dan job pipeline sengaja dikecualikan — itu adalah vanity metric yang mencampur kode hasil generate dan boilerplate. Estimasi SI tradisional 15-20 orang, 12-18 bulan adalah kebiasaan industri untuk sistem NOC pada skala ini (5.000+ GPU, 50.000 event per detik, 3.300+ aturan deteksi); angka pasti bervariasi per proyek.