ClickEye Engineering
AI Workflow를 실전에서 작동하게 만드는 방법에 관한 글들.
review가 빠지면 AI 출력은 slop이 된다 — ClickEye가 다층 검증을 자동으로 까는 이유
Simon Willison이 2024년 5월 정의한 'AI slop'은 1년 반 만에 메리엄-웹스터 2025년 올해의 단어가 됐다. 산업 데이터는 더 매섭다 — curl 보안 제출의 20%가 AI slop, 상용 LLM의 5.2%가 존재하지 않는 패키지를 추천, Copilot 생성 코드의 40%가 보안 결함을 포함한다. 흥미로운 점은 이 문제의 분기점이 'AI를 썼는지'가 아니라 'review와 책임이 어디에 있는지'라는 사실이다. ClickEye가 다층 검증 구조를 디렉토리에 박아둔 이유가 여기에 있다.
전체 읽기AI에게 매니저 자리를 맡긴다는 것 — ClickEye가 만드는 개발 문화의 변화
AI 개발이 빨라진 이유는 모델이 좋아져서가 아니다. AI에게 프로젝트 매니저 자리를 맡기고, 영역마다 가장 잘하는 AI(코드 리뷰는 OpenAI의 Codex, 아키텍처·DB는 Anthropic의 Claude Opus)에게 자동으로 일을 위임하고, 그 위를 경험 있는 인간 리더가 관장하는 — 단일 모델이 아닌 다층 오케스트레이션이 진짜 동력이다. GPU 데이터센터 운영 시스템 'Hawkeye'에서 일어난 세 가지 사건으로 그 구조가 실제로 어떻게 작동했는지 본다.
전체 읽기환경이 결과를 만든다 — AI 시대 진짜 차별화는 어디서 오는가
ClickEye 사이트의 슬로건 중 하나는 '같은 AI를 써도, 결과는 다릅니다'다. 듣기 좋은 카피지만, 실제 산업 데이터는 그 말을 정확하게 뒷받침한다. 같은 모델 weights, 같은 데이터셋에서 모델 주변의 환경(harness)을 어떻게 설계하느냐에 따라 정답률이 15-25%p씩 달라진다. 이 글은 그 환경 설계가 2024-2025년 어떻게 산업의 핵심 자산이 되었는지를 1차 출처로 정리한다.
전체 읽기