cladding — Unified Governance for AI-Coupled Engineering

English · 한국어

cladding

Unified Governance for AI-Coupled Engineering.
AI 가 짠 코드도 사람이 짠 코드만큼 검증되도록.

ironclad spec tests coverage license

Ironclad 표준의 공식 reference 구현. AI 코딩 어시스턴트가 짠 코드가 spec 과 어긋나지 않는지 28 개의 검사기와 13 단계 검증 관문이 매 commit 마다 자동으로 대조한다.

일반 (vanilla) AI 코딩
2/8
함정 포착 · 25%
cladding
8/8
함정 포착 · 100%

같은 spec · 같은 모델로 측정 · event-sourcing store 벤치마크

왜 필요한가

3개월 뒤 의도 추적 불가

AI 가 짠 코드의 가 코드만 봐서는 안 잡힌다.

spec/features/*.yaml 의 영구 기록
AI 가 시간을 견딘다 — 6개월 뒤에도 AI 가 spec 보고 의도 즉시 파악 (신규 입사자도 같은 진입점)
AI 답이 매번 다름

같은 spec 으로 짠 코드의 패턴과 구조가 일관성 없다.

→ spec 이 고정 기준 으로 각 commit 검증
엔터프라이즈 채택 가능 — 팀 · PR 간 코드 스타일 · 패턴 일관
AI hallucination

존재하지 않는 API · 함수 · 옵션을 호출하는 코드 생성.

→ 27 detector + 13 단계 gate 가 매 commit 차단
production 사고 사전 차단 — CI 가 hallucination 코드를 자동 reject

차이점

같은 문제 상황에서 일반적인 (vanilla) AI 코딩 환경과 cladding 환경이 어떻게 다르게 동작하는지.

상황일반 AI 코딩cladding
코드가 spec 과 어긋날 때review 에서 발견하면 fix매 commit 자동 차단
두 명이 같은 기능 동시에 만들 때merge conflict 발생hash ID 로 다른 파일 → 충돌 0
AI 가 짠 코드를 누가 검증?작성한 AI 가 자기 검증 (위험)별도 reviewer agent 가 분업 검증
AI 도구 (Claude → Cursor) 바꿀 때도구마다 재구성 필요1 spec → 4 host 자동 미러링
spec 의 권위AI 가 매번 다르게 해석봉인된 spec 이 단일 기준

Hero 의 8/8 vs 2/8 은 초기 벤치마크 (상세) · 대규모 측정 진행 중.

How it works

Spec → Code → Tests 가 한 cycle 로 순환한다 — spec 이 를 기록하고, Iron Law 가 검증하고, Drift detector 가 어긋남을 차단한다.

Spec → Code → Tests 가 한 cycle 로 순환 — 한 feature lifecycle

1. Spec — SSoT, 의도의 단일 기준

spec 이 (무엇을 왜 만드는지) 를 기록하는 곳. 4-tier (A/B/C/D) 단일 진실 출처 (Single Source of Truth) — 의도가 위, 구현물이 아래.

Tier역할수정 권한권위
A — Spec의도 (무엇을 만들까)사람이 정의봉인 · LLM 수정 금지
B — Design설계 (어떻게 만들까)사람이 자유 편집A 와 일치 검증
C — Derived구현물 (코드 · 테스트)LLM · 사람코드 보고 자동 재생성
D — Audit감사 기록 (무엇이 일어났나)append-only수정 불가

A 가 B 보다 우선 — 코드와 spec 이 다르면 코드가 틀린 것. 의도(A)가 변하면 모든 게 흔들리기 때문에 LLM 이 못 건드리도록 봉인.

샤딩 · multi-dev 안전spec/features/<slug>-<hash6>.yaml 처럼 feature 마다 별도 파일 + 6-자리 hash ID (예: F-5f6b45). 두 명이 동시에 새 feature 를 만들어도 다른 파일·다른 ID 라 merge conflict 0. 자세히는 Hash-based feature IDs.

4-tier SSoT — A(Spec) → B(Design) → C(Derived) → D(Audit), A 가 B 보다 우선

2. Code — Iron Law (필수 통과) gate

모든 변경은 13 단계 gate 를 통과해야 한다 — 보통 CI step · git pre-push hook · clad check 수동 호출 어디서든 실행. 각 stage 가 자체 unit test 와 함께 ship 된다.

13 단계 Iron Law gate — clad check 호출 시 static(6) · test(2) · e2e(3) · evidence(2) 를 모두 통과 (CI / git hook / 수동 어디서든)
Stage무엇을 검사하나
1.1 Type · 1.2 Lint타입 오류 · 코드 스타일
1.3 Drift27 detector 의 spec ↔ 코드 어긋남
1.4 Commit · 1.5 Arch · 1.6 Secret작업트리 clean · architecture invariant (forbidden import 등) · API 키 노출
2.1 Unit · 2.2 Cov단위 테스트 통과 · 프로젝트 coverage threshold
3.1 Smoke · 3.2 Perf · 3.3 Visuale2e 핵심 기능 동작 · 성능 예산 · UI 시각 회귀
4.1 Audit · 4.2 UAT모든 AC (acceptance criteria, 수용 기준) 에 증거 1건 이상 · 모든 status=done feature 에 증거 1건 이상

3. Test — 28 개 어긋남 검사기 (drift detector)

spec · code · test 사이 7 카테고리의 어긋남을 자동으로 잡아낸다. 전체 카탈로그: src/stages/detectors/README.md.

카테고리무엇을 잡나대표 detector
spec ↔ code driftspec 에 있는데 코드에 없거나, 코드에 있는데 spec 에 없음6UNMAPPED_ARTIFACT, MISSING_IMPLEMENTATION, AC_DRIFT
code ↔ test코드는 있는데 테스트 없음 · 커버리지 부족6MISSING_TESTS, COVERAGE_DROP, HARDCODED_SECRET
spec ↔ testspec 의 AC 가 테스트로 검증 안 됨4UNTESTED_AC, STATUS_DRIFT, STALE_EVIDENCE
spec maintenancespec 자체의 위생 (slug 충돌 · ID 중복)4SLUG_CONFLICT, ID_COLLISION
environment integrity빌드 환경 · 메타 파일 무결성3HARNESS_INTEGRITY, META_INTEGRITY
architecture · capabilityspec 의 아키텍처 · capability 정의와 코드 불일치2ARCHITECTURE_FROM_SPEC, CAPABILITIES_FEATURE_MAPPING
governance · policyai_hints 정책 위반 (예: 금지 패턴 사용)2AI_HINTS_FORBIDDEN_PATTERN, ABSENCE_OF_GOVERNANCE

4. Cycle — 한 feature 의 lifecycle

Spec → Code → Test 를 한 cycle 로 묶는 4 step. drift 가 0 이면 merge, 1 이상이면 block.

한 feature 의 lifecycle — Define → Sync → Implement → Verify, drift 0 이면 merge / 그 외 block

Multi-Agent Workflow

cladding 은 5 명의 에이전트가 협업하는 다중 에이전트 (multi-agent) 시스템. 각 에이전트는 명확한 역할 분담 — CQS (Command-Query Separation, 명령하는 역할검증하는 역할 의 분리) — 으로 자기가 짠 작업은 자기가 승인할 수 없다. 규제 · 감사 (EU AI Act · K-AI 기본법 · SOX) 기준에 그대로 매핑된다.

5 페르소나 권한 분리 (CQS) — orchestrator 가 분배, librarian/specialist/reviewer 가 작업, observability 가 메트릭 관찰

Ecosystem

기존 세 카테고리의 결합부에 cladding 이 있다.

Ecosystem Venn — SDD · Runners · Multi-agent Governance 세 카테고리의 결합부에 cladding 이 위치

인접 도구와의 차이

cladding 의 차별점은 결합 — 위 네 카테고리의 핵심을 하나의 검증 흐름 으로 묶는 것.

Install

두 단계 — 인프라 설치 → 프로젝트 spec 생성.

1단계 — 인프라 설치

작업 방식에 맞는 경로 선택 (어느 쪽이든 결과 동일):

(a) npm — 터미널 / CI 사용자

npm install -g cladding   # cladding CLI 설치
cd <project>                # 프로젝트로 이동
clad setup                  # AI 도구 자동 연결 (Claude / Codex / Gemini)

(b) 마켓플레이스 — AI 도구 plugin 사용자

  1. AI 도구의 plugin 마켓플레이스 열기 (Claude Code · Codex CLI · Gemini CLI)
  2. cladding 검색 → 설치
  3. clad setup 불필요 — plugin 매니페스트가 자동 연결
clad setup 이 연결하는 위치 (5 host)
호스트 (감지 시)wire 위치자동 활성화
Claude Code (~/.claude/)~/.claude/plugins/claddingclaude plugin marketplace add + install
Codex CLI skills (~/.agents/)~/.agents/skills/cladding-*(Codex 재시작 시 자동)
Codex CLI MCP 서버 (~/.codex/)~/.codex/config.toml[mcp_servers.cladding](TOML entry 자체)
Gemini CLI (~/.gemini/)~/.gemini/extensions/claddinggemini extensions link
Cursor (~/.cursor/)~/.cursor/mcp.jsonmcpServers.cladding(JSON entry 자체)

clad setupclaude / gemini binary 가 PATH 에 있을 때 각 host 의 활성화 명령을 자동 호출. cladding 업그레이드 시나 새 AI 도구 설치 후 다시 실행해도 안전합니다.

MCP 서버에 대하여. 4 host 모두 cladding 을 MCP 서버로 wire 합니다 — wire 위치 만 다릅니다. Claude Code 와 Gemini CLI 는 plugin/extension manifest 의 mcpServers 필드로 자동 기동, Codex 는 ~/.codex/config.toml[mcp_servers.cladding], Cursor 는 ~/.cursor/mcp.json. MCP 는 사용자가 직접 호출하는 것이 아닙니다 — /mcp 슬래시도, 수동 연결 단계도 없습니다. 각 host 의 AI 가 자연어 요청 에 응답해 cladding 의 도구 (clad_create_feature 등) 를 호출하며, 사용자는 /cladding:init + 일반 대화만 입력합니다.
벤치마크. v0.4.0 측정 결과 동일 task 에서 ~60% 일관성 향상 + ~50% 코드량 감소, 5-iteration dev cycle 에서 100% drift 검출. 전체 methodology 와 솔직한 caveats (일관성 향상의 일부는 "더 상세한 prompt" 효과 — cladding 단독 기여 아님) 는 docs/benchmarks/v0.4.0-consistency-bench.md 참조.

2단계 — Init (프로젝트 spec 생성)

프로젝트 디렉토리에서, AI 도구 안에서 한 번 호출:

[AI 도구 안] /cladding:init "B2B 결제 SaaS"

spec.yaml + 4-tier 문서가 자동 생성됩니다. 프로젝트당 한 번.

세 가지 init 시나리오

/cladding:init 은 자연어 intent 를 받아 상황에 맞는 path 를 자동 선택한다. 같은 명령, 세 가지 시작점.

시작 상황명령무엇이 일어나는가
아이디어만 있을 때/cladding:init "B2B 결제 SaaS 만들거야"LLM 이 도메인 분석 → spec · 문서 · 정책 자동 생성 + 2–3 가지 후속 질문 출력
기획 문서가 있을 때/cladding:init docs/plan.mdcladding 이 파일 경로를 인식 → 내용을 자동 로드해서 intent 로 사용 (절대/상대 경로 모두 지원)
기존 프로젝트 도입/cladding:init "이 프로젝트에 cladding 적용해줘"기존 코드 자동 스캔 (≥3 source files) → 관찰한 패턴 + intent 결합

init 한 번이면 끝

cladding 의 목표는 spec ↔ 코드 어긋남을 막는 인프라가 되는 것 — init 이후로는 평소처럼 개발하면 된다. AI 도구가 spec 을 참조하며 코드를 짜고, clad check 가 CI · pre-commit hook 에서 자동으로 돌아 어긋남이 있으면 차단한다. 추가 수동 명령 불필요.

Status

version
v0.4.0
2026-05
준수 등급
L4
최고 · 자가 선언
tests
973/973
all pass
coverage
93.89%+
enforced
features
136
spec 정의

100 test files · Claude Code · OpenAI Codex · Gemini CLI 마켓플레이스 설치 가능

Ironclad 1.0 까지의 길 — 1.0 은 독립적인 두 개의 구현이 L4 검증 셋을 통과해야 잠긴다 (GOVERNANCE § 1). cladding 이 첫 번째.

Docs

License

MIT. LICENSE · 관련: Ironclad (구현 대상 표준) · harness-boot (seed).