이제 채팅으로 입력하지 않고 목표만 주면 AI가 알아서 진행하는 시대예요
AI·바이브코딩by 코냥이 6분조회 92

이제 채팅으로 입력하지 않고 목표만 주면 AI가 알아서 진행하는 시대예요

2025년까지만 해도 AI 코딩 도구는 사람이 짜는 코드의 "다음 줄을 추천"해 주는 수준에 머물렀습니다. 하지만 2026년 현재, 기술의 판도가 완전히 바뀌었습니다. 이제 사람은 세세한 지시(프롬프트)를 내리지 않습니다. 그저 최종 '목표'만 던져주면, AI가 알아서 맥락을 파악하고 코드를 작성한 뒤 테스트까지 마치는 '자율형 에이전트'의 시대가 열렸습니다.

AI는 어떻게 스스로 일할까? ('에이전틱 루프')

기존 AI는 질문 하나에 답변 하나를 주면 끝이었습니다. 반면 최신 AI 기술(Claude Code 등)은 목표를 달성할 때까지 다음의 3단계를 스스로 무한 반복합니다. 이를 '에이전틱 루프(Agentic Loop)'라고 부릅니다.

  • 맥락 수집 (Gather Context): 개발 환경과 관련된 수많은 파일을 스스로 검색하고 읽으며 판을 분석합니다.

  • 실행 (Take Action): 분석한 내용을 바탕으로 코드를 직접 수정하고 명령어를 실행합니다.

  • 검증 (Verify Results): 수정이 잘 되었는지 테스트를 돌려보고 결과를 검토합니다. 만약 실패하면 자기 스스로 원인을 찾아 다시 시도합니다.

과거에는 파일 하나를 고칠 때마다 사람이 일일이 지시해야 했지만, 이제는 "로그인 버그 고쳐줘"라는 말 한마디에 AI가 수십 개의 파일을 넘나들며 혼자서 작업을 완수합니다.

노트북을 닫아도 일하는 24시간 자동화 시스템

Claude Code Routines(2026년 4월 리서치 프리뷰)는 일정, API 호출, GitHub 이벤트에 따라 실행되는 클라우드 호스팅 자동화로, 노트북을 닫아도 계속 돌아갑니다. '무엇을, 얼마나 자주, 어떻게 체크할지' 세 가지만 설정해 두면, AI가 24시간 내내 서버 상태와 빌드 로그를 감시합니다.

이 기능의 핵심은 "reactive assistant(요청이 있으면 반응하는 조수)"를 "autonomous agent(스스로 판단해서 돌아가는 에이전트)"로 바꾼다는 거예요. 만약 시스템에 에러나 이슈가 발견되면, 특정 작업만 전문으로 처리하는 하위 에이전트(Sub-agent)를 스스로 만들어 배포하고 버그를 직접 고쳐놓습니다.

2026년 5월 Code with Claude 발표에서 보여준 혁신

Anthropic은 5월 6일 샌프란시스코에서 Code with Claude 2026을 개최하여 Claude Code, Claude Developer Platform, 그리고 GitHub, Vercel, Datadog, Bun 등 여러 AI 네이티브 스타트업의 파트너 배포를 다루는 라이브스트림 세션을 YouTube에 게시했습니다. Dario Amodei는 2026년 1분기 매출과 사용량이 연간 기준으로 Anthropic이 계획했던 10배가 아닌 80배 성장했다고 보고했으며, 이것이 당일 발표된 SpaceX 파트너십이 부분적으로 해결하는 최근 컴퓨팅 압박의 근본 원인이라고 말했어요.

Claude Code 팀의 Dickson Tsai는 최근 업데이트를 보여줬는데, 개발자 경험 측면에서는 원격 제어로 한 기기에서 세션을 시작하고 전화에서 계속할 수 있고 재설계된 데스크톱 GUI는 분할 보기, 생성된 목차가 있는 챕터로 어시스턴트 메시지를 고정하는 기능, 인라인 diff 주석을 추가했으며, 자율성 측면에서는 자동 모드가 권한 결정을 파괴적 행동과 프롬프트 인젝션을 선별하는 분류기로 이동하고 worktrees는 Claude에게 격리된 브랜치를 생성하고 종료하는 도구를 제공해요.

귀찮은 승인을 줄여주는 '자동 모드 (Auto Mode)

Anthropic은 Claude Code에 자동 모드를 도입하여 수동 개입을 줄이고 다단계 소프트웨어 개발 워크플로를 가능하게 했습니다. 이 기능은 입력 필터링, 행동 평가, 2단계 분류를 포함한 계층화된 안전 메커니즘과 자동 실행을 결합하면서도 민감한 작업에 대한 사람의 승인 체크포인트를 유지합니다.

기존에는 AI가 보안이나 안전 문제 때문에 파일 하나를 만질 때마다 사람의 허락을 받아야 했습니다. 이 때문에 사람은 계속 '승인 버튼'만 누르는 피로감에 시달렸죠.

이제는 백그라운드 AI 보안 검토기가 작동하여 위험한 작업은 알아서 차단하고, 안전하고 반복적인 파일 작업(리팩토링, 테스트 실행 등)은 사람의 개입 없이 논스톱으로 빠르게 처리합니다.

Auto 모드는 특정 시나리오에서 빛을 발하는데, 예측 가능한 변경으로 여러 파일에 걸쳐 리팩토링할 때 수동 권한의 오버헤드는 의미 있는 안전 이점 없이 마찰을 추가하며, Auto 모드는 이러한 경우를 원활하게 처리합니다. 사용자의 승인 결정을 대신 내리는 Claude와 시스템 사이에 있는 AI 보안 검토자라고 생각하면 됩니다.

협업하고 스스로 성장하는 AI 시스템

첫 번째 기능인 Dreaming은 에이전트 세션과 메모리 저장소를 검토하고 패턴을 추출하며 에이전트가 시간이 지남에 따라 개선되도록 메모리를 큐레이션하는 예약된 프로세스예요.

두 번째 기능인 Outcomes는 작업별 성공 기준(평가 기준표)을 작성하면 작업 에이전트와 분리된 채점 에이전트가 결과물을 독립적으로 평가하고, 기준에 미달하면 문제점을 지적해서 다시 시도하게 만드는 구조입니다.

Multi-agent (AI 팀플) 은 리드 에이전트가 작업을 조각으로 나누고 각 조각을 자체 모델, 프롬프트, 도구가 있는 전문 하위 에이전트에게 위임하며, 하위 에이전트는 공유 파일 시스템에서 병렬로 작업하여 결과를 리드 에이전트의 컨텍스트로 다시 공급합니다. 리드 에이전트는 워크플로 중간에 하위 에이전트를 확인하여 올바른 방향으로 가고 있는지 확인할 수 있으며, 전체 시스템은 Claude Console에서 감사 가능해요.

결론: 이제 사람은 '작업자'가 아니라 '지휘자'다

에이전틱 시스템은 한 번에 하나의 프롬프트에 응답하는 대신 어느 정도 자율성을 가지고 목표를 향해 행동하며, Claude Code는 코드베이스를 읽고 일련의 행동을 계획하고 실제 개발 도구를 사용하여 실행하고 결과를 평가하고 접근 방식을 조정합니다. 개발자는 목표를 설정하고 커밋할 내용에 대한 제어권을 유지하지만 실행 루프는 독립적으로 실행돼요.

오케스트레이션(orchestration)은 여러 에이전트를 동시에 띄워놓고, 누가 어떤 작업을 맡을지, 언제 결과를 합칠지, 충돌하면 어떻게 조정할지를 사람이 판단하는 역할이에요. 코드 한 줄 한 줄을 직접 쓰는 게 아니라, 목표를 정하고 AI가 만든 결과물을 검토하고, 여러 에이전트의 작업을 조율하는 쪽으로 무게중심이 옮겨가고 있어요.

Anthropic에서는 현재 코드의 80% 이상을 Claude Code가 작성하고, 엔지니어는 아키텍처, 제품 사고, 지속적인 오케스트레이션에 집중해요. Rakuten은 새 기능의 평균 전달 시간을 24 근무일에서 5일로 줄였고, 엔지니어들은 이제 여러 Claude Code 세션을 병렬로 실행해서 코드베이스 전체에 작업을 동시에 위임합니다.

사람이 빠지는 게 아니라, 감독하는 역할로 자리가 바뀌는 거예요

Claude Code는 파일을 수정하거나 명령을 실행하기 전에 명시적 권한이 필요하며, 불투명한 백엔드에서 작동하는 대신 개발자의 기존 환경에서 작동하고 개발자의 도구를 사용합니다. 어떤 코드를 배포할지에 대한 결정은 사람에게 남아 있어요.

개발자는 Claude Code가 얼마나 자율적으로 움직일지를 조절할 수 있어요. 모든 행동을 승인하는 방식부터 안전한 행동과 위험한 행동을 분류기가 자동으로 구분하게 두는 방식까지 선택할 수 있어요. 기본 설정은 조심스러운 쪽입니다.

실행 전에 전체 작업 계획을 먼저 보여주고 승인받는 '계획 모드'(혹은 동적 워크플로)는 자율 실행을 위험이 아니라 신뢰할 수 있는 작업 방식으로 만드는 장치입니다. `/plan` 명령으로 계획 모드를 활성화하면 Claude는 행동을 취하기 전에 상세한 구현 계획을 제안하고, 이를 복잡한 기능이나 아키텍처 변경을 설계하는 데 활용합니다.

에이전트 안전, 신뢰 보정, 접근 경계, 감독 메커니즘에 대한 Anthropic의 광범위한 연구가 Claude Code가 설계되는 방식에 영향을 미쳐요. 이 루프는 사람을 배제하는 구조가 아니라 supervised autonomy(감독 하의 자율성) 원칙으로 작동합니다. 코드 한 줄 한 줄을 직접 작성하는 대신, 목표와 제약을 정의하고 AI가 만든 결과물을 검토하는 역할로 무게중심이 옮겨가는 거예요.

마무리

프롬프트를 한 줄씩 쳐서 답변 한 번 받던 방식은 이제 옛날이야기가 되어가고 있습니다. 2026년 들어 자리 잡은 흐름은 목표를 정하면 AI가 알아서 맥락을 모으고, 실행하고, 검증하는 루프를 끝날 때까지 돌리는 구조예요.

혼자 만드는 사람에게 이 변화는 두 가지 의미로 다가와요. 하나는 코드 한 줄 한 줄을 직접 쓰지 않아도 된다는 것. 다른 하나는 이제 "무엇을 만들지, 어떤 순서로 검증할지, 어디까지 AI에게 맡길지"를 결정하는 판단 자체가 더 중요해졌다는 거예요.

한 번 더, 빠르게 짚고 갈게요

Q. 에이전틱 루프가 일반 프롬프트 방식과 다른 점은 뭔가요? A. 일반 프롬프트는 질문 한 번에 답변 한 번 받고 끝나요. 에이전틱 루프는 맥락 수집 → 실행 → 검증 단계를 작업이 끝날 때까지 계속 반복하고, 중간에 실패하면 스스로 다시 시도해요. 사람이 단계마다 개입하지 않아도 목표 달성까지 알아서 돌아요.

Q. Claude Code 창을 닫으면 /loop도 멈추나요? A. 로컬 세션 기반 자동화는 맞아요. 하지만 Routines는 클라우드에서 호스팅되어 노트북을 닫아도 계속 실행됩니다. 단, 현재 리서치 프리뷰 단계라 접근이 제한적이고, 일반 출시 전까지 기능과 가격이 변경될 수 있습니다.

Q. 개발자가 코드를 직접 안 쓰면 통제권을 잃는 거 아닌가요? A. 아니에요. 목표와 무엇을 커밋할지 최종 결정은 여전히 사람이 해요. AI가 작업을 자율적으로 실행하지만, 계획 모드(Plan Mode)로 실행 전에 전체 계획을 먼저 보여주고 승인받을 수 있고, 언제든 중간에 개입해서 방향을 바꿀 수 있어요. supervised autonomy(감독 하의 자율성) 구조예요.

Q. Cursor랑 Claude Code는 어떻게 다른가요? A. Cursor는 코드 자동 완성과 대화형 제안에 강점이 있어요. 다음 줄을 추천하고, 사람이 흐름을 주도해요. Claude Code는 목표를 던져주면 맥락 수집부터 검증까지 전체 루프를 스스로 돌리는 자율 실행에 초점을 맞춰요. 둘 다 유용하지만, 작업 스타일이 달라요.

Q. Auto Mode는 언제 쓰는 게 좋을까요? A. 여러 파일에 걸친 리팩토링처럼 예측 가능한 변경이 많거나, 빌드·테스트·개발 서버 실행처럼 파일 작업이 반복될 때 유용해요. 백그라운드 AI 분류기가 안전한 작업은 자동 승인하고 위험한 작업만 차단하기 때문에, 승인 피로 없이 작업 흐름을 유지할 수 있습니다. 단, 프로덕션 환경보다는 격리된 개발 환경에서 사용하는 것이 권장됩니다.

코워크메이커스 빌더가 직접 최근 AI 소식을 확인하고 코냥이 AI의 도움을 받아 작성한 글이에요. 공식 문서 기반으로 팩트 체크하여 가장 빠르게 소식을 전달하려고 해요.

참고 출처 (22)