인프라 자동화의 진화와 최신 동향: 왜 지금 기업에 중요한가와 최신 동향: 왜 지금 기업에 중요한가
1 views
# 인프라 자동화의 진화와 최신 동향: 왜 지금 기업에 중요한가
## 도구가 아니라 문법의 문제
2006년 아마존이 S3와 EC2를 공개했을 때, 사람들은 '서버를 빌리는 일'이 새로워졌다고 평했다. 그러나 진짜 변화는 다른 곳에 있었다. 인프라가 처음으로 문자열로 호출 가능한 대상이 된 것이다. 명령 한 줄이 데이터센터의 한 칸을 점유하고, 또 한 줄이 그것을 해체한다. 이때부터 인프라는 물리적 자산이 아니라 문법의 산물로 바뀌기 시작했다.
자동화의 역사가 도구의 역사가 아닌 이유가 여기에 있다. 그것은 운영자가 무엇을 언어화할 수 있게 되었는가의 역사다. 셸 스크립트의 시대에는 절차를 언어화했고, Ansible과 Chef의 시대에는 상태를, Terraform과 Kubernetes의 시대에는 토폴로지 자체를 언어화했다. 그리고 지금 우리는 의도(intent)와 정책(policy)을 언어화하는 단계에 들어섰다.

이 흐름을 읽지 못하면 자동화는 또 하나의 기술 부채로 굳어진다. 기업이 자동화에 실패하는 가장 흔한 이유는 도구가 부족해서가 아니라, 자신들이 무엇을 언어화하고 있는지를 자각하지 못해서다.
## 세 번의 변곡점
### 첫 번째 변곡: 절차에서 상태로
초기 자동화는 'A를 한 뒤 B를 하라'의 형식이었다. 셸 스크립트, Bash, Perl이 그러했다. 이 방식은 단순하지만 잔혹하다. 중간에 실패하면 시스템은 어디에도 속하지 않는 상태에 빠진다. 50대의 서버에 같은 스크립트를 돌리면 50개의 미묘하게 다른 결과가 남는다.

Puppet(2005), Chef(2009), Ansible(2012)이 가져온 변화는 '명령'이 아니라 '선언'을 가능하게 한 것이었다. "이 서버는 nginx 1.18이 설치된 상태여야 한다"고 쓰면, 도구가 알아서 현재 상태와 비교해 차이를 메운다. 절차적 사고에서 상태 기반 사고로의 전환, 이것이 첫 번째 변곡이다.
### 두 번째 변곡: 상태에서 토폴로지로
클라우드가 보편화되자 자동화의 대상은 한 대의 서버가 아니라 수백 개의 리소스가 얽힌 구조 전체가 되었다. VPC와 서브넷, 보안 그룹, 로드밸런서, IAM 역할이 서로를 참조한다. 이들의 관계를 사람의 손으로 관리하는 것은 곧 사고를 부르는 일이다.
2014년 HashiCorp의 Terraform이 공개되면서 IaC(Infrastructure as Code)는 토폴로지를 선언하는 언어로 진화했다. 같은 시기 등장한 Kubernetes는 더 나아갔다. 컨테이너 한 개가 아니라 클러스터 전체의 desired state를 YAML로 기술하고, 컨트롤러가 끊임없이 현실을 그 선언에 수렴시킨다. 이른바 reconciliation loop다. 자동화가 일회성 이벤트가 아니라 지속적 수렴 과정이 된 것이다.

GitOps는 이 사고를 한 단계 더 밀어붙였다. Argo CD와 Flux는 Git 저장소를 시스템의 정본(source of truth)으로 삼는다. 운영자는 클러스터에 직접 명령하지 않는다. Git에 PR을 올릴 뿐이고, 시스템이 자기 자신을 그 선언에 맞춰 다시 그린다. 운영은 합의의 절차가 되었다.
### 세 번째 변곡: 토폴로지에서 정책과 의도로
지금 일어나고 있는 변화는 미묘하지만 본질적이다. 토폴로지를 잘 선언하는 것만으로는 더 이상 충분하지 않다. 수십 개 팀이 각자의 Terraform 모듈과 Helm 차트를 운영하는 조직에서, 일관된 보안과 비용, 컴플라이언스를 어떻게 강제할 것인가.
Open Policy Agent(OPA)와 Kyverno 같은 도구가 답한 것이 이 질문이다. 정책 자체를 코드로 쓰고, 모든 인프라 변경 요청을 그 정책에 통과시킨다. "S3 버킷은 반드시 암호화되어야 한다", "production 네임스페이스에는 latest 태그를 쓸 수 없다" 같은 규칙이 사람의 리뷰가 아니라 머신의 게이트로 작동한다. 이를 Policy as Code라 부른다.

Backstage 같은 내부 개발자 플랫폼(IDP)의 부상도 같은 흐름이다. 개발자는 더 이상 인프라의 세부 구조를 알 필요가 없다. 그는 "Python 서비스를 만들겠다"는 의도만 표현하고, 플랫폼이 그 의도를 실제 토폴로지로 번역한다. 자동화는 이제 '무엇을 할지'에서 '무엇을 원하는지'로 추상의 층위를 올렸다.
## 왜 하필 지금인가
기술의 흐름은 늘 한 발 앞서 움직이지만, 그것이 경영의 의제가 되는 순간은 따로 있다. 2024년 이후가 바로 그 순간이다.
첫째, AI 워크로드의 폭증이다. GPU 클러스터는 시간당 비용이 일반 인스턴스의 수십 배에 달한다. 유휴 시간 한 시간이 곧 가시적 손실이 된다. 수작업으로 관리되는 GPU 풀은 더 이상 용납되지 않는다. 자동화는 비용 통제의 1차 방어선이 되었다.

둘째, 보안과 규제의 압력이다. EU의 DORA와 NIS2, 미국 SEC의 사이버 공시 규정이 차례로 시행되면서 기업은 자신의 인프라 상태를 증명 가능한 형태로 기록해야 한다. 누가 언제 무엇을 바꿨는지, 그 변경이 어떤 정책을 통과했는지를 감사관 앞에 펼쳐야 한다. IaC와 GitOps는 그 증명 가능성을 자연스럽게 제공한다. 자동화는 컴플라이언스의 기반 인프라가 된 셈이다.
셋째, 멀티클라우드의 일상화다. 단일 클라우드 종속을 피하려는 흐름과 지정학적 리스크에 따른 리전 분산은 이제 선택이 아니다. AWS와 GCP, 온프레미스 K8s를 동시에 운영하는 조직에서 환경마다 다른 운영 절차를 유지하는 것은 불가능에 가깝다. 추상화된 자동화 계층만이 이질성을 견딘다.
넷째, 가장 본질적으로 AI가 자동화의 작성자 자리에 들어오고 있다. GitHub Copilot이 Terraform 코드를 제안하고, 생성형 모델이 Kubernetes manifest의 초안을 잡는다. 사람의 작성 비용이 떨어진 만큼, 작성된 것을 검증하는 능력이 가치의 중심으로 이동한다. 정책, 테스트, 드리프트 감지 — 자동화의 무게중심은 '쓰기'에서 '지키기'로 옮겨가는 중이다.
## 함정: 도구는 풍족하나 사유는 빈곤하다

그럼에도 많은 조직의 자동화는 표류한다. 이유는 기술이 아니다.
가장 흔한 함정은 도구의 컬렉션을 자동화로 착각하는 것이다. Terraform, Ansible, Argo CD, Vault를 도입했다고 해서 자동화된 조직이 되는 것은 아니다. 도구 사이의 경계에서 일어나는 일들 — 누가 Terraform state를 깰 권한을 갖는가, Argo CD가 적용한 변경과 사람이 손으로 한 변경이 충돌할 때 무엇이 우선하는가 — 을 언어화하지 못한 조직은 도구가 늘어날수록 운영이 더 무거워진다.
두 번째 함정은 선언과 절차의 혼동이다. 선언적 도구를 도입하고도 사고방식은 여전히 절차적인 팀이 많다. "지금 한 번 적용하면 끝"이라는 사고로 Terraform을 쓰면, 다음 apply에서 인프라가 마음대로 변형된다. 선언적 자동화는 지속적으로 같은 결과를 보장하는 약속이며, 그 약속을 매일 검증하는 문화가 없으면 곧 거짓말이 된다.
세 번째 함정은 자동화를 비용 절감의 도구로만 보는 시각이다. 자동화가 절약하는 것은 인건비가 아니다. 그것이 절약하는 것은 조직이 같은 실수를 두 번 하지 않을 권리다. 운영 지식이 사람의 머리에서 코드로 이주하는 순간, 그 지식은 검토되고 비판받고 개선될 수 있는 대상이 된다. 자동화의 진짜 산물은 효율이 아니라 학습 가능한 운영이다.
## 운영 지식의 코드화, 그것이 본질이다
인프라 자동화의 30년을 한 문장으로 요약하라면 이렇게 쓰겠다. 운영자의 머릿속에 있던 것을 저장소로 옮기는 작업. 셸 스크립트는 절차를 옮겼고, Ansible은 상태를, Terraform은 구조를, OPA는 판단을 옮겼다. 다음 단계는 의도다. 그다음은 아마도 판단의 근거가 될 컨텍스트 그 자체일 것이다.
이 관점에서 보면 자동화의 성숙도는 얼마나 많은 도구를 도입했는가가 아니라 운영의 어느 층위까지 코드화했는가로 측정되어야 한다. 어떤 조직은 배포를 자동화했지만 장애 대응은 여전히 채팅창의 구전이고, 어떤 조직은 정책까지 코드화했지만 그 정책의 변경 이력을 추적하지 못한다. 코드화의 깊이는 곧 조직이 자신을 객관적으로 바라볼 수 있는 깊이다.
지금 기업에 자동화가 중요한 이유는 그것이 빠르고 싸기 때문이 아니다. AI가 만든 코드, 멀티클라우드의 분산, 규제의 압력, 자동화된 보안 위협 — 이 모든 변수가 동시에 가중되는 시대에, 자신의 운영을 검증 가능한 형태로 기술할 수 없는 조직은 스스로를 통제할 수단을 잃는다. 자동화는 효율의 문제가 아니라 주권의 문제로 격상되었다.
도구는 계속 바뀔 것이다. 앞으로 10년간 우리가 쓰는 자동화 스택은 지금과 사뭇 다른 이름을 가질 것이다. 그러나 본질은 변하지 않는다. 자동화란, 운영자가 자신의 시스템에 대해 명료하게 말하는 법을 배우는 일이다. 명료하게 말할 수 있는 것만이 자동화되고, 자동화된 것만이 비로소 검토될 수 있다. 검토될 수 있는 것만이 진화한다.
노자는 "위무위 사무사(爲無爲 事無事)"라 했다. 함이 없이 행하고, 일삼음 없이 일을 이룬다는 뜻이다. 가장 잘 설계된 자동화는 사람의 손이 잊히는 자동화다. 다만 손이 잊히기 위해서는 그 손이 무엇을 하고 있었는지를 누구보다 먼저 언어화해야 한다. 자동화의 모든 진보는 이 역설 위에 서 있다.