클라우드의 두 번째 십 년, 인프라는 다시 물질이 된다
5 views
# 클라우드의 두 번째 십 년, 인프라는 다시 물질이 된다
2010년대의 클라우드는 하나의 약속이었다. 서버는 사라지고, 자원은 무한하며, 청구서는 사용한 만큼만 도착한다. 이 약속의 절반은 지켜졌고, 나머지 절반은 지난 3년간 조용히 철회되었다. 2026년 봄, 인프라 엔지니어가 마주한 풍경은 십 년 전과 닮은 듯 다르다. 데이터센터 부지를 둘러싼 분쟁, 전력회사와의 장기계약, GPU 할당량 협상. 한때 통신사업자나 제조업의 어휘였던 단어들이 지금은 클라우드 엔지니어의 일상이 되었다.
클라우드가 다시 물질이 되었다. 이 글은 그 회귀의 지형을 더듬는다.
## 추상화의 환상이 걷힌 자리
서버리스가 처음 등장했을 때, 그것은 종착역처럼 보였다. 함수만 작성하면 나머지는 누군가가 알아서 처리한다. 그러나 2024년부터 누적된 청구서들은 다른 이야기를 들려준다. 콜드 스타트의 누적 지연, 벤더 락인의 비용, 그리고 무엇보다 정확한 비용을 사후에야 알 수 있다는 사실. 한때 비용 관리 도구의 마케팅 용어였던 FinOps는 이제 플랫폼 팀의 정식 직무가 되었다.

추상화는 비용을 없애지 않는다. 감출 뿐이다.
이 단순한 명제를 다시 발견하기까지 십 년이 걸렸다. 대형 클라우드 사업자의 마진율이 하드웨어 사업자보다 높고 그 격차가 줄지 않는다는 사실은 공개된 재무제표가 증언한다. 클라우드는 인프라가 아니라 금융 상품에 가까웠다는 회고가 컨퍼런스 키노트가 아니라 사내 회의실에서 나오기 시작했다.
그래서 회귀가 시작되었다. 37signals가 자사 서비스를 자체 데이터센터로 이관하며 공개한 비용 수치는 한때의 이단이었으나, 지금은 사례 연구의 표준이 되었다. '리패트리에이션(repatriation)'이라는 어색한 단어는 한국어로 번역되지 못한 채 그대로 쓰인다. '돌아간다'는 표현이 어울리지 않는 까닭은, 완전히 돌아가는 회사가 드물기 때문이다. 무엇을 클라우드에 남기고 무엇을 끌어내릴 것인가. 이 결정이 2026년 플랫폼 엔지니어의 핵심 업무가 되었다.
## 가속기, 전력, 그리고 지정학

추상화가 후퇴한 자리에 들어선 것은 두 가지 물질이다. 가속기와 전력.
LLM 시대 이전의 데이터센터는 CPU와 메모리, 네트워크의 균형 위에 설계되었다. H100 이후 등장한 가속기들은 이 균형을 무너뜨렸다. 한 랙의 전력 밀도는 십 년 전의 다섯 배에 이르고, 냉각 방식은 공랭에서 액침으로 옮겨가고 있다. 데이터센터는 더 이상 '서버를 보관하는 창고'가 아니다. 그것은 발전소의 끝단이며, 화학 공장의 친척이다.
이 변화는 클라우드 사업자의 의사결정 구조를 바꿔놓았다. 신규 리전을 결정짓는 변수는 지연시간이나 시장 규모가 아니라 **전력 가용성**이다. 2022년 아일랜드 더블린이 신규 데이터센터 접속을 사실상 동결한 사건은 예고편이었다. 버지니아 북부, 아일랜드, 싱가포르. 한때 클라우드의 수도였던 지역들이 차례로 신규 공급에 제동을 걸었다. 그 결과는 두 갈래로 나뉜다. 하나는 노르딕처럼 한랭하고 수력 자원이 풍부한 지역으로의 이주, 다른 하나는 원자력의 부활이다. 마이크로소프트의 스리마일 재가동 계약과 아마존의 SMR(소형모듈원자로) 투자는 같은 문장의 다른 절이다.
여기에 지정학이 겹친다. EU의 데이터 주권 요구는 GDPR의 연장선이 아니라 산업정책의 도구로 격상되었다. 인도, 인도네시아, 브라질의 데이터 현지화법은 글로벌 아키텍처를 강제로 다지역화시킨다. 미·중 기술 분리는 GPU의 흐름을 국경에서 멈추게 했다. 어느 회사가 '글로벌 단일 플랫폼'이라는 단어를 쓸 때, 그것이 무엇을 의미하는지 다시 정의해야 하는 시점이다.
엔지니어의 작업대 위에 지도가 다시 펼쳐졌다.

## 쿠버네티스 이후, 플랫폼의 재발견
기술 스택의 층위에서도 비슷한 회귀가 관찰된다. 쿠버네티스는 표준이 되었지만, 표준이 곧 해결을 뜻하지는 않는다. CNCF 랜드스케이프에 등재된 도구는 1,000개를 넘어섰고, 그 숫자 자체가 하나의 풍자다. 도구가 많아질수록 그 도구들을 엮는 일이 본업이 된다.
이 피로감에 대한 응답은 두 갈래로 나뉜다.
한쪽은 **내부 개발자 플랫폼(IDP)** 이다. Backstage가 등장한 지 5년이 지났고, '플랫폼 엔지니어링'은 SRE의 변종이 아니라 독립된 분과로 자리잡았다. 개발자에게 쿠버네티스의 디테일을 노출시키지 않는 것, 이것이 새로운 추상화의 목표다. 다만 이번 추상화는 '벤더가 제공하는 것'이 아니라 '조직이 직접 빚는 것'이다. 추상화의 비용을 감추는 대신, 내부화한다.

다른 한쪽은 더 단순한 길을 택한다. 단일 바이너리, 모놀리식 배포, 적은 의존성. Go로 작성한 하나의 실행 파일이 컨테이너 오케스트레이션 없이 베어메탈 위에서 도는 구성을 이제 누구도 시대착오라 부르지 않는다. 복잡성의 한계효용이 음수가 되는 지점이 있다는 사실을, 2026년의 엔지니어는 경험으로 안다.
엣지 컴퓨팅 역시 같은 논리의 다른 표현이다. 데이터를 본부로 끌어와 처리하는 비용이 현장에서 처리하는 비용을 넘어서는 임계점이 점점 더 많은 도메인에서 발견되고 있다. 자율주행, 산업 IoT, 의료영상. 이들은 '클라우드에서 한다'는 명제가 처음부터 거짓이었던 영역이다.
## AI 인프라라는 새로운 종(種)
이 모든 변화의 한복판에 AI 워크로드가 있다. 그것은 단순히 '큰 작업'이 아니라 기존 인프라의 가정 자체를 뒤흔드는 존재다.

전통적인 웹 서비스의 트래픽은 사용자 수에 비례한다. 반면 추론 워크로드의 비용은 사용자 수가 아니라 토큰 수에 비례하며, 토큰의 길이는 사용자가 결정한다. 비용 예측의 단위가 달라진 것이다. 캐시의 의미도 함께 변했다. 5년 전에는 존재하지도 않던 KV 캐시 개념이 이제 추론 인프라 설계의 중심에 자리한다.
학습 워크로드는 더 극단적이다. 수천 장의 GPU가 수 주 동안 단일 작업을 수행하며, 그중 한 장이 죽으면 전체가 영향을 받는다. 체크포인팅과 페일오버, 네트워크 토폴로지(InfiniBand인가 RoCE인가), 분산 스토리지의 IOPS. 이 모든 것은 '웹 서비스 운영' 교과서에 없던 어휘다. AI 인프라는 클라우드의 후예가 아니라 HPC(고성능 컴퓨팅)의 후예다. 그러나 클라우드의 옷을 입고 등장한 탓에, 두 전통의 충돌이 모든 회의실에서 일어난다.
소형 모델(SLM)의 부상은 이 충돌의 또 다른 양상이다. 7B, 13B 규모의 모델을 자사 하드웨어에서 돌리는 선택지가 현실이 되면서 '추론은 API로'라는 명제가 흔들린다. 추론 주권이라는 어색한 단어가 2026년에는 통용된다.
## 회귀가 아닌 성숙
지금까지의 풍경을 '클라우드의 후퇴'로 읽는다면 절반만 본 것이다. 클라우드는 후퇴하지 않는다. 그것이 무엇이었는지에 대한 우리의 이해가 정정될 뿐이다.
초기 클라우드의 마케팅 언어는 인프라를 '신경 쓸 필요 없는 것'으로 만들었다. 2026년의 인프라는 다시 신경 써야 하는 것이 되었다. 전력 단가를 따지고, 가속기 세대 차이를 비교하고, 지역별 규제를 읽고, 자체 데이터센터의 PUE(전력사용효율)를 계산한다. 십 년 전 시스템 엔지니어가 본다면 익숙한 풍경일 것이다. 다만 도구가 다르고, 규모가 다르며, 무엇보다 이 일을 하는 사람의 자기 인식이 다르다.
> 知之者不如好之者 好之者不如樂之者.
> 아는 자는 좋아하는 자만 못하고, 좋아하는 자는 즐기는 자만 못하다.
『논어』의 이 구절을 인프라 엔지니어링에 끌어들이는 것이 비약처럼 들릴 수 있다. 그러나 도구의 추상화가 후퇴하고 물질의 디테일이 돌아온 시대에, 그 디테일을 즐길 수 있는가 없는가가 직무의 지속가능성을 가른다. 데이터센터의 냉각수 유량, 가속기 인터커넥트의 토폴로지, 전력회사와의 PPA(전력구매계약) 조건. 이것들이 흥미롭지 않다면 2026년 이후의 인프라 일은 고역이 된다.
클라우드의 두 번째 십 년은 첫 번째 십 년의 부정이 아니다. 그것의 청구서다. 청구서는 언제나, 약속이 지켜진 만큼만 도착한다.
남은 질문은 하나다. 다음 추상화는 어디에서 올 것이며, 그것은 무엇을 다시 감출 것인가.