배달 앱 회사가 MCP 서버를 운영한다. 이 한 문장이 2026년 한국 테크 업계의 현주소를 압축한다. 우아한형제들이 올해 우아콘에서 공개한 내용을 보면, 이 회사는 더 이상 "배달 플랫폼에 AI를 얹는" 수준이 아니라 조직 전체를 AI 네이티브로 재편하는 중이다.

MCP라는 도구, 배달 회사가 쥔 이유

MCP(Model Context Protocol)는 Anthropic이 공개한 프로토콜로, LLM이 외부 시스템의 도구와 데이터에 접근하는 방식을 표준화한다. 쉽게 말해 AI 에이전트가 슬랙 메시지를 보내고, 데이터베이스를 조회하고, 내부 API를 호출할 수 있게 만드는 '만능 어댑터'다.

그런데 왜 배달 회사에 이게 필요한가? 우아한형제들의 답은 단순하다. 개발자만 AI를 쓰는 게 아니라 기획자, 운영팀, 마케터 모두가 자기 업무 맥락에서 AI를 호출할 수 있어야 한다는 것이다. MCP 서버가 있으면 각 팀이 자기 도메인의 도구를 플러그인처럼 등록할 수 있고, 사용자는 자연어로 그 도구들을 조합해 쓸 수 있다. 배달 주문 데이터를 분석하든, 가맹점 CS 이력을 뒤지든, 인터페이스는 하나다.

'물어보새'라는 이름의 실험

우아한형제들이 실제로 굴리고 있는 사내 AI 서비스의 이름이 '물어보새'다. 새 캐릭터를 모티프로 한 네이밍인데, 중요한 건 이름이 아니라 아키텍처다.

물어보새는 RAG(Retrieval-Augmented Generation)과 MCP를 결합했다. 사내 위키, 컨플루언스 문서, 슬랙 채널의 히스토리, 데이터 웨어하우스의 메타데이터 — 이런 것들이 전부 RAG의 지식 소스로 들어간다. 여기에 MCP를 통해 실시간 도구 호출이 가능하니, 단순히 "문서에서 찾아서 답해주는" 수준을 넘어 "직접 데이터를 조회하고 액션을 수행하는" 에이전트에 가까워진다.

흥미로운 지점은 이게 POC(개념 증명)가 아니라 실제 사내 운영 도구라는 점이다. 우아콘 세션에서 나온 사례를 보면, 운영팀이 "지난주 강남 지역 배달 취소율이 평소보다 높았는데 원인이 뭐야?"라고 물어보새에 질문하면, 시스템이 알아서 관련 데이터를 조회하고 분석 결과를 돌려준다. 예전이라면 데이터 분석 요청 티켓을 끊고 며칠을 기다려야 할 작업이다.

물론 정확도 문제는 있다. Text-to-SQL의 고질적인 한계 — 복잡한 조인이 필요한 쿼리에서 틀리는 경우, 컨텍스트를 잘못 해석하는 경우 — 는 물어보새도 피해가지 못한다. 우아한형제들은 이걸 피드백 루프로 풀려고 한다. 사용자가 결과를 검증하고 "이거 틀렸어"라고 피드백하면 그게 다시 학습 데이터로 쌓이는 구조다. 완벽하지 않지만 쓸수록 나아진다는 전략인데, 이 접근이 실제로 수렴하려면 초기 사용자의 인내심이 꽤 필요하다.

타이밍이 우연은 아니다

배민이 갑자기 AI에 진심이 된 건 아니다. 배경에는 '배민 2.0'이라는 더 큰 그림이 있다. 지난해 15주년을 맞아 선언한 리브랜딩 프로젝트로, 단순 배달 중개를 넘어 주문부터 배송까지 전 과정을 기술로 커버하는 End-to-End Delivery를 지향한다. 브랜드 컬러를 바꾸고 폰트를 새로 만든 건 겉포장이고, 진짜 핵심은 기술 조직의 체질 변화다.

모회사 딜리버리히어로가 18개월간 한국 사업의 운영 모델을 완전히 재구축했다는 보도도 이 맥락이다. 가격 정책, 기술 아키텍처, 파트너 관계 전부를 손봤다. MCP 도입은 그 기술 아키텍처 개편의 한 조각이다.

쿠팡이츠가 와우 멤버십으로 맹추격하는 상황에서, 배민이 선택한 차별화 전략이 "더 싸게"가 아니라 "더 똑똑하게"인 셈이다. 배민클럽 주문 비중이 전체의 50%에 달한다는 수치를 보면, 락인된 사용자 기반 위에서 운영 효율을 극대화하는 쪽으로 방향을 잡은 것 같다.

같은 고민, 다른 답

재밌는 건 비슷한 시기에 당근페이도 Bedrock 기반 Text-to-SQL 챗봇 '브로쿼리'를 공개했다는 것이다. LangGraph로 에이전트 플로우를 짜고, OpenSearch RAG로 컨텍스트를 끌어오고, MCP 서버로 외부 도구를 연결한다. 구조가 물어보새와 꽤 닮았다.

한국 테크 기업들이 거의 동시에 같은 패턴 — RAG + MCP + 에이전트 오케스트레이션 — 에 수렴하고 있다. 기술 스택의 표준화가 빠르게 진행되는 셈인데, 이건 장단점이 있다. 구현의 진입장벽이 낮아지는 대신, 경쟁 우위는 결국 "얼마나 좋은 데이터를 갖고 있느냐"와 "얼마나 잘 쓰게 만드느냐"로 옮겨간다.

배민이 MCP 서버를 깔았다는 사실 자체보다, 2천 명 규모의 비개발 직군이 그걸 실제로 쓰게 만들 수 있느냐가 진짜 승부처다. 기술은 이미 충분하다. 채택이 문제다.