아웃소싱 2.0: AI 시대를 위한 새로운 확장법
아웃소싱 2.0: AI 시대를 위한 새로운 확장법
등록하기

AI 확장을 가로막는 숨은 장벽: AI를 위해 설계되지 않은 데이터

오늘날 대부분의 조직에서 AI에 대한 의지는 문제가 아닙니다.

예산은 늘어나고 있으며, 파일럿 프로젝트는 계속 증가하고 있고, 경영진 역시 이 기술의 전략적 중요성에 공감하고 있습니다. 그러나 조직의 43%에게 데이터 준비도는 여전히 AI가 이러한 목표를 실현하도록 만드는 데 있어 가장 큰 단일 장벽으로 남아 있습니다. 이러한 격차가 왜 존재하는지, 그리고 이를 해소하기 위해 실제로 무엇이 필요한지를 이해하는 것이야말로 대부분의 기업이 보다 솔직하고 면밀하게 점검해야 할 과제입니다.

파일럿은 성공하지만 확장에는 실패할 때

AI 도입에 대한 압박은 모든 방향에서 커지고 있으며, 대부분의 조직은 전략을 수립하고, 전담 팀을 구성하며, 여러 사업부에서 개념검증을 추진하는 등 문서상으로는 올바른 대응을 해 왔습니다. 그러나 진짜 과제는 실험 단계가 아니라, 성공적인 파일럿을 비즈니스 핵심 시스템으로 확장해야 하는 시점에 나타납니다.

POC(개념검증) 프로젝트에서는 기술팀이 수작업 개입을 통해 데이터의 한계를 보완할 수 있는 경우가 많습니다. 필요에 따라 데이터를 정제하고, 대조하며, 보완할 수 있기 때문에 프로젝트는 유의미한 결과를 보여줄 수 있습니다. 하지만 이러한 임시 대응 방식은 프로덕션 전환 과정에서 지속되기 어렵습니다.

AI 이니셔티브가 전사적 배포 단계로 이동하면, 더 깊은 조직적 문제가 드러나기 시작합니다. 솔루션을 구축하는 팀은 해당 시스템이 궁극적으로 의존하게 될 프로세스와 데이터를 보유한 사업부와 분리되어 운영되는 경우가 많습니다. 그 결과 이해관계자들은 비즈니스 목표, 데이터 요구사항, 소유권 책임, 장기 유지보수에 대해 서로 다른 전제를 갖게 될 수 있습니다. 처음에는 기술적 과제로 보였던 문제가 곧 데이터와 거버넌스의 과제임을 드러냅니다.

확장 단계에서는 단절된 데이터 파이프라인, 일관되지 않은 정의, 불명확한 소유권을 더 이상 간과하기 어렵습니다. 정보는 레거시 시스템, 클라우드 플랫폼, 부서별 애플리케이션 전반에 흩어져 있으며, 각 시스템은 운영 현실에 대한 각자의 버전을 유지합니다. 특히 기업에서 흔히 나타나는 과제처럼 내부 개발 역량이 제한적인 조직의 경우, 이러한 격차를 연결할 수 있는 내부 리소스가 충분하지 않은 경우가 많습니다. 수치도 이를 폭넓게 보여줍니다. 조직의 79%는 필요한 데이터에 대한 접근 제한으로 인해 AI 이니셔티브가 저해되고 있다고 응답했으며, 기업 데이터의 약 68%는 저장 비용이 발생하고 있음에도 불구하고 사용되거나 분석되지 않은 상태로 남아 있는 것으로 추정됩니다.

생성형 AI는 이러한 문제의 중요성을 더욱 높입니다. 기존 애널리틱스에서는 낮은 데이터 품질이 일반적으로 부정확한 리포트나 잘못된 인사이트로 이어졌으며, 이는 심각하지만 대체로 범위가 제한된 문제였습니다. 그러나 생성형 AI는 이러한 리스크의 성격을 바꿉니다. AI 시스템은 단순히 결함 있는 입력값을 반영하는 데 그치지 않고, 이를 기반으로 새로운 콘텐츠를 생성하며, 생성되는 모든 결과물 전반에 오류를 재현하고 잠재적으로 증폭시킵니다.

이러한 환경에서 데이터 준비도는 더 이상 AI를 위한 단순한 기술적 전제조건이 아닙니다. 이는 신뢰, 거버넌스, 지속 가능한 도입을 위한 비즈니스 요구사항이 됩니다.

AI 준비도에 대한 착각

AI 파일럿 및 POC 프로젝트가 성공하면, 이는 조직이 AI를 도입할 준비가 되어 있다는 증거처럼 보이는 결과물을 만들어내는 경우가 많습니다. 대시보드가 구성되고, 지표가 통합되며, 리포트가 깔끔하게 실행되고, 경영진은 어쩌면 처음으로 비즈니스를 일관된 하나의 그림으로 바라보게 됩니다. 이렇게 눈에 보이는 결과물, 즉 정제된 인터페이스, 연결된 데이터, 작동하는 데모는 합리적이지만 잘못된 결론을 만들어냅니다. 조직의 데이터 기반이 충분히 견고하므로 그 위에 AI를 구축해도 된다는 판단입니다.

문제는 리포팅 성숙도와 AI 준비도가 본질적으로 서로 다른 것을 측정한다는 점입니다.

이러한 대시보드 뒤에 있는 모든 시스템은 특정한 목적을 가지고 설계되었습니다. 이미 발생한 일을 설명하는 것입니다. 데이터 웨어하우스는 과거 데이터를 조회하는 데 최적화되어 있습니다. KPI 프레임워크는 주기적인 검토 사이클을 중심으로 구축되어 있습니다. 리포팅 파이프라인은 운영 시스템의 데이터를 분석 계층으로 이동시키지만, 그 데이터를 다시 실제 의사결정과 업무 흐름 속으로 되돌려 보내 실행으로 이어지게 하지는 않습니다. 인프라는 의도한 대로 작동하지만, 이는 행동이 아니라 사후 분석을 위해 만들어진 구조입니다.

조직이 더 실시간에 가까운 데이터의 필요성을 인식하더라도 또 다른 과제는 여전히 남아 있는 경우가 많습니다. 데이터셋이 정확하고, 최신 상태이며, 기술적으로 정제되어 있더라도 AI 기반 의사결정에는 여전히 충분하지 않을 수 있습니다. 정확성만으로는 AI 시스템이 해당 데이터가 비즈니스 맥락에서 무엇을 의미하는지 이해할 수 없습니다. AI에는 신뢰할 수 있는 정보 이상의 것이 필요합니다. 소유권, 우선순위, 제약 조건, 기대하는 결과를 설명해 주는 맥락이 필요합니다. “올바른 비즈니스 도메인이 없다면, AI는 논리적으로 들리는 답을 제공할 수는 있지만 실제 운영 현실과 맞지 않을 수 있습니다.”

AI에는 의사결정을 지원하기 위해 정제된 데이터뿐만 아니라 충분한 맥락을 갖춘 데이터가 필요합니다.

간단한 리테일 시나리오를 생각해 볼 수 있습니다. 한 고객이 2월에 “따뜻한 겨울 코트”를 검색합니다. 일반적인 AI는 검색어를 확인하고, 고객이 지난해 두꺼운 파카를 구매했다는 사실을 참고하며, 여전히 기온이 낮다는 점을 확인한 뒤, 정가의 두꺼운 겨울 코트를 자신 있게 추천합니다. 하지만 고객은 아무것도 구매하지 않고 떠납니다. AI는 데이터에 대해 틀린 것이 아니었습니다. 상황을 잘못 이해한 것입니다. 리테일 맥락을 이해하는 시스템이라면, 2월이 겨울 판매 사이클의 막바지라는 점, 이 시기에 코트를 검색하는 고객은 대개 고가의 본격적인 구매보다 클리어런스 상품이나 간절기용 레이어를 찾는다는 점, 그리고 리테일러의 실제 우선순위는 봄 시즌을 위한 공간을 확보하기 위해 겨울 재고를 소진하는 데 있다는 점을 이해할 수 있습니다.

이러한 맥락이 주어지면 추천은 완전히 달라집니다. 할인 코트가 전면에 노출되고, 간절기 아이템이 함께 구성되며, 고객의 탐색 이력이 여행 의도를 시사한다면 캐주얼 아우터 대신 스키용 옵션이 추천됩니다. 고객은 두 가지 상품을 구매합니다. 리테일러는 악성 재고를 줄이고 평균 주문 금액을 높입니다. 두 시나리오에서 데이터는 동일했습니다. 달라진 것은 AI가 추론할 수 있도록 제공된 비즈니스 맥락이었습니다.

생성형 AI는 완전히 다른 요구사항을 기반으로 작동합니다. 생성형 AI는 과거를 요약하는 데 그치지 않습니다. 조직의 여러 시스템에 현재 존재하는 데이터를 바탕으로 실시간으로 응답, 추천, 콘텐츠를 생성합니다. 데이터가 실행을 위한 것이 아니라 리포팅을 기준으로 거버넌스되고 있을 때, 경영진이 조직이 지원할 수 있다고 믿는 수준과 실제 인프라가 제공할 수 있는 수준 사이의 격차는 핵심 장애물이 됩니다.

이것이 바로 AI 준비도에 대한 착각입니다. 그리고 많은 조직이 AI 이니셔티브의 프로덕션 단계에 도달했을 때, 실제 데이터 인프라가 뒷받침할 수 있는 수준보다 훨씬 더 큰 확신을 갖게 되는 이유이기도 합니다.

실제로 구축하기 위해 필요한 것

AI를 파일럿에서 프로덕션으로 성공적으로 전환하는 조직에는 한 가지 공통된 원칙이 있습니다. 무엇을 구축할지 결정하기 전에, 현재 실제로 무엇을 보유하고 있는지를 먼저 평가한다는 점입니다. 이 출발점, 즉 현재 데이터 환경에 대한 솔직한 감사는 모델을 배포하는 것만큼 화려하지는 않지만, 해당 모델이 프로덕션 현실과 마주했을 때 살아남을 수 있는지를 결정합니다.

실무에서 이러한 평가는 대체로 반드시 갖춰야 하는 세 가지 기반 작업을 드러냅니다.

  • 첫 번째는 검색 가능성입니다. 데이터는 공식적인 IT 거버넌스 밖에 있는 자산까지 포함해 여러 환경 전반에서 확인 가능하고 접근 가능해야 합니다. 공식적으로는 누구도 집계하지 않지만, 모두가 조용히 의존하고 있는 시스템과 스프레드시트까지 포함됩니다.
  • 두 번째는 기본적인 데이터 품질입니다. 정확성, 일관성, 완전성을 평가해 최소한 입력값으로 신뢰할 수 있는 수준인지 확인해야 합니다.
  • 세 번째이자 가장 자주 과소평가되는 요소는 맥락입니다. 데이터셋이 모든 품질 검사를 통과하더라도, 그 주변의 비즈니스 로직을 담고 있지 않다면 AI에는 사용할 수 없을 수 있습니다. “데이터셋이 기술적으로는 정확할 수 있지만, 해당 데이터가 비즈니스적으로 어떤 의미를 갖는지, 누가 데이터를 소유하는지, 어떤 규칙이 적용되는지, 해당 의사결정에 어느 정도의 리스크가 수반되는지, 어떤 조치가 허용되는지를 전달하지 못한다면 여전히 충분하지 않습니다.” 바로 이 지점에서 거버넌스는 구체적인 형태를 갖게 됩니다. 단순히 누가 데이터에 접근할 수 있는지를 정하는 것이 아니라, 자동화된 시스템이 사용자를 대신해 해당 데이터로 무엇을 수행할 권한이 있는지, 그리고 그 경계가 어디까지인지를 정의하는 것입니다.

이 세 가지 필수 요소를 넘어, 계보 추적, 도메인 소유권, 재사용 가능한 데이터 파이프라인과 같은 별도의 역량은 확장 단계에서 매우 중요하지만, 첫 번째 유스케이스를 추진하기 전에 반드시 갖춰야 하는 것은 아닙니다. 이러한 역량은 시간이 지날수록 복리처럼 효과가 누적되는 투자이며, 이후의 각 이니셔티브를 더 빠르고 더 낮은 비용으로 구축할 수 있게 합니다. 이를 선행 조건으로 간주하는 조직은 종종 무기한 대기 상태에 머물게 됩니다. 반면 유스케이스별로 점진적으로 이러한 역량을 구축해 나가는 조직이 결국 그 격차를 좁히게 됩니다.

실질적인 의미에서 데이터 준비도는 완료일이 정해진 프로젝트가 아닙니다. 이는 조직의 AI 목표와 함께 성숙해 가는 지속적인 역량이며, 이 원칙이 더 일찍 확립될수록 이후의 모든 추진 과정은 더욱 빠르게 가속화됩니다.

이를 제대로 구축했을 때의 효과

대부분의 조직은 뒤늦게 한 가지 사실을 깨닫게 됩니다. 제대로 된 데이터 기반을 구축하는 데 들이는 시간은 AI 도입을 지연시키는 것이 아니라, 그 도입이 실제로 어디까지 확장될 수 있는지를 결정한다는 점입니다.

적절하게 거버넌스된 데이터 기반 위에 구축되는 첫 번째 AI 유스케이스는 가장 어렵습니다. 이전에는 존재하지 않았던 인프라를 구축해야 하기 때문입니다. 두 번째 유스케이스는 더 빠르게 진행됩니다. 거버넌스 프레임워크, 통합 패턴, 데이터 품질 기준이 그대로 이어지기 때문입니다. 세 번째는 그보다 더 빠릅니다. 각 프로젝트는 재사용 가능한 구성 요소와 조직 내 축적된 지식의 범위를 넓히며, 이후 모든 이니셔티브의 비용과 일정을 줄여 줍니다. AI를 확장하는 조직과 계속해서 파일럿만 반복하는 조직을 가르는 이러한 복리적 흐름, 즉 플라이휠 효과는 더 나은 모델이나 더 큰 예산에서 나오지 않습니다. 그 아래에 있는 데이터의 품질과 접근성에서 비롯됩니다.

향후 몇 년간 AI 분야에서 앞서 나갈 가능성이 가장 높은 조직은 반드시 현재 가장 진보된 기술을 보유한 조직은 아닙니다. 오히려 지금 눈에 잘 보이지 않는 작업, 즉 확장 단계에서도 견고하게 작동할 데이터 기반을 구축하고 있는 조직입니다. 이들은 데이터 준비도를 단순히 완료해야 할 선행 조건이 아니라, 개발하고 지속적으로 유지해야 할 전략적 역량으로 다루고 있습니다.

Nguyen Sy Tung Anh

Nguyen Sy Tung Anh

Nguyen Sy Tung Anh은 VTI의 리드 데이터 사이언티스트로, AI R&D, 데이터 사이언스, 데이터 기반 디지털 전환을 전문으로 합니다. AI 분야에서 4년간의 경험을 보유하고 있으며, 머신러닝, 컴퓨터 비전, 애널리틱스, 엔터프라이즈 AI 솔루션 개발 전반에 걸쳐 다양한 이니셔티브에 참여하고 이를 이끌어 왔습니다. Tung Anh은 University of Colorado Boulder에서 데이터 사이언스 석사 학위를 취득했으며, DAMA의 CDMP를 포함한 전문 자격을 보유하고 있습니다. 현재 그는 데이터 사이언티스트, 데이터 엔지니어, 데이터 애널리스트로 구성된 12명 규모의 팀을 이끌며, 비즈니스 임팩트 창출을 위한 AI 솔루션의 기술 전략, 연구 실행, 딜리버리를 주도하고 있습니다.

지금 바로 옴니채널 혁신의 첫 걸음을 내디디세요.
일관된 리테일 경험은 단순한 소프트웨어 도입을 넘어서는 과제입니다. VTI는 옴니채널 소프트웨어 솔루션과 E2E 제공 모델을 기반으로, 귀사의 비즈니스 성장에 맞춘 플랫폼 설계–론칭–확장을 보장합니다.