AI는 일상이 되었습니다. 그러나 산업 현장에서 그 잠재력을 완전히 실현하는 일은 여전히 쉽지 않습니다.
특히 보안과 정확성, 운영 안정성이 철저히 요구되는 금융권에서는 AI 기술 도입이 신중할 수밖에 없습니다.
국내 대표 증권사 중 하나인 K증권은 고객 상담 서비스 채널에 스켈터랩스의 생성형 챗봇 플랫폼 AIQ+Chat을 도입하면서, 이 같은 고민의 최전선에 섰습니다.
이번 프로젝트는 단지 ‘AI 기술이 잘 작동하는가’ 하는 문제를 넘어, 금융권의 엄격한 조건 아래서도 고객에게 자연스럽고 정확한 서비스를 제공하는 챗봇이 현실적으로 가능한지를 확인하는 시험대였는데요.
이 글에서는 K증권의 실제 사례를 바탕으로, AIQ+Chat이 금융권의 까다로운 요구사항에 어떻게 부합하도록 기술적으로 설계되었는지, 또 어떤 도전을 극복했는지를 구체적으로 살펴보겠습니다.
정확성과 유연성을 모두 충족하는 이중 구조 설계
K증권의 초기 요구사항은 명확했습니다.
고객의 질문에 무조건 생성형 모델로만 응답하는 구조는 금융권 특성상 적합하지 않습니다. 이유는 간단한데요.
예를 들어, "주식 거래 수수료가 얼마인가요?"와 같이 정확한 수치나 규정에 따라 미리 정해진 답변이 존재하는 경우, 생성형 모델이 굳이 새로운 문장을 생성하는 것은 비효율적이며 오류 가능성을 높이는 일이었기 때문입니다.
이러한 고객의 요구를 수용하기 위해 AIQ+Chat은 질문 유형에 따라 답변 방식을 두 가지로 나누는 이중 구조를 설계했습니다.
이 접근법의 핵심은 '인텐트(의도) 분류' 능력에 있습니다.
AIQ+Chat은 질문의 의도를 정확히 파악해 가장 적절한 답변 방식을 선택하도록 설계되었습니다.
가령 "주식거래 시간 알려줘요"는 미리 정해진 답변을 제공하고, "최근 OO전자 실적은 어떻습니까?"라는 질문은 생성형 접근법으로 더 최신 데이터를 기반으로 답을 생성해 전달하는 방식입니다.
금융권의 엄격한 보안 요구사항 대응
금융권은 기술 도입에 있어 보안 점검이 철저합니다.
프로젝트 과정에서 가장 많은 자원을 투입했던 과제 중 하나가 바로 시스템 구성 요소의 보안 취약점 해결이었죠. K증권의 보안 점검 과정에서 시스템을 구성하는 오픈소스 패키지 및 라이브러리 중 다수의 취약점이 발견되기도 했습니다.
일반적인 웹 서비스라면 비교적 간단한 업데이트와 배포로 해결할 수 있지만, 금융기관의 폐쇄망 환경에서는 이런 과정이 훨씬 복잡합니다. 실제로 AIQ+Chat 도입을 담당한 팀은 시스템에 사용되는 소프트웨어 구성 요소 전체에 대해 반복적인 보안 검사를 수행하며 각 패키지의 취약성을 분석하고 조치해야 했는데요.
예를 들어, 특정 Python 라이브러리에서 취약점이 발견되었을 때, 이 라이브러리의 버전을 무작정 올리기보다는, 해당 업데이트가 다른 서비스 구성 요소와 충돌을 일으키지 않는지를 여러 단계의 테스트와 검증을 거쳐야만 했습니다. 이렇게 모든 구성 요소가 K증권의 폐쇄망 내부로 반입되기 전에 철저히 검증되어야 했기 때문입니다.
이 과정은 단순한 기술 대응의 문제를 넘어, 현장 엔지니어, 개발팀, 인프라 담당자 간의 긴밀한 협력과 빠른 소통을 요구하는 일이었지만 요구사항을 모두 충족시키며 대응하였습니다.
질의 인식률 개선을 위한 데이터 구조 재정립
챗봇의 성능에서 가장 중요한 요소는 단연 사용자의 질문을 정확히 인식하고 분류하는 능력입니다.
초기 운영에서 사용자의 의도를 정확히 이해하지 못해 답변 오류가 자주 발생했으며, 특히 금융 상담의 특성상 유사하지만 미묘한 차이가 있는 질문들이 많았기 때문에 이 문제는 더욱 중요했습니다.
현재 AIQ+Chat은 이러한 중요성을 인지하고 인텐트(Intent) 및 엔티티(Entity) 구조를 새롭게 다듬고 있습니다. 단순히 답변을 기준으로 질문을 분류하는 기존 방식을 넘어, 사용자의 발화에 담긴 실제 의도를 보다 정확히 이해할 수 있도록 접근법을 정교화하고 있습니다.
이를 통해 더 높은 인식률을 달성하고, 최소한의 핵심 예문만으로 학습 데이터를 구성하여 불필요한 혼동을 최소화하는 것을 목표로 하고 있습니다. 또한 엔티티 인식 정확성을 더욱 높이기 위해 추가적인 보완 로직도 논의 중이며, 이러한 개선 사항들은 향후 고객 서비스에 단계적으로 반영될 예정입니다.
금융권 요구 기준 달성
금융권에서 챗봇 서비스는 오류가 발생하거나 중단되었을 때 고객 불만과 직결될 수 있어, 장애나 오류의 허용 기준이 극히 낮습니다.
이러한 이유로 AIQ+Chat 또한 철저한 테스트를 수행했는데요.
이번 프로젝트에서는 초당 100개의 질의(100QPS)를 안정적으로 처리하는 성능 기준을 설정하고 이를 충족하는지 확인하는 성능 테스트를 진행했습니다. 또한, 보다 안정적인 운영을 위한 추가적인 부하 테스트도 별도의 상황에서 병행하여 진행되었습니다.
이 외에도 pod, node, 네트워크 장애와 같은 실제 운영에서 발생할 수 있는 다양한 시나리오를 설정하고 이를 재현하는 테스트를 수행했습니다. 예컨대 특정 pod를 중지시키거나 특정 노드의 네트워크를 차단하는 등의 상황을 실제로 구현하여, 이러한 장애가 발생해도 시스템이 정상적으로 복구되고 운영이 지속될 수 있도록 여러 조건을 철저히 검증했습니다.
이를 통해 AIQ+Chat은 금융권 환경에서도 요구되는 높은 수준의 운영 안정성을 달성하기 위한 기반을 마련했습니다.
마치며
이처럼 AI 기술의 미래는 주어진 조건에 따라 크게 달라질 수 있습니다.
스켈터랩스는 이번 AIQ+Chat K증권 도입 프로젝트를 통해 기술적인 구조뿐만 아니라, 운영 안정성, 장애 대응 능력, 데이터 구조의 재정립을 통해 AI 챗봇이 실제로 고객의 신뢰를 얻을 수 있다는 것을 증명했습니다.
AI 기술을 선제적으로 도입하고, 현실의 문제를 해결하고자 하는 기업들에게 스켈터랩스의 경험과 노하우가 의미 있는 참고가 되기를 기대합니다.
References
황규민 프로젝트 매니저