선파이낸스, AWS를 활용해 생성형 AI로 ID 추출 및 사기 탐지 자동화
Sun Finance automates ID extraction and fraud detection with generative AI on AWS
핵심 요약
- ▸아마존 베드로크, 텍스트, 리코그니션을 활용해 AI 기반 신분 확인 파이프라인 구축
- ▸추출 정확도는 79.7%에서 90.8%로 향상되고, 처리 시간은 최대 20시간에서 5초 이하로 단축
- ▸서버리스 사기 탐지 시스템을 설계하는 방법과 벡터 유사도 검색 기술에 대해 배움
- ▸개발자에게는 AI 기반의 효율적인 ID 검증 및 사기 탐지 시스템 구축 방법을 제공함
심층 분석
Sun Finance가 구축한 신원 확인(IDV) 파이프라인은 단일 AI 모델로 모든 것을 해결하려 하지 않고, 각 단계별로 특화된 도구를 조합한 점이 핵심이다. 먼저 Amazon Textract가 신분증 이미지에서 텍스트를 OCR로 추출하는 1차 작업을 담당하는데, Textract는 표·필드·서명 등 문서 구조 인식에 최적화된 전용 OCR 서비스다. 이렇게 추출된 원시 텍스트를 Amazon Bedrock의 LLM에게 넘겨 "이름은 X, 생년월일은 Y, 발급일은 Z" 형태의 구조화된 JSON으로 정규화시킨다. 사기 탐지 단계에서는 Amazon Rekognition으로 얼굴 임베딩 벡터를 생성한 뒤, 벡터 유사도 검색(vector similarity search)으로 동일 인물이 여러 신분증으로 가입을 시도하는 패턴을 찾아낸다. 이 모든 과정이 Lambda·Step Functions 기반 서버리스 아키텍처 위에서 동작하므로, 트래픽이 몰릴 때만 비용이 발생하고 운영 부담이 거의 없다.
엔지니어 입장에서 가장 주목할 지표는 "추출 정확도 79.7% → 90.8%"이다. LLM 단독으로 이미지를 처리했을 때보다, OCR이 먼저 텍스트를 뽑고 LLM이 구조화하는 2단계 파이프라인이 더 좋은 결과를 냈다는 의미다. 이는 멀티모달 LLM이 이미지를 직접 읽는 방식이 만능이 아니며, 도메인 특화 전처리기와 LLM을 결합하는 것이 여전히 강력하다는 실증 사례다. 또한 처리 시간을 최대 20시간에서 5초 미만으로 줄이고 문서당 비용을 91% 절감했다는 점은, 사람이 수동으로 검토하던 백오피스 업무를 AI 파이프라인으로 대체할 때 얻을 수 있는 ROI의 전형을 보여준다. 한국의 핀테크·중고거래·렌탈 업계에서도 KYC/eKYC가 필수가 된 만큼, 이 아키텍처 패턴은 거의 그대로 차용 가능하다.
개발자가 실무에 적용하려면 몇 가지를 짚어볼 만하다. 첫째, "OCR + LLM 구조화" 패턴은 Textract뿐 아니라 국내 환경에서는 네이버 클로바 OCR, 카카오 OCR, 또는 오픈소스 PaddleOCR과 Bedrock/Claude API를 조합하는 식으로 응용할 수 있다. 둘째, 얼굴 벡터를 저장하고 유사도 검색을 하려면 OpenSearch, pgvector, Pinecone 같은 벡터 DB가 필요하며, 임계값(threshold) 튜닝과 false positive 관리가 운영의 핵심 난제가 된다. 셋째, 신분증·얼굴 같은 민감정보를 다룰 때는 개인정보보호법과 신용정보법에 따른 암호화 저장, 보관 기간 제한, 마스킹 처리가 필수이므로 PoC 단계부터 데이터 거버넌스를 설계에 포함해야 한다. 마지막으로, LLM 출력이 JSON 스키마를 어기는 사례를 막기 위해 Bedrock의 구조화 출력 기능이나 Pydantic·Zod 기반 검증 레이어를 두고, 검증 실패 시 사람 리뷰로 폴백하는 휴먼-인-더-루프(HITL) 경로를 반드시 설계해 두는 것이 좋다.
관련 기사
업무 중 ai에 물어본 영어가 나만의 퀴즈가 된다면 lingoq
Naver CLOVA Tech Blog ·
PwC는 클라우드를 도입해 기술 개발 및 거래 실행을 통해 기업 기능을 혁신하고 있다
Anthropic News ·
블랙스톤, 헬먼 앤드 프리드먼, 골드만삭스와 함께 새로운 기업 AI 서비스 회사 설립
Anthropic News ·
GITEX AI 유럽
AI Business · 방금 전
5개 실험실, 5개의 사고: 소형 모델을 기반으로 한 다중 모델 금융 드라마 구축
HuggingFace Blog · 2026년 6월 7일 AM 04:02