파수(대표 조규곤)는 최신 AI 기술을 기반으로 비정형 데이터 내 개인정보를 검출 및 마스킹할 수 있는 신규 솔루션 '파수 AI 레이더'를 공개했다. 파수의 개인정보관리 노하우가 집대성된 파수 AIR는 텍스트, 이미지, 영상 등에 포함된 다양한 개인정보를 AI 기반으로 탐지해, 최근 사회적 문제로 떠오른 개인정보 유출을 방지하고 관련 컴플라이언스 준수하도록 돕는다.
최근 개인정보 유출 사고가 급증하고 피해도 커지자 관련 규제 또한 점차 강화되는 추세다. 여기에 기존 솔루션으로는 자동화된 탐지가 쉽지 않은 일반 문서나 이미지, 영상, 오디오 파일 등의 비정형 데이터가 급증함에 따라, 기업 및 기관은 개인정보 관리에 어려움이 커졌다. 이에 파수는 AI 기반의 자연어처리(NLP)와 광학문자인식(OCR) 기술을 사용한 파수 AIR를 개발, 문맥을 파악해 개인정보를 검출한다.
파수 AIR는 높은 정확도의 트랜스포머 기술 기반 언어 모델을 사용했으며, 특히 개인정보보호 분야를 이끌어 온 파수의 노하우가 접목돼 검출 정확성이 뛰어나다. 파수는 국내 최초의 개인정보 비식별화 솔루션 ‘애널리틱디아이디(ADID)’와 다양한 산업에서 활용되는 데이터 식별·분류 솔루션 ‘파수 데이터 레이더(FDR)’ 등을 통해 개인정보관리 인사이트를 축적해 왔다. 이를 바탕으로 개인정보에 특화된 트레이닝 방법과 데이터셋을 파수 AIR에 적용, 개인정보 벤치마크 데이터셋에서 자연어 처리 기준으로 93% 이상의 검출 정확성을 기록했다.
파수AIR는 비정형 데이터 내의 이름, 주민등록번호, 키, 몸무게, 상호, 계좌 및 카드 번호, 주소 등 15가지 개인정보 유형을 검출해 마스킹할 수 있다. 주소가 포함된 데이터의 경우 행정구역 체계를 광역시도, 시군구, 동읍면리, 상세주소 등으로 단계를 구분해 탐지하며, 키나 몸무게를 기타 길이나 무게와 구분하는 등 까다로운 문장 속에서도 높은 인지 정확도를 보여준다.
또한 파수 AIR은 다양한 형태의 API를 제공해 사용이 편리하며, 마스킹 결과에 대한 사용자의 피드백도 반영할 수 있다. 데이터 특성에 따라 AI 및 패턴 매칭 기법 또한 유연하게 적용 가능하다.
조규곤 대표는 “개인정보보호는 선택이 아닌 필수 사항이 됐지만 비정형 텍스트나 이미지, 영상 등에 포함된 민감정보의 검출은 매우 까다로워 기업 및 기관이 큰 어려움을 겪고 있다”며 “개인정보보호 분야를 이끌어 온 파수가 선보인 파수 AIR는 개인정보에 최적화된 AI를 탑재한 가장 진보한 개인정보 탐지 솔루션으로, 향후 기존 솔루션과의 연동 확대 및 고도화 등을 통해 고객의 개인정보 보호 고민을 적극적으로 해결해 나갈 것”이라고 말했다.