Image classification for internal audit

Internal audit mainly focuses in review of emails and documents. However, unlawful activities can be found not only from work files but also in unstructured data such as personal messages, meeting location pictures, etc. In case of messenger application, usual practice in corporates is by limiting capacity of messenger data to mitigate the risk of saving text messages, which led employees to screenshot to preserve them. As these cases show, corporates are aware of analysis of multimedia files. But due to its nature, selection and search are challenged. This challenge could be resolved with machine deep learning and categorization of multimedia files. Handful academies have been researching on categorization with high accuracy, few digital forensics tools support A.I. based image categorization feature. This session, we will look at how internal audit could categorize large amount of multimedia files and utilize the data, also introduce tools that supported in Korean working environment. 내부감사에서 감사인은 주로 이메일과 문서 파일들을 위주로 검토한다. 하지만 부정과 관련해서 업무적으로 작성한 파일들 외에도 개인적으로 주고받은 메신저 대화 내역, 접대 장소관련 사진 등의 비정형 데이터들에서도 많은 증거를 찾을 수 있다.
메신저의 경우, 많은 기업들이 용량 제한을 두어 메신저 대화내용을 텍스트형태로 저장하지 않게하여, 직원들은 스크린샷 캡처를 통해 일부 보관하기도 하였다.
이와 같이 이미지 파일들에 대한 분석의 필요성은 인지하고 있으나, 이미지 특성상 선별 혹은 검색에 어려움이 있다는 점이 있다. 이러한 문제는 딥러닝을 통한 이미지 분류로 상당부분 해소가 가능했다.
여러 학회에서 이미지 분류에 대한 연구는 매년 활발히 진행되어 높은 정확도를 보이고있으며, 일부 디지털 포렌식 도구에도 딥러닝 기반 이미지 분류 엔진이 탑재되어 사용되고 있다.
이번 발표에서는 대량의 이미지 파일들 중에서 내부감사 측면에서 활용이 가능한 이미지를 선별하고, 활용하는 법에 대해 설명하고, 딥러닝을 통해 국내 업무 환경에 맞게 구현한 선별/분석 도구에 대해 소개한다.