규칙 기반 관계형 데이터 생성기 설계 및 구현
Design and Implementation of a Rule-based Relational Data Generator

초록

오늘날 핵심 비즈니스 데이터는 관계형 데이터베이스에 저장되어 운영된다. 소프트웨어 개발 초기에는 소량의데이터를 기반으로 개발이 이루어지기 때문에 실제 환경의 복잡한 비즈니스 규칙과 패턴을 반영하지 못해 생산성 저하와품질 문제가 발생한다. 이를 해결하기 위해 표 형식의 합성 데이터 생성에 관한 연구가 활발히 진행되고 있으나, 생성된데이터를 관계형 데이터베이스에 적재하는 과정에서는 무결성 검증, 데이터 타입 변환, 참조 무결성 관계 생성 등 많은기술적 노력과 시간이 요구된다. 본 논문에서는 이러한 문제를 해결하기 위해 코딩 없이 데이터 모델을 기반으로 데이터생성 규칙을 정의하고, 이를 통해 실제 데이터와 유사한 특성을 가진 대용량 데이터를 생성하여 관계형 데이터베이스에직접 적재하는 웹 인터페이스 기반의 데이터 생성 도구 ‘DataGen’을 제안한다. TPC-E 벤치마크 기반으로 실험한 결과, 동일한 실행 계획과 9% 이내의 실행 비용 편차를 보였고, 젠슨-섀넌 발산과 바서슈타인 거리로 측정한 결과 데이터분포 유사성 또한 높게 나타나 제안 도구의 유효성을 시사한다.

키워드

Data GeneratorTabular DataRelational DatabaseRule-Based GenerationTPC-E
제목
규칙 기반 관계형 데이터 생성기 설계 및 구현
제목 (타언어)
Design and Implementation of a Rule-based Relational Data Generator
저자
장석주김명호
DOI
10.5762/KAIS.2025.26.6.820
발행일
2025-06
저널명
한국산학기술학회논문지
26
6
페이지
820 ~ 831