데이터 구축 가이드라인 작성 기초
Updated:
가이드라인 유형
- 목적 : 수집을 위한 가이드라인, 주석을 위한 가이드라인(필수), 검수를 위한 가이드라인
- 제시 방식 : 문서형, 화면 노출형 튜토리얼형(필수)
가이드라인 구성 요소
- 데이터 구축 목적 정의, 데이터 구축 시 고려 사항, 사용 용어 정의
- 목적을 어느정도 말해주는 것이 데이터 품질이 향상될 수 있지만 날것이 필요한 경우(일상대화 등) 어느정도 숨겨야 한다.
- 수집을 위한 가이드라인 - 데이터 수집 및 정제 작업
- 데이터 정의, 수집 데이터 정제 방식, 수집 도구 및 정제 도구, 수집 시 고려 사항
- 주석을 위한 가이드라인 - 데이터 주석 작업
- 데이터 특성 분류 체계, 데이터 주석 방법 및 절차, 데이터 주석 형식과 정의, 데이터 주석 도구 사용법, 데이터 주석 완류 후 관리방법, 반려 및 통과 기준
- 검수를 위한 가이드라인 - 데이터 검수 및 평가
- 검수 절차 정의, 검수 방식, 평가 지표, 검수 결과 분석법, 검수 결과 반영법
가이드라인 버전 관리
가이드라인은 구축과 검수 과정을 통해 지속적으로 개정되어야 함.
개정 전과 개정 후 어떤 것이 변화하였는지 비교하여 볼 수 있도록 버전 관리가 되는 것이 가장 좋음.
버전별로 작성자와 개정일을 기입해두는 것이 관리에 도움이 됨.
가이드라인 작성 도구
- 구글 독스
- 작업자들에게 배포할 때는 노션(진행상황, 일정 등도 쉽게 기입 가능)
- 워드 및 한글(정부사업)
- 레이블링 에이전시에서 제공하는 도구
- 위키
가이드라인 작성 시 유의 사항
가이드라인 유형별 특성을 이해하고 그에 알맞는 정보를 작성한다.
작업자의 작업 이해도를 고려하여 작성한다.
작업자에게 공개해야 하는 필수 정보와 부가적인 정보가 무엇인지 사전에 고려한다.
가이드라인 구성 요소의 배치를 어떻게 할 지 고민한다.
작업자의 가독성을 고려한다.
Comments