데이터 구축 가이드라인 작성 기초

Updated:

가이드라인 유형

  • 목적 : 수집을 위한 가이드라인, 주석을 위한 가이드라인(필수), 검수를 위한 가이드라인
  • 제시 방식 : 문서형, 화면 노출형 튜토리얼형(필수)

가이드라인 구성 요소

  • 데이터 구축 목적 정의, 데이터 구축 시 고려 사항, 사용 용어 정의
    • 목적을 어느정도 말해주는 것이 데이터 품질이 향상될 수 있지만 날것이 필요한 경우(일상대화 등) 어느정도 숨겨야 한다.
  • 수집을 위한 가이드라인 - 데이터 수집 및 정제 작업
    • 데이터 정의, 수집 데이터 정제 방식, 수집 도구 및 정제 도구, 수집 시 고려 사항
  • 주석을 위한 가이드라인 - 데이터 주석 작업
    • 데이터 특성 분류 체계, 데이터 주석 방법 및 절차, 데이터 주석 형식과 정의, 데이터 주석 도구 사용법, 데이터 주석 완류 후 관리방법, 반려 및 통과 기준
  • 검수를 위한 가이드라인 - 데이터 검수 및 평가
    • 검수 절차 정의, 검수 방식, 평가 지표, 검수 결과 분석법, 검수 결과 반영법

가이드라인 버전 관리

가이드라인은 구축과 검수 과정을 통해 지속적으로 개정되어야 함.

개정 전과 개정 후 어떤 것이 변화하였는지 비교하여 볼 수 있도록 버전 관리가 되는 것이 가장 좋음.

버전별로 작성자와 개정일을 기입해두는 것이 관리에 도움이 됨.

가이드라인 작성 도구

  • 구글 독스
  • 작업자들에게 배포할 때는 노션(진행상황, 일정 등도 쉽게 기입 가능)
  • 워드 및 한글(정부사업)
  • 레이블링 에이전시에서 제공하는 도구
  • 위키

가이드라인 작성 시 유의 사항

가이드라인 유형별 특성을 이해하고 그에 알맞는 정보를 작성한다.

작업자의 작업 이해도를 고려하여 작성한다.

작업자에게 공개해야 하는 필수 정보와 부가적인 정보가 무엇인지 사전에 고려한다.

가이드라인 구성 요소의 배치를 어떻게 할 지 고민한다.

작업자의 가독성을 고려한다.

Comments