표준화 참여안내

TTA의 표준현황

> 표준화 개요 > TTA의 표준현황

표준번호 TTAK.KO-11.0010/R1 구표준번호
제개정일 2015-06-23 총페이지 83
한글표준명 형태소 태깅 말뭉치 작성용 품사 태그세트
영문표준명 Part-of-Speech Tag Set for Morphological Annotation of Written Texts
한글내용요약 1999년 표준 태그 세트는 일반적으로 많이 사용되는 형태소 품사 위주로 작성되었다. 하지만, 최근에는 구문 분석이나 의미역 인식 등의 상위 수준의 언어 분석에 대한 수요가 늘어나면서 형태소 품사에 대한 세분화 요구가 늘어나고 있다. 그러므로, 본 표준에서는 1999년 표준 태그 세트보다 조사, 어미, 기호 등을 세분화해서 정리하였다. 본 표준은 14개 기관에서 사용하는 태그 세트의 비교 과정을 거쳤다[1-10]. 1999년에 제정된 기존 표준 태그 세트는 27개 품사로 구성된 반면, 본 표준은 47개 품사로 세분화되었다.
영문내용요약 The original version of 1999 mainly defines the part of speech tag set used for general purpose. The needs for more detailed categorization of part of speech tags are increasing recently as the syntactic and semantic analysis are required for a high-level language analysis. Therefore, the proposed standard provides more detailed sub-categorization of auxiliaries, word endings, and symbols by revision of the original version of the part of speech tag set.
To achieve interoperability with the existing tag sets, the proposed tag set was produced by comparing with other 14 different tag sets [1-10].
While the original standard tag set established in 1999 consists of 27 speech tags, the proposed standard tag set in this document extends to 47 tags.
국제표준
관련파일 TTAK.KO-11.0010_R1_[1].pdf TTAK.KO-11.0010_R1_[1].pdf            

이전
통합경보시스템을 위한 공통경보프로토콜 프로파일
다음