표준화 참여안내

TTA의 표준현황

> 표준화 개요 > TTA의 표준현황

표준번호 TTAK.KO-10.1098 구표준번호
재개정일 2018-12-19 00:00:00.0 총페이지 28
한글표준명 오픈 도메인 자연어 질의 응답을 위한 질문 분석 메타데이터
영문표준명 Metadata for Question Analysis for Open-domain Question Answering
한글내용요약 본 표준에서는 오픈 도메인 질의 응답을 위한 질문 분석을 통해 정형화되는 다양한 정보들과 메타데이터 구조를 표준화하고, 개별 정보에 대한 인식 지침을 정립하고자 한다.

질문의 의미를 정형화하기 위한 주요 정보는 아래와 같다.

a) 입력된 자연어 질문과 언어 분석된 질문 결과를 저장하는 질문 분석 기본 정보
b) 복합 질문(complex question)을 최소 단위의 질문으로 분할하고, 분할 질문 간의 관계성을 정형화하는 질문 분할 정보
c) 질문 별로 다양한 정답 전략 수립을 목적으로 다각적인 관점에 따라 질문을 분류하는 질문 분류 정보
d) 질문 분석을 위한 중요한 단서인 의문사 정보에 기반한 질문 유형 분류 정보
e) 자연어 질문에서 정답을 지칭하는 부분과 연관된 질문 초점 정보
f) 질문에서 찾고자 하는 정답의 의미적인 유형을 제약하는 정답 유형 정보
g) 질문의 대상이 되는 주요한 개체를 인식하는 질문 토픽 정보
h) 정답을 제약하는 질문 내 단서들은 인식하는 정답 제약 정보

본 표준에서는 위의 언급된 주요 정보를 기반으로 질문의 의미를 정형화하는 JSON 형식의 메타데이터와 메타데이터의 값을 자연어 질문으로부터 인식하기 위한 기준을 정립한다.
영문내용요약 The standard defines the different information elements and metadata structures which are formalized by the question analysis for open-domain question answering systems and provides the information recognition guidelines for each element.

The major information elements to formalize the meaning of the questions are as follows:
a) The basic question analysis information which stores the input question in natural language and the results of the analyzed question
b) Question decomposition information that decomposes the complex question into questions of minimum units and formalizes the relation between the decomposed questions.
c) Question classification information based on multiple perspectives to establish the various answering strategies for each question.
d) Information on the classification of question types based on WH-question words, which is an important clue for question analysis.
e) Question focus information related to the part of the natural language question that indicates the correct answer
f) Answers type information that limits the semantic type of the correct answers searched.
g) Question topic information that identifies the entity for the object of the question.
h) Answer constraining information that recognizes the clues that constrain correct answers.
The standard defines the metadata in JSON format that formalizes the question meaning based on the major information elements defined above for the question analysis and establishes the criteria for recognizing the values of the metadata from the natural language questions.
국제표준
관련파일 TTAK.KO-10.1098.pdf TTAK.KO-10.1098.pdf            

이전
3GPP - Services and System Aspects; Uplink Streaming (Release15)
다음
3GPP - Services and System Aspects; Transparent end-to-end packet switched streaming service (PSS); 3GPP file format (3GP) (Release15)