표준화 참여안내

TTA의 표준현황

> 표준화 개요 > TTA의 표준현황

표준번호 TTAK.KO-10.1337-Part2 구표준번호
제개정일 2021-12-08 총페이지 29
한글표준명 빅데이터 유통 플랫폼을 위한 프레임워크 – 제2부: 분류체계 기반 데이터셋 탐색 기능
영문표준명 Procedure for Semantic-based Big Data Profiling
한글내용요약 서로 다른 분류 체계를 쓰는 빅데이터 유통 플랫폼 환경에서는 각 플랫폼 간 데이터셋 활용이 어렵다는 문제점이 있다. 이 표준에서는 이를 해결하기 위해 빅데이터 분류 체계 기반 데이터셋 탐색 방안과 기능들을 정의한다.
먼저 빅데이터 분류 체계를 쓰는 플랫폼에서 활용하고 있는 데이터셋으로부터 의미태그를 생성한다. 이 의미태그는 해당 빅데이터 분류 체계의 중분류가 가진 의미를 기준으로 생성된다. 그리고 다른 분류 체계를 쓰는 이기종의 플랫폼은 보유한 데이터셋에서 자신의 분류 체계 중분류의 의미를 기준으로 의미태그를 추출한다. 다음으로 이 둘의 의미태그 매핑을 한다. 이기종 플랫폼의 의미태그와 빅데이터 분류 체계의 플랫폼의 의미 태그 간의 거리를 측정하고, 의미의 유사성 계산을 통하여 유사한 의미태그 데이터셋을 탐색할 수 있다. 이 표준을 통하여 구현한 빅데이터 분류 체계 기반의 데이터셋 탐색 기능은 수요자에게 자기 플랫폼에 존재하는 데이터셋뿐만 아니라 이종의 플랫폼이 보유하고 있는 데이터셋의 정보를 빅데이터 분류 체계의 중분류 수준에서 탐색할 수 있게 한다.
영문내용요약 It is difficult to use data sets between each platform in the environment of big data distribution platforms that use different classification systems. This standard defines data sets search methods and functions based on the Big Data taxonomy.
First, it generates meaning tags from the data sets that are being used in platforms of big data classification systems. Also heterogeneous platforms that use different classification systems extract semantic tags based on the meaning of their classification systems from their data sets. Next, we map the semantic tags of these two. The distance between semantic tags of heterogeneous platforms and semantic tags of platforms in big data classification systems can be measured, and similar semantic tag can be explored through similarity calculations of meanings.
국제표준
관련파일 TTAK.KO-10.1337-Part2.pdf TTAK.KO-10.1337-Part2.pdf            

이전
다음