“외국어 병렬 말뭉치 원천데이터 구축방법 및 이를 실행시키기 위한 프로그램을 기록한 저장 매체(출원번호 10-2022-0060361)”를 지난 2022년 5월에 출원한 것을 비롯해 딥러닝 기반 단문 특화 형태소 분석기 및 말하기 자동 평가를 위한 모델 구축 방안 등 2건의 특허 출원을 진행 중입니다.
보유자원
K-Fashion Data
이미지 검색 및 아이템 추천, 의류 속성 정보 자통 태깅 목적의 패션 관련 이미지 120만장
다국어 WordNet
자연어 처리를 위한 각국의 단어 데이터 (한국어, 영어, 중국어, 일본어) 189만개
한영혼합인식 Data
음성 인식을 위한 한영 혼합 음성 인식 모델 응용 오디오 및 텍스트 52,646건(9,746시간)
한영/한중 발화 Data
음성 인식 및 기계 번역을 위한 용도의 오디오 및 텍스트 18,014건(5,000시간) 분량
교육용 한국인 다국어 음성 Data
인공지능 기반 발음 및 말하기 평가 모델용으로 교육용 한국인의 발화음성 오디오 데이터 1,000시간(1천명)
자연어 이해 및 생성 능력 검증 Data
인식 후 처리를 통해 자동 맞춤법 교정에 이용 가능한 교정 검증용 병렬데이터 100만건, 교정 데이터 20만건
의류통합 Data
(착용이미지,치수,원단)
가상 피팅, 의류 또는 원단 폐기시 분류 처리를 위한 패션 이미지 50만장, 의류 이미지 10만종
패션 엑세서리 착용Data
액세서리 가상 피팅을 위한 서비스 활용 가능한 제품 이미지 40만장, 액세서리 500종, 착용자(모델) 200명
연도별 패션 선호도 파악 및 추천 Data
의류 추천 시스템 및 패션 트렌드 파악에 이용 가능한 제품 이미지 10만종, 참여자 5천명 정보, 응답 25만건
쉐이프리스 의류 및
포즈 Data
가상 피팅, AR, VR 영상 포즈 예측 및 쉐이프리스 의류 생성 모델용 의류 5000개 이상, 포즈 20종 이상, 40만장
의류 디자인 패션 Data
의상 디자인에 필요한 무늬와 패턴 생성 모델용 의류 카테고리 5종 1000장 이상 정면사진, 100명 모델의 50가지 옷 착용샷 40만장
객체간 관계성 인지용 한국형 비전 Data
이미지에서 캡션 및 관계 그래프 생성시 필요한 이미지 300만장, 관계 그래프 300만건 이상 보유
낚시성 기사 탐지 Data
낚시성 기사 자동 탐지 및 비교 분류시 이용 가능한 30만건의 낚시성 또는 비낚시성 기사 자료 보유
한국어 글쓰기 평가용
학습 Data (보유예정)
교육분야 글쓰기 자동평가 및 텍스트 자동평가 모델용 문장 30만개, 관련 전문가 입력 메타 정보
맞춤법 교정 형태분석 말뭉치Data(보유예정)
단문/ 구어체 형태소 분석 및 딥러닝 기반 형태소 분석기를 위한 어절 100만개
전문 분야 개체명 태깅 Data (보유예정)
개체명 인식(Named Entity) 작업시 필요한 개체명을 포함한 문장 (인명,분야 포함)10만개