, ,

한국어 개체명 인식방법 및 장치 (named-entity recognition method and apparatus for korean)

8,050,000

판매 대리인 : 기율특허

전화번호 : 02-782-1004

메일주소 : kiyul@kiyul.co.kr

영문 원어  : According to the present invention, a Korean object name recognizing method comprises: a first step of receiving a text in Korean, dividing the same into syllable bigrams, adding a mark for a syllable bigram positioned in an anlaut of a word among the syllable bigrams for the text in Korean, generating embedding corresponding to the syllable bigrams for the text in Korean, and recording each of the syllable bigrams for the text in Korean and the embedding corresponding to each syllable bigram in a look-up table of a database; and a second step of dividing a question sentence into syllable bigrams when the question sentence is inputted, adding a mark for a syllable bigram positioned in an anlaut of a word among the syllable bigrams for the question sentence, and recognizing an object name by reading embedding corresponding to the syllable bigrams for the question sentence from the look-up table. The present invention can increase an object name recognizing rate.

SKU: 서강대학교 산학협력단 카테고리: , ,

출원번호 : 10-2017-0134970 (2017-10-18)

등록번호 : 10-1941692 (2019-01-17)

특허권자 : 서강대학교 산학협력단

요약 : 본 발명에 따르는 한국어 개체명 인식방법은, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하고, 한국어 로 텍스트에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 한국어 로 텍스트에 대한 음절 바이그램들에 대응되는 임베딩을 생성하고, 상기 한국어 로 텍스트에 대한 음절 바이그램들 각각과 그에 대응되는 임베딩을 데이터베이스의 룩업테이블에 기록하는 제1단계; 및 질의문장이 입력되면, 질의문장을 음절 바이그램들로 분할하고, 상기 질의 문장에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 질의 문장에 대한 음절 바이그램들에 대응되는 임베딩을 상기 룩업테이블로부터 독출하여 개체명 인식을 이행하는 제2단계;를 포함하는 것을 특징으로 한다.

kr00001941692b1p