Publications

Detailed Information

Fusion models for news quality prediction : 뉴스 품질 예측을 위한 혼합 모형 : 텍스트 자질과 문장 임베딩
Combining textual features with sentence embeddings

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

박수지

Advisor
신효필
Issue Date
2021
Publisher
서울대학교 대학원
Keywords
Computational linguisticsSentence embeddingsnews quality predictionfusion modelsSBERT컴퓨터언어학문장 임베딩뉴스 품질 예측혼합 모형
Description
학위논문(박사) -- 서울대학교대학원 : 인문대학 언어학과, 2021.8. 박수지.
Abstract
이 논문의 목표는 한국어 기사 품질을 예측하기 위한 언어 모형을 개발하는 것이다. 기사 품질 예측 과제는 최근 가짜뉴스 등의 범람으로 그 필요성이 대두되면서도 자연언어처리의 최신 기법이 아직 적용되지 못하는 실정에 있다. 이 논문에서는 이러한 한계를 극복하기 위해 문장의 의미를 표상하는 SBERT 모형을 개발하고, 기사의 언어학적 자질을 활용하여 품질 분류의 성능을 높일 수 있는지를 검토하고자 한다. 그 결과 기사의 가독성, 응집성 등의 텍스트 자질을 사용한 기계학습 모형과 SBERT에서 자동으로 추출된 문맥 자질을 사용한 전이학습 모형이 모두 선행연구의 심층학습 결과보다 높은 성능을 보였고, 구체적으로는 SBERT 학습시 훈련 데이터를 확장하고 정제할 때, 그리고 텍스트 자질과 문맥 자질을 함께 사용할 때 성능이 더욱 향상되는 것을 관측하였다. 이를 통해 기사의 품질에서 언어학적 자질이 중요한 역할을 하며 자연언어처리의 최신 기법인 SBERT가 언어학적 자질을 추출하고 활용하는 데 실질적으로 기여할 수 있다는 결론을 내릴 수 있다.
Language
kor
URI
https://hdl.handle.net/10371/177766

https://dcollection.snu.ac.kr/common/orgView/000000167845
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share