Publications

Detailed Information

효과적인 의학 정보 검색을 위한 대용량 외부 문헌 코퍼스 활용 방법 연구 : Leveraging large external bibliographic database to develop effective medical information retrieval technique

DC Field Value Language
dc.contributor.advisor최진욱-
dc.contributor.author최성빈-
dc.date.accessioned2017-07-14T01:29:04Z-
dc.date.available2017-07-14T01:29:04Z-
dc.date.issued2014-08-
dc.identifier.other000000021551-
dc.identifier.urihttps://hdl.handle.net/10371/122010-
dc.description학위논문 (박사)-- 서울대학교 대학원 : 의학과, 2014. 8. 최진욱.-
dc.description.abstract디지털화된 정보의 축적은 의료 영역에도 많은 변화를 초래하고 있다. 병원의 환자 진료기록을 담은 임상 문서는 전자의무기록 시스템으로 저장되어 축적되고 있으며, 출간되는 의학문헌들은 데이터베이스로 관리되어 인터넷으로 검색 및 활용이 용이해졌다. 하지만 이러한 정보의 폭증은 오히려 찾고자 하는 정보를 검색하기 더 어렵게 만드는 정보의 역설을 낳는다.
이번 연구에서는 효과적인 의학 정보 검색을 위해, 대용량으로 축적되고 있는 의학 문헌 데이터베이스를 의학 정보 검색 질의어 생성에 활용할 수 있는 방법론을 탐구해 보았다. 의학 및 생물학 관련 문헌 데이터베이스인 메드라인은 문헌 별 제목, 초록, 주요 주제어 등 항목들이 구조화된 필드 형태로 정리되어 관리되고 있다. 각 메드라인 문서에 인덱서가 매뉴얼하게 태그한 주요 주제어를 지식이라고 가정한다면, 메드라인 데이터베이스는 각 문서 별 일반 텍스트 단어 집합과 주요 주제어가 상호 링크된 대용량 지식 소스라 생각할 수 있다.
대용량 외부 코퍼스인 메드라인에서 질의어 관련 문헌을 검색하고, 해당 문헌에 태그된 주요 주제어를 추출해 원래 질의어 확장에 사용할 때, 의학 정보 검색에 효과성을 향상시킬 수 있을 것이다. 이번 연구에서는 이러한 지식 기반 질의어 확장 방식을 기존 다른 질의어 확장 기법과 비교해 실험을 수행하고 성능을 평가해 보았다. 또한 메드라인의 필드 구조를 활용하는 가장 효과적인 방법을 찾고자 하였다.
이러한 지식 기반 질의어 확장 방식은, 폭증하는 데이터에 편승해 성능의 효과성 및 안정성을 더욱 높여갈 수 있다. 이번 연구에서는 급증하는 의학 데이터를 확장 질의어 추론 데이터베이스로서 활용해 뚜렷한 성능 향상을 이끌어내는 방법론을 탐색해 보았다.
-
dc.description.tableofcontentsI. 서 론 1
1.1. 연구의 배경 및 필요성 1
1.2. 검색 질의어 확장과 관련된 기존 연구들 14
1.3. 각 테스트 컬렉션 검색 태스크 별 관련 연구들 30
1.4. 연구목적 33
1.5. 연구 범위 33
II. 연구재료 및 방법 35
2.1 연구 재료 35
2.1.1 테스트 컬렉션 및 메드라인 데이터베이스 35
2.1.2 검색 엔진 37
2.2 연구 방법 39
2.2.1 지식 기반 질의어 확장 (Knowledge-based query expansion) 40
2.2.2 통계적 질의어 확장 (Statistical query expansion) 44
2.2.3 어휘 자원을 활용한 질의어 확장 (Query expansion utilizing lexical resource) 45
2.2.4 검색 성능 비교 평가를 위한 Leave-one-out cross validation 46
2.2.5 추가 실험 1 - 지식 기반 질의어 확장 방식에 추가적으로 MeSH 어휘 자원을 활용한 질의어 확장 47
2.2.6 추가 실험 2 - 지식 기반 질의어 확장 방식의 확률론적 전개 및 실험 51
III. 연구결과 53
3.1 ImageCLEFmed 2013 Case-based retrieval task 53
3.2 TREC Medical Records Track 2011 56
3.3 TREC Medical Records Track 2012 59
3.4 추가 실험 1 - 지식 기반 질의어 확장 방식에 추가적으로 MeSH 어휘 자원을 활용한 질의어 확장 62
3.5 추가 실험 2 - 지식 기반 질의어 확장 방식의 확률론적 전개 및 실험 68
IV. 고찰 71
4.1 최적 파라미터 세팅 71
4.2 Target corpus와의 비교 75
4.3 Title 필드와의 비교 75
4.4 이번 연구의 장 단점 및 주요 의미 76
V. 결론 79
참고문헌 81
Abstract 93
-
dc.formatapplication/pdf-
dc.format.extent1236754 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoko-
dc.publisher서울대학교 대학원-
dc.subject의학 정보 검색-
dc.subject질의어 확장-
dc.subjectMeSH-
dc.subject외부 코퍼스-
dc.subject.ddc610-
dc.title효과적인 의학 정보 검색을 위한 대용량 외부 문헌 코퍼스 활용 방법 연구-
dc.title.alternativeLeveraging large external bibliographic database to develop effective medical information retrieval technique-
dc.typeThesis-
dc.contributor.AlternativeAuthorSungbin Choi-
dc.description.degreeDoctor-
dc.citation.pagesvi, 97-
dc.contributor.affiliation의과대학 의학과-
dc.date.awarded2014-08-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share