Publications

Detailed Information

웹 크롤링(Web Crawling)에 관한 연구 : A Study on Web Crwaling: Foucsed on its working mechanism and legal responsibility
그 원리와 법적 책임에 관하여

DC Field Value Language
dc.contributor.advisor이상원-
dc.contributor.author김태균-
dc.date.accessioned2023-06-29T02:26:31Z-
dc.date.available2023-06-29T02:26:31Z-
dc.date.issued2023-
dc.identifier.other000000174302-
dc.identifier.urihttps://hdl.handle.net/10371/194073-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000174302ko_KR
dc.description학위논문(석사) -- 서울대학교대학원 : 융합과학기술대학원 수리정보과학과, 2023. 2. 이상원.-
dc.description.abstract웹 크롤링은 크롤러 또는 스파이더라는 프로그램을 사용하여 웹 데이터를 수집하는 방법을 의미한다. 크롤러의 기본적 원리는 주어진 시드 URL에서 출발하여 그 URL과 연결된 웹 페이지를 다운로드하고, 여기에 포함된 하이퍼링크를 추출하고, 이러한 하이퍼링크로 식별되는 웹 페이지를 재귀적으로 계속 다운로드하는 것이다. 웹 크롤링은 이제 데이터가 핵심 요소가 되는 모든 곳에서 데이터를 수집하는 가장 효과적이고 유용한 방법 중 하나로 널리 사용되고 있다. 특히 빅데이터 또는 인공지능의 등장으로 인하여, 마케팅 또는 비즈니스 전략에 있어 경영 판단 또는 의사 결정 과정에서 웹 크롤링은 이제 필수 불가결한 것이 되었다.
웹 크롤링이 점점 중요해지고 있지만 이를 사용하는 것의 법적 책임에 대한 연구는 거의 없었다. 이 논문은 웹 크롤러의 작동 메커니즘과 그것을 사용한 행위의 법적 책임을 중심으로 검토한다. 최근 대법원은 피고인들이 숙박정보제공업체의 직원이 경쟁업체의 모바일 애플리케이션 서버에 접속해 자신의 크롤링 프로그램을 통해 숙박시설 목록 등 데이터베이스를 복사한 사건에서 피고인들을 무죄로 판단한 바 있다. 그 판결은 ①서비스 제공자가 네트워크에 대한 접근권한을 제한하는지 여부는 보호조치나 이용약관 등의 대상에 의하여 결정되어야 하며, ②데이터베이스의 상당 부분은 양과 질 모두를 기초로 판단하여야 한다고 하였다. 이 같은 법리에 기초하여 정보통신망침입, 데이터베이스 도용으로 인한 저작권법위반, 업무방해 혐의 모두에 대해서는 무죄를 선고하였다. 이것은 크롤링을 통한 데이터 수집에 대한 최초의 대법원 판결이다.
이 글에서는 위 대법원 판결을 기초로 3가지 측면 즉 정보통신망침입, 데이터베이스 도용으로 인한 저작권법위반, 형법상 업무방해에 대해 구체적으로 검토하고, 그 외 부정경쟁방지법, 개인정보보호법 기타 경쟁법적 측면에서도 검토한다. 그 결론은 다음과 같다. 웹 크롤러 사용의 법적 책임은 정보통신망 접근 범위, 데이터베이스제작자 권리 침해 여부 그리고 장애업무방해 여부를 기준으로 판단되어야 하는데, 그와 같은 법률적 평가는 웹 크롤러가 사용되는 상황, 사용자의 의도 그리고 사용으로 인하여 발생한 결과와 같은 사정을 기반으로 하여야 한다.
-
dc.description.abstractWeb Crawling means a way of collecting web data using a program which is called Crawler or Spider. A Crawler, given seed URLs, downloads the web pages associated with these URLs, extracts hyperlinks contained in them, and recursively continues to download the web pages identified by these hyperlinks. Web Crawling is now broadly being used as one of the most effective and useful method in data collecting wherever data becomes a key factor. Especially in decision-making process in marketing or business strategy, Web Crawling is now sine qua non with the emerging of big data or artificial intelligence.
While Web Crawling is getting more and more important, few studies on legal responsibilities of using it can be found. This article focuses on the working mechanism and legal responsibilities of using Web Crawler. Recently the Supreme Court has found, in the case where the defendants, the employees of a company running a accommodation information offering service accessed the competiters mobile application server and copied the database such as a list of accommodation through their crawling computer program, that the defendants are not guilty. The Case showed new legal principles, ① whether the service provider has set any limitation on access right to network should be determined by object things such as protective actions or terms and conditions of use, ② significant copy of database should be determined in the aspects of quantity and quality both. And The Case sentenced not guilty to the charges(invasion of network, piracy of database and obstruction of business). The Case was the first judgement of the Supreme Court on crawling data collection.
In this article, The Case will be examined thoroughly in the 3 aspects(invasion of network, piracy of database, obstruction of business) including Unfair Competition Prevention Act and competition laws. The conclusion of this article is as follows. Legal responsibilities for using web crawlers should be judged by the standards of the scope of access to networks, whether the rights of database producers are violated and whether there is any obstruction of business, which must be based on the circumstances where web crawlers are used, the intetion of the user and the result of the use.
-
dc.description.tableofcontentsⅠ. 서론 1
1. 문제의식 1
2. 연구의 내용과 방법 3
3. 일러두기 5
가. 이 글의 화자로서 나 6
나. 인더스트리4.0(Industrie4.0) 7

Ⅱ. 웹 크롤링(Web Crawling) 10
1. 도입 10
2. 웹 크롤링의 개요 11
가. 웹 크롤링과 콘텐츠 수집 11
나. 용어의 정리 12
다. 웹 크롤링의 역사 16
3. 웹 크롤링의 기술적 원리 18
가. 웹과 웹 크롤링 18
나. 웹 크롤링의 작동 원리 19
다. 크롤링 정책(Crawling policies) 22
1) 정중함 정책(politeness policy) 23
2) 재방문 정책(re-visit policy) 25
3) 선택 정책(selection policy) 27
4) 병렬화 정책(parallelization policy) 28
라. 웹 크롤러의 유형 29
4. 웹 크롤링 방지 기술 30
가. 로봇 배제 프로토콜(robot exclusion protocol, robot.txt) 31
나. 메타태그(metatag) 33
다. 캡차(CAPTCHA) 34
5. 소결 35

Ⅲ. 웹 크롤링 사용의 형사법적 책임 37
1. 도입 37
가. 가치의 충돌 37
나. 대법원 2022. 5. 12. 선고 2021도1533 판결 39
1) 공소사실의 요지 42
2) 제1심의 판단 45
3) 항소심의 판단 48
2. 정보통신망 침입 51
가. 정보통신망법상 정보통신망침입죄 51
나. 접근권한 유무의 판단기준 - 객관적으로 드러난 사정 52
1) 객관적 상황 53
2) 이용약관 54
3) 보호조치 56
다. 미국의 CFAA 59
1) 보호법익 61
2) 접근(access) 62
3) 권한(authority) 62
4) CFAA 관련 사례 64
라. 유럽연합의 사이버범죄협약(Convention on Cybercrime) 70
3. 데이터베이스제작자의 권리 침해 73
가. 저작권법상 데이터베이스와 데이터베이스제작자의 권리 73
1) 데이터베이스 73
2) 데이터베이스제작자의 권리 76
나. 데이터베이스제작자 권리 침해의 판단기준 78
1) 데이터베이스제작자의 권리 침해 여부에 관한 민사사례 80
2) 데이터베이스제작자의 권리 침해 여부에 관한 형사사례 83
다. 데이터베이스제작자의 권리 침해와 웹 크롤링 88
4 컴퓨터등장애업무방해 89
가. 컴퓨터등장애업무방해죄 89
1) 허위의 정보 또는 부정한 명령 89
2) 정보처리에 장애 발생 91
나. 컴퓨터등장애업무방해와 웹 크롤링 92
1) 부정한 명령인지 여부 92
2) 정보처리에 장애 발생 여부 93
5. 소결 94

Ⅳ. 웹 크롤링 사용의 기타 법적 책임 98
1. 도입 98
2. 부정경쟁방지 및 영업비밀보호에 관한 법률상 책임 98
가. 부정경쟁행위로서 성과물의 부정차용 99
나. 부정경쟁행위로서 데이터 부정사용 101
다. 서울고등법원 2022. 8. 25. 선고 2021나2034740 판결 103
라. 데이터 부정사용 또는 성과물의 부정차용과 웹 크롤링 105
3. 독점규제 및 공정거래에 관한 법률상 책임 107
가. 웹 크롤링에 대한 경쟁법의 평가 107
나. 불공정거래행위 또는 시장지배적지위 남용과 웹 크롤링 108
4. 소결 111

Ⅴ. 결론 112

- 참고문헌 - 117

[Astract] 122


표 1 robot.txt의 사용예시 32
표 2 메타태그 예시 34


그림 1 분산형 크롤러의 작동 원리 20
그림 2 robot.txt의 적용/미적용 알고리즘 31
-
dc.format.extent123-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subject웹 크롤링-
dc.subject웹 크롤러-
dc.subject데이터-
dc.subject데이터 수집-
dc.subject정보통신망침입-
dc.subject데이터베이스제작자의 권리침해-
dc.subject업무방해-
dc.subject부정경쟁행위-
dc.subject불공정거래행위-
dc.subject시장지배적지위 남용-
dc.subject.ddc510.285-
dc.title웹 크롤링(Web Crawling)에 관한 연구-
dc.title.alternativeA Study on Web Crwaling: Foucsed on its working mechanism and legal responsibility-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorKim Taekyun-
dc.contributor.department융합과학기술대학원 수리정보과학과-
dc.description.degree석사-
dc.date.awarded2023-02-
dc.title.subtitle그 원리와 법적 책임에 관하여-
dc.contributor.major디지털포렌식학-
dc.identifier.uciI804:11032-000000174302-
dc.identifier.holdings000000000049▲000000000056▲000000174302▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share