왜 우리는 데이터, 정보, 지식을 구분해야 하는가
I. 의의
데이터, 정보와 지식에 대한 정의는 학자들 마다 다르다. 그럼에도 어느정도 공통점을 위주로 정의하면 데이터는 처리되지 않은 사실, 정보는 데이터 처리의 결과물, 지식은 정보 처리의 결과물이라는 것에 어느정도 일치되는 정의가 있다. 그러나 우리는 데이터, 정보 그리고 지식의 법률적 정의도 함께 살펴보아야 한다.
2. 법률적 정의
데이터란 정보처리능력을 갖춘 장치를 통하여 생성 또는 처리되어 기계에 의한 판독이 가능한 형태로 존재하는 정형 또는 비정형의 정보를 말한다(데이터기반행정법 제2조 제1호).
정보란 자연인 또는 법인이 특정목적을 위하여 광 또는 전자적 방식으로 처리하여 부호, 문자, 음성, 음향 및 영상 등으로 표현한 모든 종류의 자료 또는 지식을 말한다(국가정보화기본법 제2조). 예를들면 개인정보, 금융거래정보 등이 있다.
반면 지식에 대한 정의를 두고 있는 법률은 없다. 지식과 관련된 다른 법률들의 정의를 종합해보면 다음과 같다. 지식이란 정보가 인간의 지적 활동을 통해 체계화되는 등의 상태로 산출되는 것을 의미한다. 법적인 측면에서는 지식은 권리와 성과에 초점을 두고 있다. 지식으로 예를 들면 특허 기술, 저작물, 영업비밀 등이 있다.
이처럼 법률적으로는 데이터, 정보 그리고 지식을 명확하게 구분하고 있지 않다. 데이터에의 정의에 정보가 포함되어 있고, 정보의 정의에 자료와 지식을 포함하기도 한다.
3. 구분가능성
상술한 것과 같이 데이터, 정보 그리고 지식은 법적인 관점에서 절대적으로 구분될 수 없다. 정보를 통해 체계화된 지식은 특허 공개, 저작물의 공표 등에 의해 타인에게 정보나 데이터로서 제공될 수 있고, 타인은 해당 데이터나 정보로 또다른 지식을 창출해낼 수 있기 때문이다. 예컨대 데이터, 정보 및 지식의 성격을 복수적으로 갖는 경우도 존재하기 때문이다. 영업비밀을 예로 들면 고객정보는 정보에 해당하지만, 고객 정보에 대해 경제적 가치가 인정되면 지식에도 해당될 수 있다. 따라서 정보와 지식은 상대적으로 구분될 뿐이며, 정보가 지식으로, 지식이 다시 정보로 순환, 발전하는 개념으로 봄이 타당하다고 본다. 다만 상황에 따른 구분은 필요하므로 구분 필요성에 대해서는 후술한다.
4. 데이터, 정보 및 지식 구분 필요성
(1) 재산적 가치 평가
데이터, 정보 그리고 지식에 대한 재산적 가치평가에서 이들은 구분되어야 한다. 이들을 구분하는 것은 상대적 가치에 따른 것이지만, 필요로 하는 사람에 따라 그 가치가 상이하다. 데이터는 미가공된 상태이고 목적성이 결여된 것으로 재산적 가치를 높게 평가할 수 없다. 그러나 정보는 특정목적을 위하여 처리된 것으로 특정 목적으로 정보를 필요하는 사람들에게 데이터보다 높은 가치를 가진다. 마지막으로 지식은 정보를 바탕으로 처리된 최종 결과물이라는 점에서 정보보다 높은 재산적 가치 평가를 가지고 있다. 예컨대, 창출된 지식을 바탕으로 특허권을 확보한다던가 영업비밀로 보호하는 경우 대중에게 공개된 데이터나 정보와 비교하면 높은 재산적 가치를 가질 수 있고, 독점권을 통해 수익을 창출할 수도 있다.
이처럼 데이터, 정보 및 지식은 구분한다면 구분할 수 있고, 각각이 거래대상이 될 수 있고 다양한 재산적 가치를 가질 수 있다.
그러나 데이터와 정보가 절대적으로 지식보다 가치가 낮은 것은 아니다. 관리방법과 수요 등에 의해 데이터와 정보도 높은 가치를 가질 수 있다는 점이다. 그럼에도 데이터, 정보 및 지식을 구분하는 것으 가치평가에 있어서 충분히 유용한 접근 방법이고, 관리의 수준을 정할 때도 유용한 방법이 될 수 있다.
(2) 인공지능 시대에서의 구분 필요성
인공지능의 등장으로 엄청난 데이터를 다루고 있다. 그러나 엄청난 데이터 처리만으로 가치 있는 정보, 지식을 창출한다는 결과로 귀결되지는 않는다. 데이터가 많다는 것은 역설적이게도 가짜 데이터, 저급 데이터도 많이 있다는 것을 의미한다. 따라서 인공지능이 적극적으로 활용되는 오늘날 더 정확한 데이터, 정보 그리고 지식을 확보하기 위해서는 상대적이나마 이들의 구분이 필요하며, 인공지능의 학습과정에서 이용된 데이터, 정보 및 지식이 이용대가에 대한 면책가능성과 면책되지 않는다면 비용을 얼마나 지불해야 하는지 등의 문제에 있어서 구분은 필요하다.
(3) 법적인 측면에서의 구분 필요성
법적인 측면에서 데이터, 정보 그리고 지식은 보호가능성 측면에서 구분이 필요하다. 최근 정부의 AI 활성화 드라이브에 따라 데이터, 정보 및 지식이 AI 학습에 제공될 것이 요구되고 있다. 대표적으로 공공데이터법은 공공기관의 데이터를 AI학습을 위해 제공할 수 있음을 명시하고 있고, 저작권법에서도 데이터 마이닝 면책 규정이 도입될 것인지에 대한 논의가 이루어지고 있다. 또한 저작권법에서는 공정이용 제도를 두고 있는데, 공정이용의 요건을 갖춘다면 AI에 의한 저작물 학습에 대해 면책이 가능해진다. 이러한 정부 정책과 법률의 규정에 따를 때 AI 학습에 사용될 수 있거나 사용될 수 있는 데이터, 정보 및 지식을 판단하기 위해서도 데이터, 정보 및 지식의 구분이 필요하다. 세 개념이 동일한 수준의 보호를 받을 수 없고 가치도 다르기 때문에 세 개념이 다른 보호요건을 갖춰야 하기 때문이다.
또한 일정 데이터, 정보 및 지식은 비공개를 기반으로 사용되고 있다. 대표적으로는 개인정보 및 영업비밀 등이 있다. 이들의 공개로 인해 발생하는 손해는 비가역적이다. 따라서 무엇이 개인정보 또는 영업비밀인지에 대한 명확한 구분이 필요할 수 있고, 손해의 범위를 판단하기 위해서도 구분이 필요하다.
'변호사 > AIㆍITㆍSW법' 카테고리의 다른 글
| ai 시스템이 결합된 로봇의 유형과 그 활용상황 및 규제 필요성 (0) | 2026.05.01 |
|---|---|
| 정보보호공시 제도의 문제점과 개선방향 (0) | 2026.04.27 |
| 미국의 사이버보안 법체계 발전경향 (0) | 2026.04.20 |
| 블록체인과 정보보안 그리고 법적 제문제 (0) | 2026.03.22 |
| 소프트웨어 감정 일반론 (2) | 2024.09.05 |