본문 바로가기
information arch.

트리구조의 함정 1

by 늙은소 2012. 1. 14.
목차와 트리구조에 대한 제 생각을 물으신 분이 계셔서 이 글을 씁니다.

글에 이론적 근거는 없습니다. 미약하게나마 구축하고 있는 사고 체계를 설명하기 위해 노력하는 글일 뿐이니 이 글에서 '답'을 구하지 마시고 '질문'을 얻으시기 바랍니다.
* 제가 수학이나 관련 학문을 전공한 것이 아니기 때문에, 글에서 사용하고 있는 용어가 그 분야에서 사용하는 정의와 다를 수 있습니다. 



정보전달을 주 목적으로 하는 저작물의 대부분은 트리 구조(Tree Structure)로 이루어진다.

연역이나 귀납과 같은 논리를 전개하는 방식의 차이와 상관없이, 글은 부분전체라는 굴레로부터 자유롭지 못하다. 글자가 모여 단어로, 단어가 다시 문장으로, 문장은 문단으로..
언어의 모든 요소는 크기와 상관 없이 의미를 지니고 있으며, 그것이 모였을 때 다시 새로운 의미를 지니는 방식으로 결합하는 구조 안에서 발전해왔다.

 

트리 구조를 접할 수 있는 가장 보편적인 예는 책의 목차다. 대부분의 책은 [그림 1]과 같은 형태로 목차를 구성한다. 목차의 번호는 아라비아 숫자나 로마 숫자 혹은 기호가 사용되기도 하며, 위계구조가 지나치게 복잡해질 경우 하위 단계는 목차에 표기하지 않는 게 보통이다일반 저작물의 경우 목차에 표기하는 트리 구조는 3단계가 보통이나, 논문의 경우에는 5단계 이상의 항목을 목차에 표기하기도 한다.

 

교과서와 수 많은 참고서를 포함한, 거의 대부분의 책이 목차를 책의 제일 앞쪽에 배치한다. 공부 좀 한다는 학생들은 본문을 보기 앞서, 목차부터 본다. 목차는 건물의 도면과 같아서, 건물 안에서 길을 잃지 않으려면 도면을 잘 챙겨놓는 게 중요하다. 잘 만들어진 참고서는 단원마다 해당 단원의 내용을 정리하는 단원 요약페이지를 단원 제일 앞에 배치하며, 그것으로도 부족해 단원 제일 끝에 암기하기 좋은 형태로 키워드들을 뽑아내 이를 트리 구조의 형태로 제시해주기도 한다. 그렇게 [그림 1] [그림 2]의 형태로 손쉽게 변형되어 왔다.

 

 

문제는 여기서부터 시작된다.


언뜻보기에 [그림 1]과 [그림 2]는 큰 차이가 없어보인다. [그림 1]의 세로로 정렬된 정보를 90도 회전하여 가로로 재배치하고, 수직과 수평선을 그어 정보간의 소속관계를 명확히 보여준 것이 [그림 2]이기 때문이다.

그러나 이 과정에서 [그림 2]는 몇 가지 오해를 불러일으키게 된다.

 


1. 첫번째 함정


[그림 2]는 정보의 위계와 소속관계를 지나치게 한정시켜버리는 문제가 있다. 
'A-1'과 'A-2'를 합한 것이 'A'인가?
'A-2'와 'B-2'는 동일선상에 놓이는 것이 합당한가?
이러한 질문을 삭제시켜버린다.
그 때문에 자신이 다루고 있는 정보가 [그림 3]의 구조로 이루어져 있다고 착각하게 만든다

지금 가지고 있는 책을 꺼내 목차를 살펴보자.

‘A-1’
‘A-2’를 합한 정보는 ‘A’를 완벽하게 정의하고 있는가?

‘A-1’
에서 한 이야기를 ‘A-2’에서 다시 하고 있지는 않은가.

혹은 ‘B’에 대해 설명하려면 반드시 들어가야 할 내용이 빠진 채 ‘B-1’‘B-2’로 단원이 끝나버리지는 않는가.


당신이 보고 있는 책의 대부분은 [그림 3]이 아니라, [그림 4]의 형태로 정보를 구성하고 있다.

어딘가 비어있거나, 어딘가 겹쳐져 있거나, 혹은 주제 바깥으로 벗어나 있거나

 

취미로 읽거나, 지식을 얻기 위한 독서라면 크게 상관은 없다. 그런데 이게 교과 과정이라든가 고시라든가 하는 타이틀에 붙게 되면 이야기가 달라진다. 교과서나 참고서, 혹은 국가고시에 관련된 서적은 빈 공간을 허용하지 않아야 하기 때문이다. 지나치게 양이 많은 건 흠이 될

수 있지만, 다루었어야 할 내용을 누락시킨 것은 부적격품이라는 낙인이 찍힌다. 그런 탓에 이들은 사각형을 몇 겹으로 채워서라도 빈 공간을 메우는 형태를 취한다.

물리 교과서에 나온 내용이 화학 교과서에 나오고, 지구과학의 내용이 지질학에 나오고, 또 같은 내용이 형태를 달리한 채 세계사에 나온다. 세계사에 나온 내용이 정치 경제에 나오고, 미술과 음악에 또 다시 등장하는 식이다.

덕분에 학습해야할 정보의 총 합이 어마어마하게 커지고 만다. 회색 사각형의 크기로 공부하면 될 것을 몇 배의 면적로 공부하게 되는 꼴. 문제는 공부하면서도 그것이 겹쳐있다는 사실을 인식하는 이가 그리 많지 않다는 것? 그리고 회색 사각형보다 몇 배는 큰 파란 사각형을 다 안다 해도 [Subject M]을 완벽하게 이해하지는 못한다는 것이다.

‘A’에서 ‘A-1’, ‘A-1’에서 ‘A-1-1’로 파고들어가는 형식으로 학습을 한 후, ‘B’로 넘어가 ‘B-1’, 'B-1-1’을 공부하는 형태이니 어디가 어떻게 겹쳐있는지 전체 지형도를 전혀 이해하지 못하는 경우가 대부분.

 

트리 구조를 사용하여 사고하고, 학습하려 한다면 집합론을 불러와 자신이 지금 다루고 있는 구조물을 재해석해보는 것이 필요하다.

[그림 1] [그림 5]의 형태로 바꿔 보는 것이다. 남이 만들어 놓은 목차를 진리인양 받아들이고 억지로 이해하려 들면 [그림 2] [그림 3]의 함정에 빠지기 쉽다. 당신이 보고 있는 거의 모든 책이 [그림 4]의 불완전한 형태로 이루어졌다는 것을 우선 인지해야 한다. 그 후 [그림 4]의 각 영역이 어떠한 형태로 위치하고 있는지를 [그림 5]의 방식으로 분석해내야만 한다

목차는 당신을 안내해주는 가이드가 아니라, 당신이 비판해야 할 1차 분석 대상이다. 이 책의 저자는 ‘A’와 ‘B’를 어떤 기준으로 나누었는지. 그 방식이 타당하긴 한지, ‘A’와 ‘B’의 무게는 어떠한지.. ‘A-1’‘A-2’의 합집합은 ‘A’가 되는지, 교집합이 너무 많은 것은 아닌지.. 이런 것들을 따져보면 저자의 능력이나 성향을 파악하는 게 가능하다


 

2. 두 번째 함정

 

[그림 2]에는 또 한 가지 함정이 숨어 있다. 첫 번째 함정이 정보의 양에 해당하는 문제였다면, 두 번째는 트리 구조의 위계에 대한 물음에서 찾을 수 있다.

 




상당히 많은 책이 [그림 6]과 같은 형태의 정보를 [그림 2]로 표시하고 있다.
정보는 목적에 따라 의미(Meaning)와 가치(Value)를 지니며, 관점에 따라 다르게 정의된다.
트리구조의 기본 정의에 따르자면 [그림 6]은 [그림 2]와 구분되지 않아야 한다. 트리구조는 하나의 점이 하위 단계의 점 몇 개와 연결되어 있는가만 따지기 때문이다. 그러나 각각의 점이 정보이고, 그것이 의미와 가치를 지니고 있다면 몇 개로 연결되어 있는가만으로 모든 관계를 설명할 수 없게 된다.

물론 반대의 경우도 있다. [그림 2]로 정리했어야 옳은 정보를 [그림 6]의 형태로 잘못 정리하는 사람들도 상당히 많다. 'B'가 사실은 'A-3'였어야 옳았는데 이를 'A'가 아닌 'B'로 정리하게 되면 [그림 6]과 같은 형태가 나올 수 있다. 어떤 책의 경우는 단지 분량이 너무 많다는 이유로 해당 내용을 토막내서 억지로 트리구조로 만들어 넣는 경우도 있다. 자신이 쓴 책의 전체 구조를 모르는 저자들이 생각보다 많다는 것을 인지하는 게 중요하다.
그렇다면 이런 오류는 왜 일어나는 것일까?


당신이 지금 보고 있는 책에 담긴 정보들을 [그림 7-1]이라고 하자. 정보는 아직 책으로 정리되어 있지 않은 상태이다. 이것이 어떠한 목적하에 정리되어 분류가 이루어지면 [그림 7-2]의 형태로 부분적인 정리가 진행된다. 이렇게 정리된 정보들을 책으로 나열하면 [그림 7-3]과 같은 형태가 되며, 이 순서를 간략히 소개하는 것이 책의 목차가 된다.

[그림 7-1]을 [그림 7-3]으로 정리한 기준은 무엇인가? 바로 도형의 형태다. 사각형은 사각형끼리, 원은 원끼리, 삼각형은 삼각형끼리. 모든 정보가 이렇게 단순하다면 참 편할텐데 현실은 그렇지가 못하다.

[그림 7-1]의 정보들을 전혀 다른 기준으로 재구성 해보자
[그림 7-4]처럼 컬러로 이를 정리한다면 어떨까?
정보의 가감을 하지 않고, 전혀 다른 책을 쓰는 것이 가능하다.


'총론'과 '각론'을 떠올려보면 이해가 쉬울 것이다. 형법을 예를 든다면, '총론'에서는 '죄인'을 무엇으로 정의할 것인가 정의하게 되며, '각론'에서는 강도와 살인에서의 죄인을 각기 다르게 정의하는 식으로 정보를 달리 구성하게 된다.


그렇다면 [그림 7-3]을 주제로 책을 쓴다고 생각해보자. 단지 나열만 하는 것으로 책을 완성할 수 있을까? 이 경우 내가 왜 이 도형들을 이렇게 분류해 놓았는지 그에 대한 정의를 밝혀야만 할 것이다. '다각형'에 대한 정의를 제시하지 않고 책을 시작할 수 없을 터.
마찬가지로 [그림 7-4]의 형태로 책을 쓰게 된다면 '색'에 대한 정의를 내린 다음 이야기를 시작하게 될 것이다.

여기서 [그림 7-5]와 [그림 7-6]을 보자. 이 그림은 어떤 기준으로 정보를 분류하였는가.

[그림 7-5]는 도형의 안이 채워져 있는가 아닌가로 나뉘어 있다. 그런데 [그림 7-5]가 [그림 7-6]으로 재 분류가 이루어진다면? [그림 7-6]을 꼼꼼히 살펴보자. 뭔가 이상하지 않은가?

[그림 7-6]의 상단은 도형의 형태에 따라 나뉘어졌는데 반해, 아랫쪽 도형들은 색상에 따라 분류가 이루어져 있다. 많은 책들이 이런 식으로 트리 구조를 형성하고 있다. 앞에서는 색으로 나뉘어놓더니 뒤로 가면 형태로 나뉘는 식. 이 때는 이 기준으로, 저 때는 저 기준으로.


그 결과 [그림 7-7]과 같은 형태로 내용이 구성되는 일이 발생한다. '1단계-색상'으로 나왔던 내용이 '1단계-형태'에서 다시 나오고, '1단계-색상'으로 사용한 분류 기준이 2단계에서 다시 사용되는 형태. 이렇게 잘못된 트리구조로 학습을 하게 되면 학습해야할 정보량이 기하급수적으로 증가하게 될 뿐 아니라, 자신이 공부하는 내용의 지식 구조를 이해하지 못하게 되는 일이 발생한다.

각 단원마다 어떤 내용을 담고 있는지 소개하는 책은 많지만, 이 책은 어떤 기준으로 정보를 나누고 있는지, 그 구조를 설명하는 책은 많지 않다. 결국 모든 것은 독자의 몫이다.



3. 세 번째 함정



정보의 관계라는 것이 고정되어 있다고 볼 수 있을까?  
트리구조를 있는 그대로 받아들는 것에 익숙해지면 실제 정보가 [
그림 8]의 형태로 이루어져 있다는 것을 인식하지 못하게 된다. (여기서 [그림 8]은 모빌에 가까우며, 세로 방향의 선에는 탄성이 있어 진동하기 때문에 그 길이가 일정하지 않은 것으로 정의한다)

'A-1'과 'A-2'를 나누었던 기준은, 'B-1'과 'B-2'를 나누는 기준과 동일하지 않다. 또한 각기 자신의 하위에 위치한 정보들의 무게가 다르기 때문에 같은 단계에 놓인 정보들은 같은 높이에 위치지어지지 않는다. A라는 건물의 2층이 B라는 건물의 3층과 같은 높이에 있을 수 있는 것처럼.

또한 [그림 2]에 사고가 고착되어 버리면 [그림 8] [그림 9]로 발전시키는 과정을 시도조차 하지 않는 일이 발생한다.

대부분의 사람들은 [그림 9]를 미완의 형태로 받아들이는 경향이 이다.
[
그림 9] [그림 2]로 정리하는 것이 우수한 것이며, 똑똑한 것으로 생각한다는 것. 

그러나 정보를 제대로 이해하고 분석하려면 [그림 2]와 [그림 9]를 동시에 사고하고 있어야 한다. 

여기서 [그림 9]는 화학의 분자구조와 유사한 형태로, 결합력에 따라 거리를 달리한다. 일반 트리구조에서는 'A-2-3'과 'B-1-1'이 멀리 떨어져 있게 되지만 [그림 9]에서는 'A-2-3'이 'A-2-2'보다 'B-1-1'과 더 가깝게 위치한다.

[
그림 9] [그림 2]는 언어에 있어 기의(
記意)기표(記標)’의 관계와 유사하다.
커뮤니케이션을 위한 도구로, 혹은 [그림 9]을 사유하기 위한 도구로 [그림 2]는 필요하다. 그러나 어디까지나 이것은 도구이며, 변형된 모사물에 지나지 않는다. 위상수학에서 도너츠와 반지와 머그컵이 같은 도형으로 묶이는 것처럼, [그림 2]는 [그림 9]의 무수히 많은 여러 닮은 꼴을 정의하기 위한 기표에 해당한다.

 

기표를 무시하는 것도 문제지만, 기표로만 사유하는 것도 곤란하긴 마찬가지. 이 둘을 동시에 다룰 수 있어야 한다. 이런 상태를 보다 지속시키게 되면 [그림 9]가 비선형적인 형태로 바뀌게 되는데, 그 단계가 되면 더 이상 트리 구조가 아닌 형태가 되고 만다 

이 단계에 이르면 각각의 정보는 새로운 주제 N(Subject N)의 정보망과 결합하게 된다.


이러한 형태가 확장되면 알아야 할 지식의 양은 확장 그래프가 완만해지는 대신 연결선이 기하급수적으로 증가하는 형태가 이루어진다.

반대로 트리구조 안에서만 사유를 진행하면 연결선은 일정한 비율로 확장하나 알아야 할 지식의 양이 기하급수적으로 증가하는 그래프가 그려진다.

점(정보)을 우선할 것인가, 선(관계)을 우선할 것인가.


무엇을 선택할 것인가는... 글쎄...
선택하고 싶다고 선택할 수 있는 문제인지가 우선이겠군.







* 제 경우는 기억력이 좋지 않은 편이라 어려서부터 [그림 10]의 형태로 사고를 진행해왔습니다. 그것이 오래되다보니 정보라 할 수 있는 '구'보다 '망'을 더 중시하는 형태로 사고체계가 구축이 되었네요. 

그곳에 무엇이 있는지 모르나, 무언가 있을 것이라는 형태로 사고가 진행됩니다.
점이 있기 때문에 선을 긋는 게 아니라, 선과 선이 교차하는 지점이므로 거기에는 점이 있어야 한다는 추론으로 사고를 진행해나갑니다. 그래서 모르는데 아는 상태(무엇이 있는지 모르지만 그곳에 무언가 있으며, 그것은 어떠한 형태여야 한다는 추론)가 발현됩니다.