본문 바로가기
공부/네트워크과학

[네트워크이론] Class size paradox & Friendship paradox

by 죠옹 2019. 9. 23.

 이전 글에서 살펴본 논문에서는 네트워크의 구조에 따라 소수자와 다수자가 사회를 바라보는 인식이 다를 수 있음을 보였다. 오늘 소개할 Class size paradox와 Friendship paradox 또한 사회적 구조 속에서 나타날 수 있는 인식의 편향을 이야기 한다. 

 

 

Class size paradox


먼저, Class size paradox를 간단히 설명해 보자면, 학교에서 Class를 개설했는데, 학교 측에서 계산한 Class 별 평균 인원보다 학생 측에서 느끼는 Class 별 평균 인원이 더 많은 현상을 말한다.

 

 인터넷에 있는 간단한 예를 들어 설명해 보자. 

 학교에서 개설한 90개의 Class가 있다. 그 중 80개는 5명, 10개는 50명이 수강 하는 Class이다.

 

 학교 측, 즉 Class 별로 평균을 내보면, 다음과 같이 Class 규모는 평균 10명으로 집계될 수 있다.

반대로 학생 측, 즉 Class에 참가한 학생들에게 참가한 Class 규모를 묻고 그 평균을 내보면, 다음과 같이 Class 규모가 30명으로 집계될 수 있다.

 

(80x5=400명은 Class 규모를 5라고 말할 것이고, 10x50=500명은 Class 규모를 50이라고 말할 것이기 때문에)

 

 이와 같이 학생 측이 이야기 하는 Class 평균 인원 수가 크게 느껴질 수 있다는 현상이 Class size paradox이다.

 

 이와 같은 현상은 학생 측 50명이 참여하는 10개 Class의 500인과 5명이 참여하는 8개 Class의 400인의 숫자가 비등하기 때문에 발생하는 오차이다. 학생 측에서 바라보는 평균 인원이 큰 규모(50명)의 Class로 편향되는 것이다.

 

 이를 일반식으로 살펴보면, 다음과 같다.

학교 측 집계:

 학생 측 집계:

 여기서 변수 x_i 는 각 Class의 인원을 나타내며, n은 총 Class의 수, m은 총 학생 수 이다.

 

 학생 측 집계와 학교 측 집계의 차를 구해보면, 다음과 같다.

 σ_x^2는 x(각 Class의 인원)의 분산을 나타내며 양의 값을 갖기 때문에, 학생 측 집계가 항상 클 수 밖에 없음을 알 수 있다. 또한 이러한 집계의 차이는 Class 별 인원의 분산 값에 의존한다는 것을 알 수 있다.


 

 

Friendship paradox


 Friendship paradox는 간단히 설명하자면, 대부분의 사람들의 친구의 수가, 그 사람의 친구의 친구의 수보다 적다는 것이다. 더 쉽게 말해보자면, 나는 왜 내 친구보다 친구가 적을까? 라고 생각하는 사람들이 많다는 것이다.

 SNS 활동이 활발한? 요즘 세상에서는 특히 더 와 닿는 현상이라고는 하는데.. 흠..

 

 network를 통해 이 현상을 살펴보자.

 

 먼저, n명으로 이루어진 network 에서 개인이 갖는 친구의 수의 평균을 구해보자.

 

 이 때 k는 network에서 degree를 나타낼 때 사용하는 기호로, node가 지닌 link의 수, 여기서는 친구의 

 

 다음으로, 친구가 갖는 친구의 수의 평균을 구해보자. 친구가 갖는 친구의 수는 network에서 모든 link들의 한 쪽 끝 단이 닿는 node의 degree에 해당한다.

 예를 들어, 5명의 친구를 갖는 i라는 인물을 생각해보자. 이 친구의 주변 친구는 친구의 친구를 고려 할 때, i를 한번씩 고려한다. 총 5명의 친구가 있으므로, i의 친구의 수(degree)는 총 합계에서 5번 고려된다.

 이를 식으로 나타내면 다음과 같다.

 

 분자는 link들의 한 쪽 끝 단이 닿는 인물의 친구의 수, 즉, 친구의 친구의 수의 총합을 나타낸 것이고, 분모는 link들의 총합을 나타낸 것이다.

 이 식을 통해, Friendship paradox에서는 node 측(개인)과  link 측(친구)의 관점에서 발생하는 편향을 이야기 하는 것을 알 수 있다.

 

 두 관점의 차를 구해보면 다음과 같다.

 Class size paradox와 마찬가지로 degree k 에 관한 분산이 편향의 요인임을 알 수 있다. 

 

 degree의 분산은 Barabasi-Albert(BA) model 같이 엄청나게 degree가 높은 Hub가 발생하는 network에서 더욱 큰 값을 갖게 되는데, 실제 Social network의 많은 예가 BA model과 같은 heavy tail의 degree distribution의 형태로 관찰된다는 것을 고려해보자면, 실제 사회 속에서 Friend paradox는 일반적으로 크게 나타날 수 있음을 생각해 볼 수 있다.


 

 

 두 Paradox 모두 한 현상을 바라보는 관점의 차이가 만들어낼 수 있는 인식의 편향을 이야기 하고 있다. 복잡하게 얽힌 세상 속에서 객관성이란 어디에 있을 것 인가에 대한 질문에 내 관점에 기반해 쉬이 대답해서는 안된다는, 서로의 말에 귀 기울어 들어야 비로소 전체가 보일 수 있다는 교훈이 담겨 있는 paradox 아닌 paradox인 것 같다.

 

 

* 본문 작성에 참고한 자료:

 ネットワーク分析第2版(Rで学ぶデータサイエンス)- 鈴木 努

 

 

 

반응형

댓글