본문 바로가기

결집계수2

[네트워크 이론] local clustering과 global clustering이 다른 이유 Degree 편향을 보정한 결집계수를 다룬 글에서 잠깐 거론된 바가 있는데, 지역적으로 clustering 계수를 구해서 평균을 낸 결과와, 전역적으로 clustering 계수를 구한 결과는 전반적으로 같은 경향을 보이지만, 그래프의 구조적 특성에 따라 크게 상이할 수 있다. 이 문제를 본격적으로 다룬 논문이 있어 간략히 정리해본다. 이 문제를 풀기 위해 저자는 Windmill graph를 이용한다. Windmill graph는 한 node를 중심으로 완전 그래프 k(k개의 node가 서로 모두 연결된 그래프)가 n개 연결되어 있을 때, W(n, k)로 표시한다. node 하나를 중심으로 완전그래프들이 펼쳐진 모습이 마치 풍차의 모습과도 같다. 이 때, n을 무한히 늘리면, local clustering.. 2021. 6. 3.
[네트워크이론] Degree 편향을 보정한 결집계수(Clustering Coefficient) 결집계수 결집계수(Clustering coefficient)는 네트워크의 결집도를 정량화 하는 한 방법이다. 그 정의가 참 재미있는데 다음과 같다. C_i : node i 의 지역(local) 결집 계수k_i : node i 의 이웃의 수 (=degree)T(i) : node i 의 이웃끼리 이웃인 경우 (node i를 중심으로 삼각형이 만들어지므로 Triangle의 개수라고도 한다) 특정 node i 의 이웃과 이웃이 서로 이웃인 경우를, 모든 가능한 경우 'k(k-1)/2'로 나눈 값을 지역(local) 결집계수로 정의한다. 결집계수의 문제점 결집계수는 node의 특성을 나타내는 값으로 많이 이용하는데, 치명적인 단점이 있다. 바로, 분모가 과대 평가 된다는 점이다. 이웃의 수가 적다면 모든 경우의 .. 2020. 2. 13.