본문 바로가기

Clustering3

[논문소개] 조직 내 소셜 네트워크 구조와 우울 증상의 관계 오랫동안 붙잡고 있던 연구가 논문화 되었다. 논문 제목은 'Universal association between depressive symptoms and social-network structures in the workplace' 이다. 조직 내 소셜 네트워크의 구조와 우울증상과 비교하는 연구였는데, Clustering이라는 지역적인 interaction의 밀도가 높을 수록 우울 증상을 적게 경험한다는 관찰 결과를 정리한 논문이다. 흥미로웠던 점은 개개인의 interaction의 특징에서 나타나지 않던 상관관계가 주변의 interaction 까지를 포함한 밀도 지표에서 나타났다는 점이었고, 아쉬운 점은 인과성 까지는 다루지 못했기에 상호작용과 우울증상이 이루는 다이나믹스 까지는 알 수 없었다는 점이었.. 2022. 7. 6.
[네트워크이론] Degree 편향을 보정한 결집계수(Clustering Coefficient) 결집계수 결집계수(Clustering coefficient)는 네트워크의 결집도를 정량화 하는 한 방법이다. 그 정의가 참 재미있는데 다음과 같다. C_i : node i 의 지역(local) 결집 계수k_i : node i 의 이웃의 수 (=degree)T(i) : node i 의 이웃끼리 이웃인 경우 (node i를 중심으로 삼각형이 만들어지므로 Triangle의 개수라고도 한다) 특정 node i 의 이웃과 이웃이 서로 이웃인 경우를, 모든 가능한 경우 'k(k-1)/2'로 나눈 값을 지역(local) 결집계수로 정의한다. 결집계수의 문제점 결집계수는 node의 특성을 나타내는 값으로 많이 이용하는데, 치명적인 단점이 있다. 바로, 분모가 과대 평가 된다는 점이다. 이웃의 수가 적다면 모든 경우의 .. 2020. 2. 13.
[개념] 계층 클러스터 분석 "계층 클러스터 분석"의 개념 여러 개의 비교 대상들을 놓고 성질이 비슷한 그룹을 군집화 하고 싶을 때, 사용할 수 있는 분석 방법이다. 방법은 간단하다. 1. 비교 공간 상에 위치한 대상 간의 거리를 구한다.# 비교 공간 : 1차원-한 개의 비교 값, 2차원-두 개의 비교 값...# 거리 : euclidean 거리(직선), cityblock(직각 거리) 등등.. 2. 거리가 가장 짧은 두 대상을 합친다. 3. 합친 대상을 한 개의 그룹으로 설정, 모든 비교 대상이 한 개의 그룹이 될 때 까지 위의 작업을 반복한다.# 그룹-그룹, 그룹-개인 간의 결합을 위해 다음과 같은 방법을 사용한다.## Ward 법그룹을 합쳤을 때 새로운 그룹의 중심 값과, 개개의 값의 거리의 합이 최소가 되는 그룹을 합친다.## .. 2018. 4. 11.