본문 바로가기

공부150

[네트워크이론] Louvain algorithm for community detection network로부터 community를 추출하는 방법으로 Girvan-Newman algorithm와 Link community를 소개한 적이 있었다. 오늘은 그 3탄으로 Louvain algorithm을 소개하려고 한다. Louvain algorithm이 처음 소개된 논문은 Fast unfolding of communities in large networks, Vincent D et al., Journal of Statistical Mechanics: Theory and Experiment(2008) 이다. 이 알고리즘에 Louvain이라는 이름이 붙은 이유는 벨기에의 Louvain이라는 대학 출신이어서.. 애교심이 대단하다ㅎㅎ 이번 글은 논문의 전개 방식에 맞추어 Louvain algorithm의 배.. 2018. 8. 10.
[개념] 정보 엔트로피와 그 친구들 엔트로피는 무질서도라고도 불리며, 불확실한 정도를 나타낸다. 엔트로피는 계가 가질 수 있는 상태의 수에 의존하며 계가 가질 수 있는 상태가 1가지 일 때 0, 즉 확실한 상태가 된다. 오늘은 엔트로피의 친구들 정보량, 엔트로피(Entropy), 결합 엔트로피(Joint Entropy), 조건부 엔트로피(Conditional Entropy), 상호 정보량(Mutual Information), Transfer Entropy들을 간단하게 정리해보려 한다. 모두 샤넌이 정의한 정보량에서 파생하는 개념으로, 얼마나 불확실한지 정량적으로 판단하는 근거를 제시한다. 정보량 N종류의 사건 (예: 맑은날, 비오는날)사건이 발생할 확률 (예: 맑은날 90%, 비오는날 10%) 단위bit (log의 밑이 2일 때)nat (.. 2018. 8. 4.
[행복] 멋대로 매미의 죽음을 보고 불행하다 느끼다 든 생각 교내 여기저기에 매미들의 시체가 보인다. 배를 까뒤집고 땅에 떨어진 매미들의 시체 주변에는 어김없이 개미들이 몰려있다. 매미는 짧게는 3년에서 길게는 17년을 땅속에서 산다. 그러고는 나무에서 불완전 변태를 거친 후 날개 달린 성체가 되어 한달동안 열심히 울며 번식활동을 하고는 죽는다. 사람 관점에서 보면 참 허망하다. 땅 속에서 보내는 수년의 유년기에 비해, 날개를 달고 날아다니며 구애를 하고, 자식을 남기는 어떻게 보면 가장 화려하고 아름다워 보이는 시기가 한 달 뿐이니 말이다. 그런데 매미의 관점에서는 어떨까? 매미도 그런 사실이 불행할까? 우리나라는 매년 매미가 나타나서 운다. 일본도 그렇다. 수년의 유년기를 보내는 매미들이 로테이션을 돌며 세상에 나와 구애활동을 한다는 뜻이다. 그런데 해외에서는.. 2018. 8. 1.
[논문소개] Monophily in social networks introduces similarity among friends-of-friends 네트워크 분석에 사용하는 용어 중에 Homophily라는 용어가 있다. 자신과 비슷한 사람들과 어울리려는 성향을 나타내는 말로 "love of sameness"라는 뜻의 그리스어로부터 따온 용어이다. Assortativity(동류성)과 비슷한 개념이다. 오늘 소개하고자 하는 논문은 Monophily in social networks introduces similarity among friends-of-friends, Kristen M. Altenburger and Johan Ugander, Nature Human Behaviour 2, 284-290 (2018) 이다. 본 논문의 저자들은 Monophily라는 새로운 특성을 제시한다. Monophily는 "love of one" 이라는 뜻으로 자기 자신의.. 2018. 7. 31.
[강연] 행복 관련 강연 정리 & 감상 행복은 정의하기 어려운 애매한 개념이고 수많은 형태를 띄고 있지만, 모든 사람들이 원하는 상태이다. 난 "사람들이 더 행복해지려면 어떤 것이 필요할까? 모두가 행복한 세상이 있을 수 있을까?" 라는 질문을 갖고 살고 있다. 이에 대해 처음 주목한 것은 그런 것이 가능한 "세상" 이었지만, 점점 더 세상을 이루는 "사람"이 중요한 것임을 깨달아 가고 있다. 이번 글에서는 내 생각에 영향을 주었던 강연들을 소개하고자 한다. 행복에 관해 연구해온 연구자들의 통찰을 바탕으로 한 강연이므로 저자로 검색하면 관련 논문들을 볼 수 있다(강연은 논문보다 더 거창할 수 있다). 전체적인 감상 행복은 그 형태는 여러가지이지만 하나의 특징을 갖는다. 우리 모두가 행복한 상태가 되고 싶어한다는 것이다. 행복을 느끼는 상황은 .. 2018. 7. 26.
[네트워크과학] '네트워크이론'이란 무엇인가 네트워크이론은 언어이다. 상호작용이 이루어지는 공간을 기술하고, 그러한 상호작용을 이해하기 위한 언어이다. 모든 상호작용에는 우연과 선호성이 개입한다. 내가 누군가를 만나 이야기 하는 것은 어떤 우연과 어떤 선호적 요인이 작용한 것이다. 학교에서는 공통 관심사를 지닌 사람들이라는 카테고리 속에서 사람들을 만나고, 동네 수퍼마켓에서는 지역이라는 물리적 카테고리 속에서 사람들을 만난다. 그래서 상호작용, 특히 큰 단위의 상호작용을 기술하기 위해서는 대상이 어떤 구조 속에서 어떤 구조를 이루며 상호작용을 해나가는지 기술할 필요가 있다. 그 언어로 네트워크 이론이 이용되는 것이다. 네트워크 이론은 행렬이라는 단순한 도구를 이용한다. 이 도구는 네트워크의 장점이기도 하며, 단점이기도 하다. 네트워크는 모든 상호작.. 2018. 7. 5.
[네트워크이론] Network Assortativity (네트워크 동류성) 네트워크 구조에는 동류성(Assortativity)이라는 특징이 있다. 동류성은 같은 종류의 사람들끼리 뭉치는 경향을 나타낸다. 다음 그림을 보면 쉽게 이해할 수 있다. Assortative network(동류성 네트워크)에서는 link를 많이 가진 node 즉, hub는 hub들 끼리 뭉쳐있다(중심부). 또 적은 link를 가진 node들은 적은 link를 가진 node들 끼리 뭉쳐있다(외곽부). Disassortative network(비동류성 네트워크)에서는 link를 많이 가진 node와 link를 적게 가진 node들이 연결되어있다. 이렇게 Assortativity는 네트워크의 구조를 결정하는 중요한 요소이다. 같은 degree분포의 network 여도 assortativity와 같은 특징들은 .. 2018. 7. 4.
[개념] 확률변수의 기대값, 분산, 공분산, 상관계수 확률변수X의 기대값 확률변수X가 취할 수 있는 값 값 x의 출현확률 확률변수X의 분산 확률변수X가 취할 수 있는 값 확률변수X의 기대값(=E(X)) 값 x의 출현확률 확률변수X, Y의 합의 기대값 확률변수X, Y의 합의 분산 공분산 고찰 x값이 x의 평균보다 클 때, y값이 y의 평균보다 크면 Cov(X, Y)는 양의 값을 가진다. 반대로 x값이 x의 평균보다 클 때, y값이 y의 평균보다 작으면 Cov(X, Y)는 음의 값을 가진다. 각각의 경우 그 정도가 크면 클 수록 Cov(X, Y)의 절대값은 증가한다. x의 값과 y의 값이 전혀 상관 없을 때(독립관계), Cov(X, Y)는 0의 값을 가진다. 확률변수X, Y의 Pearson 상관계수 Pearson 상관계수는 공분산 Cov를 이용하여 -1 ~ 1.. 2018. 7. 3.
[인공지능] 강화학습 맛보기 강화학습은 환경(Environment) 속에서 정책(Policy)에 따른 행위(Action)를 통해 상태(State)를 변화 시키며, 그에 따른 보상(Reward)를 받아 정책(Policy)에 반영한다. 최종적으로는 가장 높은 보상을 얻을 수 있는 정책을 확정하는 것이 목표이다. 간단하지만 생명체가 행위를 결정하는 본질이 잘 담겨있다. 불확실한 환경 속에서 행위를 통한 보상으로 정책을 수정해나가는 것은 시행착오로부터 배우는 생명체의 특징이다. (물론 생명체에겐, 통찰과 응용과 같이 다양한 스킬이 있다) 강화학습은 예전부터 있었지만, 가능한 State와 Action의 경우의 수가 너무 많아 그에 적합한 Policy를 찾는 것이 힘들었는데, Neural network가 도입되면서, 그 진가를 발휘하기 시작했.. 2018. 6. 6.