본문 바로가기

네트워크20

[생각] 네트워크라는 관점의 필요성 네트워크라는 관점은 토폴로지가 중요해질 때에 비로소 의미를 갖는다. 만약 어떤 네트워크에서 link의 성질이 비단 node와 node의 1:1 관계에서 그친다면 이 네트워크에서 토폴로지는 1:1 Link이상에서 의미를 갖지 못한다. 즉, 네트워크가 아니다. 그래서 node와 node를 연결한 link가 이 둘의 관계에서만 유효한 것이 아닌 그 이상의 관계에 영향을 줄 수 있어야 비로소 네트워크라는 관점을 도입하는 것에 의미가 있다. Node와 node를 연결한 link가 그 이상의 관계에 영향을 줄 수 있는 상황으로는 두 가지 상황을 생각해볼 수 있다. 먼저, link를 통해 전달되는 물질의 속성이 link를 이동하면서도 보존되는 상황을 생각해 볼 수 있다. 예를 들면, 정보, 물류, 돈과 같은 것들을 .. 2021. 7. 18.
[뉴스 가시화] 네이버 랭킹 뉴스 키워드 네트워크 가시화 - 2월 1월 네트워크 가시화로 연습해 봤던 내용으로 2월 뉴스를 가시화. 이전 내용을 간략히 정리해보면) 1. 각 신문사에서 일별 랭킹 5의 뉴스 제목으로부터 키워드를 추출 2. 같은 제목에 있는 키워드 끼리 link 생성 3. link 정보로 부터 network 생성 4. network로부터 community 추출 5. gephi를 이용한 가시화 gephi 가시화에 몇가지 팁) 1. Filter 적은 수로 등장했던 Keyword 중에는 잘못 인식된 명사를 포함해서 의미 없는 내용이 많았다. 그래서 화면 오른쪽 Filters->Topology->Degree Range를 추가하고, Degree Range Settings의 threshold를 5로 두었다. link가 5개 이상인 node들만 가시화에 포함하겠다는 .. 2021. 3. 1.
[연습] 네이버 랭킹 뉴스 가시화 with Python & Gephi 가짜뉴스와는 별개로 현재 뉴스로 부터 키워드들을 가시화 해보는 과정을 해보고 싶어서 예제를 작성해 보았다. 목표는 네이버에서 제공하는 2021년 1월 언론사별 랭킹뉴스를 긁어와서 title로부터 주요 keyword를 추출하고, network를 구성하여 가시화 하는 것이다. 시작. 정보를 긁어올 페이지는 다음 페이지다. news.naver.com/main/ranking/popularDay.nhn?mid=etc&sid1=111 랭킹 : 네이버 뉴스 언론사별로 집계한 일간 많이 본, 댓글 많은 기사 제공 news.naver.com 네이버 랭킹뉴스에서는 몇 십개의 언론사에서 많이 본 뉴스, 댓글 많은 뉴스 별로 랭킹 5까지를 종합해서 한눈에 볼 수 있도록 정보를 제공하고 있다. 목표는 여기의 title을 긁어오.. 2021. 1. 16.
[논문소개] 성장하는 네트워크의 시간 의존성 약 2년간 참여했던 프로젝트가 논문화 되었다. 개인적으로 성장하는 네트워크와 그 분석 방법에 대해 공부할 수 있는 좋은 기회였다. 간단히 설명하자면, 성장하는 network를 시간 의존적이지 않은 보편적 메커니즘을 통해 설명하려는 시도가 어떤 오해를 낳을 수 있는지 고찰한 논문이다. 네트워크 내에서 node들이 갖는 link의 수의 분포 (degree distribution) 를 그려보면, 멱함수 꼴의 두터운 꼬리를 지닌 분포가 자주 나타난다. 이는 주로 신규 유입된 node가 기존 node와 link를 형성할 확률 (attachment rate) 이 그 node의 link의 수에 비례할 경우 나타날 수 있다고 알려져 있다. 이를 설명하는 model로 바라바시 알베르트 (BA) 모델이 대표적이며, 이 메.. 2020. 6. 22.
[논문소개] Homophily and minority-group size explain perception biases in social network 네트워크라는 평면적이지 않은 복잡한 구조 속에서 일어나는 현상에는 어떠한 특징이 있을까? 이러한 질문은 복잡 네트워크를 연구하는 중요한 motivation 중 하나 일 것이다. 오늘 소개하는 논문 'Homophily and minority-group size explain perception biases in social network'은 사회에서 비주류(소수자) 그룹의 규모에 대한 인식이 그 사회의 구조에 기인할 수 있음을 설명하는 논문이다. 사회의 구성원은 그 특성에 따라 다수와 소수로 나누어질 수 있다. 예를 들면, 남성과 여성, 고소득층과 저소득층, 흡연자와 비흡연자와 같은 특성이 다양한 사회에서 다수자와 소수자로 나타날 수 있다. 이 때, 사회 구성원 간의 관계를 네트워크로 나타내면 끼리끼리 관.. 2019. 9. 4.
[네트워크이론] Label propagation algorithm for community detection 지금까지 다뤄온 community detection의 방식(Girvan-Newman, Louvain, Link community)에서는 일련의 반복 알고리즘을 수행하며, 가장 최적의 검출 상태를 추정하기 위해 Modularity 또는 Partitional density라는 지표를 이용했다. Label propagation은 Agglomerative(점점 덩어리를 불려나가는) 방식과 개념 면에서는 흡사하지만, 지표를 사용하지 않는다는 면에서 조금 차이가 있다. Label propagation 알고리즘에는 내가 속한 Community는 나의 주변 사람들이 속한 Community일 확률이 높다는 직관적이지만 강력한 개념이 담겨있다. 예를 들어, 'B'라는 community에 속한 node i의 주변 node들.. 2019. 8. 8.
[네트워크과학] 척도 없는 연결망 논란 고등과학원 웹진 HORIZON 김범준 교수님 투고글을 읽고. 최근 발표된 논문으로 척도 없는 연결망에 대한 논쟁에 불이 붙었다고 한다. 생각해보니 나도 척도 없는(scale-free) 연결망이라는 표현을 완전히 이해했다기보다는 알게 모르게 익숙해 진 것 같다. 척도 없는 연결망의 대표적인 성질은 "node가 지닌 이웃의 수(k)와 그러한 node들이 네트워크 속에서 차지하는 비율(P(k))의 거듭 제곱 관계"로 설명된다. 이러한 성질은 프랙탈처럼 직관적으로 이해할 수 있는 규모(scale)와 관련된 형질도 아니어서 그런지, 무엇을 의미하는지 쉬이 와 닿지 못했던 것 같다. 그래서 척도 없는 연결망에 대해 글로 정리해본다. 일반적으로 척도 없는 연결망을 설명할 때면, 연결망 속에서 이웃 수 k를 지닌 no.. 2019. 6. 5.
[네트워크과학] '네트워크이론'이란 무엇인가 네트워크이론은 언어이다. 상호작용이 이루어지는 공간을 기술하고, 그러한 상호작용을 이해하기 위한 언어이다. 모든 상호작용에는 우연과 선호성이 개입한다. 내가 누군가를 만나 이야기 하는 것은 어떤 우연과 어떤 선호적 요인이 작용한 것이다. 학교에서는 공통 관심사를 지닌 사람들이라는 카테고리 속에서 사람들을 만나고, 동네 수퍼마켓에서는 지역이라는 물리적 카테고리 속에서 사람들을 만난다. 그래서 상호작용, 특히 큰 단위의 상호작용을 기술하기 위해서는 대상이 어떤 구조 속에서 어떤 구조를 이루며 상호작용을 해나가는지 기술할 필요가 있다. 그 언어로 네트워크 이론이 이용되는 것이다. 네트워크 이론은 행렬이라는 단순한 도구를 이용한다. 이 도구는 네트워크의 장점이기도 하며, 단점이기도 하다. 네트워크는 모든 상호작.. 2018. 7. 5.
[네트워크이론] Network Assortativity (네트워크 동류성) 네트워크 구조에는 동류성(Assortativity)이라는 특징이 있다. 동류성은 같은 종류의 사람들끼리 뭉치는 경향을 나타낸다. 다음 그림을 보면 쉽게 이해할 수 있다. Assortative network(동류성 네트워크)에서는 link를 많이 가진 node 즉, hub는 hub들 끼리 뭉쳐있다(중심부). 또 적은 link를 가진 node들은 적은 link를 가진 node들 끼리 뭉쳐있다(외곽부). Disassortative network(비동류성 네트워크)에서는 link를 많이 가진 node와 link를 적게 가진 node들이 연결되어있다. 이렇게 Assortativity는 네트워크의 구조를 결정하는 중요한 요소이다. 같은 degree분포의 network 여도 assortativity와 같은 특징들은 .. 2018. 7. 4.