본문 바로가기

네이버3

[Neo4j] Graph Apps (Bloom, NeoDash), 알고리즘 (pagerank, community detection) P1. 기존 데이터 이식 P2. 데이터베이스 언어 (Cypher) P3. Graph Apps - Neo4j Bloom (가시화), NeoDash (Feature 트래킹) P4. graph data science - 알고리즘 (ex: pagerank, community detection) P5. Gephi와 연동, Large network 가시화 P6. Python 프로그램과 연동, 주기적 DB 업데이트 *굵게 표시한 목표는 이 글에서 다루는 내용 이번 글에서는 Neo4j 내부 GraphApps들과 알고리즘을 다뤄보겠다. Graph Apps 설치법 Graph Apps는 Neo4j Desktop 왼쪽 상단 아이콘 중 제일 아래를 누르면 확인해볼 수 있다. 기본으로 몇가지 앱이 있고, 원하는 App은 Grap.. 2021. 3. 5.
[Neo4j] 그래프를 다루는 데이터베이스 - 도입 P1. 기존 데이터 이식 P2. 데이터베이스 언어 (Cypher) P3. Graph Apps - Neo4j Bloom (가시화), NeoDash (Feature 트래킹) P4. graph data science - 알고리즘 (ex: pagerank, community detection) P5. Gephi와 연동, Large network 가시화 P6. Python 프로그램과 연동, 주기적 DB 업데이트 *굵게 표시한 목표는 이 글에서 다루는 내용 이것 저것 가지고 놀다 보니 뉴스 관련 데이터들이 한달의 기간을 넘어가면 점점 pandas나 csv로 다루는데 한계가 있다는 것을 느꼈다. 해서 그래프 데이터를 다룰 수 있는 데이터베이스 관리 시스템인 Neo4j를 배워보기로 했다. 준비 다음 사이트에서 Neo4.. 2021. 3. 5.
[뉴스 가시화] 네이버 랭킹 뉴스 키워드 네트워크 가시화 - 2월 1월 네트워크 가시화로 연습해 봤던 내용으로 2월 뉴스를 가시화. 이전 내용을 간략히 정리해보면) 1. 각 신문사에서 일별 랭킹 5의 뉴스 제목으로부터 키워드를 추출 2. 같은 제목에 있는 키워드 끼리 link 생성 3. link 정보로 부터 network 생성 4. network로부터 community 추출 5. gephi를 이용한 가시화 gephi 가시화에 몇가지 팁) 1. Filter 적은 수로 등장했던 Keyword 중에는 잘못 인식된 명사를 포함해서 의미 없는 내용이 많았다. 그래서 화면 오른쪽 Filters->Topology->Degree Range를 추가하고, Degree Range Settings의 threshold를 5로 두었다. link가 5개 이상인 node들만 가시화에 포함하겠다는 .. 2021. 3. 1.