본문 바로가기

공부/가짜 뉴스12

[사례] Facebook 친구 관계를 통해 미국 행정구역 (County) 간의 사회적 연결 지수를 가시화 - 뉴욕타임즈 업샷 개인적으로 감탄을 하며 재미있게 읽은 인터랙티브 기사가 있어 공유. https://www.nytimes.com/interactive/2018/09/19/upshot/facebook-county-friendships.html (유료 구독자가 아닐 경우, 매월 볼 수 있는 횟수에 한도가 정해져 있는 듯 하다..) Facebook의 친구 관계를 통해 미국 행정구역 (County) 간의 사회적 연결 지수를 가시화 한 기사이다. 이 가시화 작업을 통해 꽤 많은 사실들을 확인할 수 있다고 한다. 간단히 요약해보면 다음과 같다. 사회적 연결에는 "거리가 중요하다" - 동질성 높은 행정구역들 보다 물리적 위치가 더 강하게 나타난다 주(state)의 경계선이 뚜렷히 나타난다 - 미국에서 주(state)는 꽤나 강력한 사.. 2022. 5. 13.
[next-js] 프로젝트 셋업 (with typescript & tailwindcss) powershell에서 원하는 dir로 이동 후, npx create-next-app@latest --typescript 설치 중간에 프로젝트 명 입력. vs code 로 프로젝트 열기 code 프로젝트명 README.md 수정 index 내용 다 날리기 다음, vs code terminal에서 tailwind 설치 npm install -D tailwindcss postcss autoprefixer 다음 tailwindcss setup npx tailwindcss init -p postcss.config, tailwind.config 파일이 생성된 것을 확인 tailwind.config.js로 가서 코드 내용을 다음과 같이 수정 module.exports = { content: [ "./pages/**.. 2022. 5. 7.
[Django Rest Framework] pycharm 환경에서 개발 세팅하기 Django Rest Framework는 Django 안에서 RESTful API 서버를 쉽게 구축할 수 있도록 도와주는 오픈 소스 라이브러리 라고 한다. 참고: https://yunhookim.tistory.com/7 https://proglish.tistory.com/53 세팅: 1. 프로젝트 폴더를 생성 2. pycharm에서 해당 폴더를 open 3. venv 설치 File -> Settings -> Project -> Python interpreter에서 톱니바퀴 눌러서 생성 4. 화면 아래에서 Terminal을 누르고 venv 를 activate 5. django REST framework 패키지를 설치 pip install django djangorestframework 6. 프로젝트 생성 .. 2022. 2. 3.
[메타 언론 플랫폼] 전반적인 계획 (+ Github pages 호스팅 예제) 기존 뉴스 플랫폼의 시간 순(list type), 랭킹 순(Highlight type)의 한계를 넘어, 다양한 뉴스들로의 접근성을 높이기 위한 방안으로 network type의 도입이 적절하지 않을까 하는 동기에서 작은 프로젝트를 생각 중이다. 이를 위해 서는 뉴스를 크롤링하고, 가시화 하기 위한 알고리즘을 거쳐, 우리가 접할 수 있는 형태의 플랫폼으로 제공할 필요가 있다. 쉽게 말하면 자동화된 메타 언론 플랫폼을 만드는 것이 목표다. 지금까지는 주로 크롤링과 가시화 알고리즘에 대한 기반을 공부 해 왔는데, 동시에 이를 배포할 수 있는 방법에 대한 공부도 필요하다. 웹이나 앱에 대해 전혀 모르기 때문에, 힘든 여정이 될 것 같다. 대략 생각하는 공부내용은 다음과 같다. -백엔드 Neo4j, python .. 2021. 3. 24.
[Neo4j] Gephi와 연동, large network 가시화 P1. 기존 데이터 이식 P2. 데이터베이스 언어 (Cypher) P3. Graph Apps - Neo4j Bloom (가시화), NeoDash (Feature 트래킹) P4. graph data science - 알고리즘 (ex: pagerank, community detection) P5. Gephi와 연동, Large network 가시화 P6. Python 프로그램과 연동, 주기적 DB 업데이트 *굵게 표시한 목표는 이 글에서 다루는 내용 오늘 글의 목표는 1. Gephi에서 Data를 받는 Server를 열고, 2. Neo4j DBMS에서 Gephi로 network data를 스트리밍해주는 것 이다. Gephi는 Neo4j APP에서는 다룰 수 없는 아주 큰 network를 가시화 하기 위해 필.. 2021. 3. 5.
[Neo4j] Graph Apps (Bloom, NeoDash), 알고리즘 (pagerank, community detection) P1. 기존 데이터 이식 P2. 데이터베이스 언어 (Cypher) P3. Graph Apps - Neo4j Bloom (가시화), NeoDash (Feature 트래킹) P4. graph data science - 알고리즘 (ex: pagerank, community detection) P5. Gephi와 연동, Large network 가시화 P6. Python 프로그램과 연동, 주기적 DB 업데이트 *굵게 표시한 목표는 이 글에서 다루는 내용 이번 글에서는 Neo4j 내부 GraphApps들과 알고리즘을 다뤄보겠다. Graph Apps 설치법 Graph Apps는 Neo4j Desktop 왼쪽 상단 아이콘 중 제일 아래를 누르면 확인해볼 수 있다. 기본으로 몇가지 앱이 있고, 원하는 App은 Grap.. 2021. 3. 5.
[Neo4j] 그래프를 다루는 데이터베이스 - 도입 P1. 기존 데이터 이식 P2. 데이터베이스 언어 (Cypher) P3. Graph Apps - Neo4j Bloom (가시화), NeoDash (Feature 트래킹) P4. graph data science - 알고리즘 (ex: pagerank, community detection) P5. Gephi와 연동, Large network 가시화 P6. Python 프로그램과 연동, 주기적 DB 업데이트 *굵게 표시한 목표는 이 글에서 다루는 내용 이것 저것 가지고 놀다 보니 뉴스 관련 데이터들이 한달의 기간을 넘어가면 점점 pandas나 csv로 다루는데 한계가 있다는 것을 느꼈다. 해서 그래프 데이터를 다룰 수 있는 데이터베이스 관리 시스템인 Neo4j를 배워보기로 했다. 준비 다음 사이트에서 Neo4.. 2021. 3. 5.
[뉴스 가시화] 네이버 랭킹 뉴스 키워드 네트워크 가시화 - 2월 1월 네트워크 가시화로 연습해 봤던 내용으로 2월 뉴스를 가시화. 이전 내용을 간략히 정리해보면) 1. 각 신문사에서 일별 랭킹 5의 뉴스 제목으로부터 키워드를 추출 2. 같은 제목에 있는 키워드 끼리 link 생성 3. link 정보로 부터 network 생성 4. network로부터 community 추출 5. gephi를 이용한 가시화 gephi 가시화에 몇가지 팁) 1. Filter 적은 수로 등장했던 Keyword 중에는 잘못 인식된 명사를 포함해서 의미 없는 내용이 많았다. 그래서 화면 오른쪽 Filters->Topology->Degree Range를 추가하고, Degree Range Settings의 threshold를 5로 두었다. link가 5개 이상인 node들만 가시화에 포함하겠다는 .. 2021. 3. 1.
[연습] 네이버 랭킹 뉴스 가시화 with Python & Gephi 가짜뉴스와는 별개로 현재 뉴스로 부터 키워드들을 가시화 해보는 과정을 해보고 싶어서 예제를 작성해 보았다. 목표는 네이버에서 제공하는 2021년 1월 언론사별 랭킹뉴스를 긁어와서 title로부터 주요 keyword를 추출하고, network를 구성하여 가시화 하는 것이다. 시작. 정보를 긁어올 페이지는 다음 페이지다. news.naver.com/main/ranking/popularDay.nhn?mid=etc&sid1=111 랭킹 : 네이버 뉴스 언론사별로 집계한 일간 많이 본, 댓글 많은 기사 제공 news.naver.com 네이버 랭킹뉴스에서는 몇 십개의 언론사에서 많이 본 뉴스, 댓글 많은 뉴스 별로 랭킹 5까지를 종합해서 한눈에 볼 수 있도록 정보를 제공하고 있다. 목표는 여기의 title을 긁어오.. 2021. 1. 16.