본문 바로가기

공부150

[통계] 베이지안 회귀분석 - 계층적선형모델(HLM) with PyMC3 계층적 선형 모델(Hierarchical linear mode)은 관측한 표본 데이터에 계층 구조가 있을 경우 적용해볼 수 있는 모델이다. 예를 들면, 전국에서 학생들의 특징(x)과 성적(y)에 관해 데이터를 모았다고 해보자. 이 때 나타나는 x와 y의 관계만으로는 올바른 설명이 이루어 질 수 없다. 전국에서 추출한 학생들의 특징은 '학생-반-학교-지역'으로 이루어 지는 계층 구조에 속해 있다. 이렇게 보면 전체 데이터에 나타난 집단 수준(반, 학교, 지역)의 차이에 의해 x와 y의 관계를 올바로 예측할 수 없다. 그래서 등장한 것이 계층적선형모델이다. 특히 오늘 소개할 베이지안 회귀분석을 이용한 계층적선형모델에서 유명한 예는 Gelman과 Hill에 의한 집으로 침투하는 라돈(Radon) 함유량 연구다.. 2020. 8. 30.
[통계] 베이지안 회귀분석 - 선형모델 with PyMC3 python 패키지인 PyMC3을 이용, 지난 글에서 소개한 베이지안 회귀분석을 해보는 예제를 정리해본다. PyMC3은 베이지안 회귀를 이용한 다양한 모델링을 가능케 해주는 package다. 사용법도 쉽고, 무엇보다 홈페이지에 다양한 예제가 자세히 소개 되어 있다. Install 시, 주의사항은 python3.6 보다 높은 버전에서는 에러가 난다는 점. python3.6 버전에서 설치하는 것이 안정적이다. (홈페이지에서도 그렇게 언급하고 있다.) PyMC3는 theano를 기반으로, PyMC4는 tensorflow를 기반으로 동작한다고 한다. 예제 데이터 생성 $y = 2x + 1 + \epsilon$ 위와 같은 모델을 통해 예제 데이터를 생성한다. 이 때, 기울기 $\theta_{1}$는 2, 절편 $.. 2020. 8. 28.
[통계] 베이지안 회귀분석 회귀는 데이터로부터 모델을 추정하는 한 방법이다. 최소자승법이 잔차를 최소화 시키는 방법이라면, 베이지안 회귀는 가능도 최대화가 목적이다. 이 글의 최종 목표는 베이지안 회귀의 원리를 이해하고, python package인 pymc3을 활용까지 다뤄보는 것이다. 이번 포스팅에서는 우선 원리를 이해하는 것을 목표로 한다. 모델 가장 기본적인 선형 모델은 다음과 같이 쓸 수 있다. $y = \theta_{1}x + \theta_{2}$ + $\epsilon$ 이 때 $\theta_{1}$, $\theta_{2}$는 모델의 파라미터, $x$, $y$는 관측 값, $\epsilon$은 오차를 나타낸다. $x$, $y$라는 관측값으로 부터 $\theta_{1}$, $\theta_{2}$를 추정해 나가는 것이 목표.. 2020. 8. 28.
[통계] 베이즈 추론 우리는 우리가 직접 알 수 없는 것들에 대해서 추론할 때, 모델을 상정하고 관측을 한다. 베이즈 추론은 관측이 추론으로 이어지는 과정을 담고 있다. 먼저, 베이즈 추론의 바탕이 되는 베이즈 정리를 살펴보자. 베이즈 정리는 사건 A와 B의 교집합의 확률에 관점을 부여하며 의미를 갖는다. A와 B의 교집합의 확률은 A와 B에게 있어서는 다음과 같다. $P(A{\cap}B) = P(A|B)P(B) = P(B|A)P(A)$ 이 공통 사건에 'B라는 조건에서 A가 발생할 확률'이라는 관점을 부여하면 다음과 같이 표현되고, 이를 베이즈 정리라고 부른다. $P(A|B) = \frac{P(A{\cap}B)}{P(B)} = \frac{P(B|A)P(A)}{P(B)}$ 베이즈 추론에서는, 위의 정리에서 관측할 수 있는 것.. 2020. 8. 27.
[논문소개] 성장하는 네트워크의 시간 의존성 약 2년간 참여했던 프로젝트가 논문화 되었다. 개인적으로 성장하는 네트워크와 그 분석 방법에 대해 공부할 수 있는 좋은 기회였다. 간단히 설명하자면, 성장하는 network를 시간 의존적이지 않은 보편적 메커니즘을 통해 설명하려는 시도가 어떤 오해를 낳을 수 있는지 고찰한 논문이다. 네트워크 내에서 node들이 갖는 link의 수의 분포 (degree distribution) 를 그려보면, 멱함수 꼴의 두터운 꼬리를 지닌 분포가 자주 나타난다. 이는 주로 신규 유입된 node가 기존 node와 link를 형성할 확률 (attachment rate) 이 그 node의 link의 수에 비례할 경우 나타날 수 있다고 알려져 있다. 이를 설명하는 model로 바라바시 알베르트 (BA) 모델이 대표적이며, 이 메.. 2020. 6. 22.
[정리] 참고사이트 네트워크 과학 공부에 즐겨보는 참고 사이트를 몇 개 추려보았다. 1. http://networksciencebook.com/ 바라바시가 만든 네트워크 교육용 사이트다. 아주 가볍지 않게 그리고 아주 무겁지 않게 내용들이 잘 추려져 있다. 처음 네트워크 과학을 접한다면 쭈욱 훑어보는 것 만으로 굉장히 많은 것을 알 수 있는 좋은 사이트다. 2. https://twitter.com/net_science 한 네트워크 연구자가 운영하는 트위터 계정으로, 새로 나온 네트워크 과학 관련 논문들을 꾸준히 소개해주는 채널이다. 새로운 연구와 동향을 알기에 좋은 채널! 3. https://www.youtube.com/user/lshlj/ 네트워크 과학을 소개하는 우리나라 말로 나오는 거의 유일한 채널이다. 코로나 사태로.. 2020. 6. 2.
[논문소개] A Wandering Mind Is an Unhappy Mind Wander에는 '거닐다', '헤매다', '다른데로 가다'와 같은 의미가 있다. Mind wandering이란 현재 하고 있는 것과 관련되지 않은 무언가를 생각하는 것이다. 예전 글에서 잠깐 언급해본 적이 있다. Mind wandering이 우리의 마음에 어떤 영향이 있는지 대량의 데이터를 통해 분석한 논문이 있어 소개 글을 써본다. 저자는 TED 강연에도 자주 등장하는 연사로서도 유명한데, 그래서 그런지 논문 제목부터 강력하다. "A wandering mind is an unhappy mind" Mind wandering은 '자극과 독립된 생각'이다. 이는 사람의 학습, 사유, 계획을 가능케 하는 진화적 산물이지만, 감정의 소모가 수반될 수 있다고 여겨져 왔다. 실험실의 통제된 상황에서 진행된 연구나,.. 2020. 6. 1.
[개념] 심리적 안전감 (Psychological safety) "어떤 사람도 자신이 안전하다고 느끼지 못하다면, 최고의 퍼포먼스를 낼 수 없다" 심리적 안전감은 조직에서 자신의 발언이 무시를 받거나, 발언에 의해 처벌 받거나, 창피를 당하거나, 강하게 비판 받지 않을 것이라는 믿음이다. 이러한 믿음이 있어야, 활발히 비판도 하고, 기여도 하고, 새로운 과제에 도전도 해볼 수 있고, 이런 환경에서 조직원들은 배울 수 있고, 더 나은 성과를 낼 수 있다. 심리적 안전감이라고 정의 되고 연구되는 분야의 특수성은 그 대상을 개인에 두지 않고 조직에 둔다는 점이다. 여기서 정의하는 것은 조직적인 안전감이다. 왜 굳이 조직일까? 여기엔 디테일이 있다. 바로 두려움이라는 것의 특성 때문이다. 내 발언이 무시되거나 처벌 받거나 비판 받을것에 대한 두려움은 개개인의 상호작용보다 여.. 2020. 5. 22.
[이런저런 연구들] Body illusion과 '정동' Body illusion이라는 현상을 연구하는 분야가 있다. 1. 자기 손을 가린 채로 가짜 손을 갖다 놓는다.2. 가짜 손과 진짜 손을 동시에 붓으로 문지른다. (진짜 손은 안 보이게 가린 상태, 가짜 손은 보이는 상태)3. 가짜 손을 갑자기 망치로 때린다4. 진짜 손을 맞지 않았는데도 놀란다 이 현상은 자신이 몸을 인식하는 과정이 여러가지 감각의 통합하는 과정에서 일어난다는 가설을 지지하며, 그 과정에 혼란을 주어 자신의 몸의 인식 과정에 혼란을 주는 것으로 해석된다. 그리고, 꼭 망치로 때리는 것 과 같은 충격을 주지 않아도 장기간(대체로 1분) 정도의 혼란을 통해 내 몸처럼 인식한다는 것이 질문지, 센서 등을 통해 연구되었다. 이 과정을 연구해서 자신의 몸이 아닌데도 자신의 몸처럼 느낄 수 있는 .. 2020. 5. 21.