Please enable JavaScript!
Bitte aktiviere JavaScript!
S'il vous plaît activer JavaScript!
Por favor,activa el JavaScript!
antiblock.org

반응형

P-Values

image from: xkcd.com


얼마 전, 학교 전산실에서 "통계 표본크기 산출" 주제의 세미나를 듣고 왔다.


???: "요즘 high IF journal에 논문 섭미션할때 그냥 p-value만 들이대면 리뷰오고 통계로 까이고 그러면 리젝받고. 그러면서도 리뷰어에게 허벌나게 치욕적 비난받고 낮은 IF 저널에 냅니다. 온코타겟을 살"(...)


결국 관건은, 통계 검정력을 위한 표본 숫자를 정확하게 계산해서 제시해야 논문 피어 리뷰어도 납득할거라는 얘기인듯 하다. 최근 들어 의학 및 심리학 논문들에서 재현성 위기 (https://en.wikipedia.org/wiki/Replication_crisis) 때문에 엄청 난리였는데, 잘못된 통계 검증 때문에 연구 자체의 유의성이 잘못 설정되어 실제로 그 연구들을 다시 수행해 보았을 경우 재현성이 나오지 않는 경우가 엄청 많았다고 한다. 특히 생물학의 경우 조사 대상의 약 80% 가까이 다른 논문의 방법을 따라했을 경우 결과 재현에 실패한 경험이 있고, 약 60%의 연구자는 심지어 본인의 실험 재현에도 실패한 적이 있다고 하더라(...).


그 이유로 생각해볼 만한 것이, 통계적 연관성이 인과성을 대표하지 않기 때문에 외부 조건에 따라 다른 결과가 나올 경우도 있겠지만, 많은 경우 통계적 계산을 잘못 적용하거나 너무 약한 통계검정을 사용하여 잘못된 통계치를 근거로 유의성을 주장했기 때문인 것으로 보인다.


그래서 요즘같은 경우에는 p-value (귀무가설이 참일 경우에도 이를 기각하는 결과가 나타날 확률) 만으로는 부족하고, 통계적 검정력 및 그에 입각한 표본 갯수 설정 과정도 요구하는 저널이 많아지고 있다. 앞으로 이에 대해 많이 공부해야 할듯 하다.


[Sample size 결정을 위한 effect size 결정]


Cohen's d : 표준화된 효과크기=실제 효과크기/표준편차

<0.4: 작은 효과크기

0.4-0.7: 중간 효과크기

>0.7: 큰 효과크기


여기서 G-Power 라는 프로그램이 실험군당 표본 수 결정을 계산하는 데 도움이 된다고 한다. (https://en.wikipedia.org/wiki/G*Power)


참고:

https://cs.kaist.ac.kr/colloquium/files/20161031.pdf

반응형
반응형

네이버에서 카오스재단과 공동으로 강연회 시리즈를 기획하여 진행하고 있는데, 그중 이 강연은 이전에 소개한 앨런 소칼의 소위 '지적 사기'와도 관련이 있는 내용이라 흥미롭다. 



1부에서는 서울대학교 물리천문학부 오세정 교수가 강연을 진행하며 96년도에 벌어졌던 포스트모던 과학지식사회학에 대한 물리학자 앨런 소칼의 가짜논문 사건도 다루고 있다. 당시 이에 관려하여 오세정교수가 참여한 언론 지면상의 토론이 있었으며, 그에 대한 오세정 교수의 자세한 부가 설명도 들을 수 있다. 이후 2부의 토론 파트에서는 서울대학교 생명과학부 홍성욱 교수(과학사 및 과학철학 전공)와 카이스트 물리학과 정하웅 교수가 참여하고 있다.


[열린 연단: 문화의 안과 밖 강연 시리즈] - 2014 오늘의 시대에 대한 문화적 성찰


오세정 서울대 물리천문학부 교수는 "그 동안 과학은 주로 '경제 발전을 위한 도구'라는 인식이 강했다"고 전제한 뒤 "미래만이 아니라 현재 우리가 부딪히는 사회의 많은 문제들도 과학기술적 요소를 포함하고" 있는 상황에서, 그 어느 때보다 "올바른 과학 정신에 대해 교육하는 일"이 중요한데 "특히 구체적인 과학적 지식을 많이 가르치는 것보다는 과학 지식이 객관적으로 얻어지는 과정과 그 사고방식을 가르치는 것이 더욱 중요하다"라고 강조했다. 그와 동시에 "과학자들이 인문학적 지식을 갖는 것도 더욱 절실해질 것"이라고 말했다.



1부 강연: 오세정 서울대 물리천문학부 교수


오세정 : 우리가 사실은 한국에서 과학기술의 의미를 한 번, 다시 한 번 살펴봐야 할 때는 됐다고 생각을 해요. 여태까지는 사실 우리나라의 제일 큰 문제 중의 하나가, 소위 과학문화가 거의 없다는 게 커다란 문제라고 생각을 하고 있었거든요. 그러니까 예를 들어서 서구 같은 경우에는, 특히 미국 같은 경우에는 과학 프로그램, TV프로그램도 굉장히 인기 있는 것들이 많고 ‘칼 세이건의 코스모스’ 같은 건 엄청나게 많은 사람들이 시청을 했고 책도 많이 팔렸고요. 그런데 우리나라에서는 과학책을 쓰더라도, 과학에 관한 일반 대중의 책을 쓰더라도 어려운, 굉장히 일반 대중들이 과학에 대한 관심이 없고 그런 것들이 커다란 문제라고 생각을 했습니다. 그리고 학생들 아니면 제 친구들한테도 물어보면, 과학을 전공하지 않은 친구들한테 들어보면 고등학교 때 정말 힘들었던, 공부하면서 힘들었던 기억밖에는 없다 그러거든요. 그러니까 우리나라의 입시 위주의 교육 때문에 아주 지겹게 공부를 하고 나오자마자, 그게 이제 다 해방이 되자마자 과학 쪽은 쳐다보지도 않는다 하는 사람이 굉장히 많은 것 같아요. 그러다 보니까 사실은 현대사회가 과학적으로 변해가면서 사회 자체가 많이 변해가는데 그 흐름을 별로 잘 따라가지도 못하는 것 같고 과학기술이라는 게 그냥 ‘이거는 전문가들이 하는 것’ 이렇게 받아들이시는 분들이 굉장히 많은 것 같습니다. 실제로 정부도 좀 그런 역할을 한 편이고요.


2부 토론 – 홍성욱 교수, 정하웅 교수





김상환(사회) : 오세정 선생님 말씀에 이어서 지금부터는 질문과 토론 시간, 한 시간 정도의 여유를 가지고 질문과 토론 시간을 갖도록 하겠습니다. 시작하기 전에 지정 토론자로 모신 두 선생님을 소개해드리겠습니다. 먼저 홍성욱 교수님 올라와 계신데요. 서울대학교를 졸업하시고 동 대학원에서 과학사 및 과학철학 협동과정에서 박사학위를 하셨습니다. 현재는 서울대학교 생명과학부 교수를 맡고 계십니다. 그 옆에는 정하웅 선생님 올라와 계십니다. 서울대학교 물리학과를 졸업하시고 대학원에서 석사, 박사를 다 이수하셨는데요. 현재는 한국과학기술원 물리학과 KAIST-지정석좌교수님으로 계십니다. ‘복잡계 네트워크’라는 새로운 연구 분야를 개척하시는 젊은 과학자이십니다.


홍성욱 : 우리나라에 지난 몇 년 동안 기초과학에 대한 지원이 퍼센티지로 봤을 때 상당히 증가를 했습니다. 그 중에 상당부분은 기초과학 그 자체에 대한 지원이기보다는 기초연구에 원천연구라는 것을 더해서 그 둘을 기초과학에 대한 지원의 카테고리로 묶어버린 측면이 있습니다. 원천연구의 상당 부분은 그 전에 응용연구라고 분류가 되던 그런 부분을 가지고 온 겁니다. 퍼센티지로는, 예를 들어서 30%에서 50% 정도 증가를 했는데, 실질적인 내용상의 증가는 없습니다. 숫자놀음 비슷한 상태였고요. 문제 중의 하나는 리서치는 리서치대로, 개발연구는 개발연구대로 그냥 둘 수만은 없는 상황입니다.


정하웅 : 저는 아주 그냥 쉬운, 그러니까 일반인들이 생각하는 그리고 오늘 주제가 과학과 문화인데 과학에 대해서만 너무 치중된 것 같아서 문화에 대한 얘기를 조금 더 드리려고 합니다. ‘열린연단 : 문화의 안과 밖’ 홈페이지 가보시면 알겠지만 이 열린연단의 목적이 우리 문화를 체계적으로 조망하고 토론한다라고 되어있습니다. 문화의 정의는 학문, 문화, 예술, 여론 등을 포함하는 상황의 전체적인 지표라고 되어있습니다. 그래서 이러한 주제에 대한 객관적이고 엄밀한 검토를 하려고 한다라고 하는 게 주제입니다. 정의를 해야겠는데 제 짧은 지식으로 정의를 하는 건 아닌 거 같아서 그리고 문과 분들의 특성을 따르기 위해서 여기 문과 분들이 많이 계시니까요. 문과 분들의 방식을 따라보겠습니다.


반응형
반응형



위는 앨런 소칼의 소위 '지적 사기 사건'에 대해 작가 클리포드 골드스타인이 설명해주는 동영상이다.

90년대 초중반, 과학지식에 대한 포스트모던적 사회구성주의가 철학계에서 유행하여 인지의 불완전함에 따르는 지식의 상대성을 앞세워 과학 지식 또한 사회적 구성에 따른 상대적 지식이라는 주장이 대두되어 현실의 객관적 실체를 인정하는 실재론자들 및 방법론적 자연주의를 따르는 과학자들과의 논쟁이 점점 격해지고 있었다.

당시 포스트모던 사회구성주의 철학 저널인 [Social Text]에서 과감하게 피어 리뷰를 생략하고 이 주제를 다룬 "과학 전쟁" 특별편을 준비하고 있었는데, 거기에 앨런 소칼이 포스트모더니즘적인 용어를 사용해서 포스트모더니즘을 편들어주는 척 아무말 대잔치를 해놓은 가짜논문을 제출해서 게재된 뒤, [Lingua Franca]라는 다른 저널에서 이를 폭로한다.


이 일로 [Social Text]지는 1996년에 이그노벨 문학상을 수상하게 된다. 참고로 이그노벨상은 노벨상 패러디 목적으로 "흉내낼 수 없거나 흉내내서는 안되는" 업적에 수여하는 상이다. 작년 상금은 10조 짐바브웨 달러이며 미국 달러로 환산하면 약 4달러 정도 된다.

"LITERATURE: The editors of the journal Social Text, for eagerly publishing research that they could not understand, that the author said was meaningless, and which claimed that reality does not exist. (문학상: Social Text 저널의 편집인은, 실재는 존재하지 않는다고 주장한, 저자 본인이 아무 의미 없다고 말한, (편집인) 본인이 이해도 못한 연구를 기꺼이 출판하였기에 이 상을 수여함)"

사실, 소칼은 그 '논문' 내용 내내 '이건 가짜로 만든 아무말 대잔치다'라는 떡밥을 계속해서 던졌다고 한다.

영상에 나온 내용도,

“알튀세르가 바르게 말했듯이, ‘라캉은 결국 프로이드의 사상에 대해 그것이 필요로 하는 과학적 개념을 주었다.’ 더 최근에는, 라캉의 <위상기하학>은 영화평론 및 에이즈(AIDS)에 대한 정신분석에도 성공적으로 적용되었다. 수학적 용어로 말하자면, 라캉이 말하길 구체의 최초 호몰로지 그룹은 사소한 것이며, 반면 다른 표면의 호몰로지는 심오하다. 또한 이 호몰로지는 1-2회 이상의 절단 이후 표면의 연결성 또는 단절성과 결부되어 있다."

...라고 하면서 이상한 말을 중간중간 많이 섞어넣었다. (뒤의 'initial homology'는 라캉이 정말로 말했던 헛소리를 그대로 인용한거지만.) 

그밖에도,

"It is not clear to me that complex number theory, which is a new and still quite speculative branch of mathematical physics...."

즉, 복소수 이론을 "수리물리학에서 새롭고 사변적인 분야"라고 주장(?)하기도 했다. 

그렇다면, 과학자가 이런 '가짜 논문'으로 포스트모던 철학자들을 글자 그대로 '엿먹이는' 것이 과연 무슨 의미가 있을까? 

철학 하는 사람들이 과학에 대해서 정말 말도 안되는 헛소리를 할 때가 많은 것이, 원래의 개념을 비틀어 사용했다는 명시도 없이 원저자를 인용해서 개념 설명을 하면서 원뜻을 전혀 엉뚱하게 왜곡해버리곤 한다. 그런 과정에서 나오는 주장들이 가령 "뉴튼의 프린키피아는 강간 매뉴얼이다(Sandra Harding)"라든가, 또는 물리법칙에서의 기준계와 기호학에서의 행위자를 혼동하고서 "상대성 이론은 사회학적 함의를 갖는 이론이다(Bruno Latour)"라면서 개념을 섞어버리는 것이다.

말하자면, 과학에서 특정 개념을 따와서 기본적인 개념 자체를 원래의 의미와 다르게 적용하는 것까지는 좋지만, 그렇다 하더라도 애초에 원래의 의미와 다른 방식으로 (비유적으로 또는 analogy로) 사용되었다고 명시하든지 아니면 적어도 그게 무슨 뜻인지는 제대로 알고서 사용해야 독자나 청자가 오개념을 갖거나 본의를 오해하는 일 없이 분명한 의미 전달이 될 수 있는 것이다. 

그러나, 위와 같은 식으로 특정 기본 개념에 가치판단적인 개념을 섞어버리고서 원래의 개념을 왜곡해 버리는 것은 결국 말장난에 불과한 것 아닐까. 예를 들어,

"E=mc^2는 필요한 다른 속도에 비해 빛의 속도에 특권적 지위를 주어 우선권을 행사하도록 하는 성차별적 공식이다." 
- Luce Irigaray

...와 같은 '아무말 대잔치'가 된다는 이야기다. 그렇기 때문에 심지어 노벨문학상 받은 앙리 베르그송 같은 사람도 아인슈타인이랑 "시간"의 개념에 대해 논쟁하다가 틀린 개념 갖고 망신이나 당하는 것 아니겠는가. 철학적 개념을 물리학적 법칙에 빗대서 설명하려는데, 원래의 개념 자체를 이해하지 못하고 틀리게 적용하는 바람에 이런 사태가 벌어지게 된다. 

무릇 과학에서는 특정 개념이 정해지면 그것을 왜곡하지 않고서 그 개념을 기초로 논리와 사고를 진행하게 된다. 그런데 그 기본적인 용어의 개념 자체를 왜곡해서 비틀어 버리면 그건 제로존 이론이나 지적설계론처럼 틀린 개념을 전제로 썰을 풀어나가는 아무말 대잔치가 될 수밖에 없다. 극단적 상대주의를 표방하는 특정 과학철학자들은 그것조차 하나의 '정당한 과학적 가설'로 취급하긴 하지만, 그것이 널리 받아들여지기는 곤란하다고 생각한다.

관련 읽을거리:



관련글: 2017/08/30 - [과학] - [네이버 열린연단] 과학과 문화: 문화에 있어서의 과학의 위상 (오세정 교수)



반응형

+ Recent posts