나는 농담으로 과학을 말한다 - 오후

book

리뷰

저번 달에 읽은 책인데, 예전 노트북에 정리해놓은 걸 발견해서 올린다. 주제별로 챕터가 잘게 나눠져있어서 작가가 추천한대로 하루에 한 챕터씩 읽기좋다. 작가가 딱딱하지 않게 제목에서 알 수 있듯, 농담하듯이 내용을 풀어나가서 정말 재밌게 읽었다. 정리한 내용들은 북마크해둔 내기준 흥미로운 것 위주여서 모든 내용이 담겨있진 않다.

올빼미 버스

서울시에서 버스와 지하철이 운행하지 않는 심야 시간에 올빼미버스를 운영하기로 결정했다. 노선은 빅데이터를 활용하여 KT의 데이터를 활용해 정했다. 서울시를 1600의 구역으로 나눠 야간에 어느 구역에서 전화와 문자 사용이 많은지 파악하고, 휴대폰을 많이 사용하는 곳이 번화가일 확률이 높고 잠재 승객이 많을 것으로 예측하고 이를 출발지로 정한다. 목적지는 집일 것이라고 예상하고 휴대폰 통신사에 등록되어있는 고객의 주소지 데이터를 분석하여 설정하였다. 그 결과로 올빼미 버스 정류장이 500미터 내에 서울 시민 50% 가량이 거주하고 있다. 하지만 가난한 사람일 수록 도시 외곽이나 교통 환경이 좋지 않아 사람이 많이 살지 않는 지역에 거주할 확률이 높다. 그런데 데이터 사용량을 우선으로 노선을 만들면 이런 지역은 또 다시 소외딜 가능성이 높다. 서민을 위한 서비스에서 조차 최하층이 밀려나는 셈이다. 서울시 올빼미 버스는 제한된 자원을 효과적으로 활용한 매우 훌륭한 정책이지만 상대적으로 교통 소외 지역 주민을 더 가난하게 만든다. 도시 정책을 수림할 때 효율성 못지 않게 중요한 것이 약자를 고려하는 것인데 이 점에 대해서 보완책이 필요하다. 과연 약자를 보완하는 서비스가 도입될까? 하지만 지속적인 불황에서 사회 정책은 점점 효율성을 중시하는 방향으로 바뀌고 있다. 효율적인 빅데이터는 소수자를 배제하고 다수의 이익에 부합한다.

위는 전부 책에 있는 내용이다. 참 읽고 많은 생각을 하게 해준 구절이다. 왜 컴퓨터 공학과 교수님들이 공학도도 책을 많이 읽어야하는지 강조했는지 알았다. 이렇게 기술을 비판적으로 바라볼 수 있는 시각을 길러야겠다. 이 글을 읽은 다음에 곰곰이 생각해봤다. 어떻게 소외계층까지 포용할 수 있는지. 답은 쉽게 나오지 않았다. 내가 풀어야할 숙제를 만난 것 같다. 앞으로 프로젝트를 진행할 때도 소외계층에게 손을 내밀어줄 수 있는 프로젝트를 만들고 싶다. 그리고 기술의 발전에 따라서 벌어지는 격차를 해소하는 데에 도움을 줄 수 있는 사람이 될 것이다.

빅데이터의 예외

어느 순간 우리는 지도, 검색 엔진에 빠져 결정할 필요가 없어지고 있다. 세상의 모든 일은 할 수록 는다. 운동을 해야 근육이 늘어나는 것처럼 결정을 내리는 것도 마찬가지다. 세세한 부분에서 결정을 내렸던 경험이 결정적 순간에도 결정을 내릴 수 있게 도와준다. 빅데이터가 내놓은 결과를 비판적으로 수용할 필요가 있다.

이 부분을 읽으면서도 참 많은 생각이 들었다. 요새 본인이 결정장애라고 하는 사람들이 많아졌다. 이렇게 살다보면 우리가 주도하는 삶이 아닌, 끌려다니는 삶이 될 것이라는 생각이 들었다. 나만 해도 물건을 사거나 음식을 먹을 때 우선 목록을 보고 검색을 한 뒤에 결정한다. 이러한 상황이 반복되다보니 검색을 하지 않고는 결정하지 못하는 지경까지 이르렀다. 세세한 부분에서 결정을 내렸던 경험이 결정적 순간에 결정을 내릴 수 있게 도와준다는 작가의 말이 나를 찌르는 것 같았다. 생활 속에서 수많은 결정의 순간들을 마주하게 되는데 다른 무언가에 의지하지 않고 스스로 결단을 내리는 것을 점차 늘려가야겠다.

미국 대선을 정확히 예측한 구글

대다수 여론과 사전조사는 트럼프 vs 힐러리에서 힐러리를 대통령으로 지목했지만 구글만 트럼프로 예상했다. 구글은 검색량을 기준으로 이러한 결과를 발표했다. 여론조사는 모집단에 한계가 있지만 구글은 사용자가 비교할 수 없을 정도로 많다. 또한 여론조사에서 사람들은 거짓말을 할 가능성이 있지만 인터넷에서는 거짓말을 하지 않는다. 이는 투표 참여 여부를 묻는 조사에서 알 수 있다. 대다수의 사람들은 투표하는 것이 옳다고 생각하기 때문에 투표할 것이라고 응답한다. 그래서 실제로 투표는 안하지만 여론조사에선 투표한다고 응답하는 이들이 있는 것이다. 다시 구글의 예측결과 를 살펴보면, 샤이 트럼프라는 말이 있다. 이는 트럼프는 상식을 벗어난 말들을 많이 했기 때문에 트럼프를 지지한다고 말하지 않는 사람들을 뜻한다. 이러한 사람들이 인터넷 상에서는 숨기지 않기 때문에 구글이 대선 결과를 맞출 수 있던 것이다. 실제로 트럼프 지지율은 여론조사와 10% 차이가 났다고 한다.

엔그램 뷰어 링크

기존에 나와있는 책에 언급된 단어의 수를 통해 시대를 꿰뚫는 정보를 제공하는 것이다. 이는 사회의 변화를 매우 쉽고 정확하게 드러내며, 가끔은 우리에게 생각하지 못한 질문을 던지고 새로운 방향을 제시한다. 전혀 생각하지 못한 측면에서 발견한 빅데이터 분야였다. 아직 한국어 자료를 제공하지 않는다는데, 나중에 기회가 된다면 이와 관련된 프로젝트를 진행하고 싶다. 우리나라의 고전문학부터 시작해서 현대문학에 이르는 책들에서 언급된 단어의 수들을 정리해보면 흥미로운 흐름을 발견할 수 있을 것이다. 분야별로 정리해서 관심사에 맞는 내용들만 볼 수 있게한다면 더 좋을 것.

365일 24/7

하루

1년 중에 하루의 길이 변화 중 가장 짧은 날은 2월 12일(24시간에서 14분 부족)이고 가장 긴 날은 11월 3일(24시간에서 16분 김)이다.따라서 하루의 길이는 평균 값인 24시간으로 고정되었다.

1년

지구가 태양을 한바퀴도는 데에는 365일 5시간 48분 46초가 걸린다. 1년을 365일로 지정하니 약 6시간정도가 남는다. 6시간 남는 게 4년반복되면 하루가 차이나게 되니 이를 네번씩 모아 윤일을 만들었다. 이게 4년에 한번씩 찾아오는 2월 29일이다. 하지만 또 44분 56초의 오차가 생긴다. 따라서 400년에 백번 오는 윤일을 97번으로 변경한다. 4년에 한번씩 윤일을 지내지만 100년 단위에는 윤일을 넣지 않는다. 이렇게 되면 400년엔 4번 빠지기 때문에 400의 배수가 되는 해에는 윤일을 빼지 않는다. 어디서 많이 본듯한 내용인가했더니 알고리즘 문제로 접했던 내용이었다. 문제는 그냥 답만 나오면 되기때문에 내용은 자세히 보지 않았는데 이런 세심함이 담겨있는 것일 줄이야.. 더 재밌는 내용은 또 있다. 달력을 바로 잡은 그레고리는 이전 천년간의 오차를 바로 잡기로한다. 이전에는 교황 맘대로 늘이고 줄였다. 오차를 바로 잡기 위해서 열흘을 없애버린다. 그래서 1582년 10월 5일부터 10월 14일까지는 역사에 존재하지 않는다. 얼마나 교황의 힘의 강력했으면 열흘을 없애버릴 수 있었는지 지금은 있을 수 없는 일이라 신기하기만 하다.

2월 28일과 달의 이름

(유력한 가설 중의 하나) 율리우스력을 제정할 때 홀수달은 31일, 짝수달은 30일로 맞췄다. 이렇게 되면 1년은 366일이 된다. 그래서 2월의 마지막 날은 빼버린다. 하필 2월인 이유는 당시에 새해가 3월에 시작돼서이다. 율리우스는 새 달력에 자신의 흔적을 남기고 싶어 7월에 자신의 이름을 넣는다.(July) 그리고 조금이라도 빨리 취임하기 위해 기존 달력의 11월을 1월로 선포하고 새해로 정해버려서 모든 달이 두달 앞당겨졌다. 원래 January는 1월이 아니라 11월이었다. 후에 로마 황제가 되는 아우구스투스도 자신의 달을 갖고 싶어서 8월에 자신의 이름을 붙인다.(August) 그런데 그는 한달 내내 축하받아야하는 자신의 달이 30일인게 마음에 들지 않아서 2월의 하루를 떼서 8월에 붙인다. 정말 재밌는 가설이다. 가장 단순하고 재밌어서 널리 통용된다고 하는데 그럴만하다. 본인의 권력을 과시하고 싶어하는 역대 위인들은 많았지만 이렇게 생활에 녹아있는 건 또 처음본다. 그런데 나라도 내 생일 달에 내 이름 붙일 수 있었으면 붙였을 것 같다. 얼마나 의미있는 일인가.