본문 바로가기

[데이터 분석가의 숫자유감](권정민 著, 주형 畵, 2021) "그러니까 그게 그거지?" 4차 산업혁명 시대니 AI가 인류를 위협할거니 하지만 현실은 훨씬 건조하다. 데이터, 또는 AI로 뭔가 해보라는 윗선이 있고 쓸만한 데이터를 구하기 어려운 현실이 있고 분석가가 데이터를 끌어안고 새운 밤을 경험과 직관으로 발라버리는 선배가 있다. 이것들은 힘들지만 나를 조금씩 만들어가는 시련이라면 진짜 빌런은 따로 있다. 아무리 찰떡같이 전달해도 개떡같이 해석해주시고 정해진 답에 끼워맞추는 분들. 웬만하면 내가 부족하겠다 싶지만 수 차례 거듭되면 이 자가 X맨이다. "사장님! 여기 빌런이 있습니다!" 하고 외치고 싶지만 사장은 나보다 이 자와 가깝다. "늘 화가 나 있는 데이터 분석가를 찾습니다." 이 책의 출판사인 리디북스 PD가 저자를 찾기 위해 SNS에 올렸다는 글. 책의..
[fastai와 파이토치가 만나 꽃피운 딥러닝](제레미 하워드, 실뱅 거거 著, 박찬성, 김지은 譯, 2021) 상향식 학습 뭔가를 설명할 때는 기초부터 고급까지 차근차근 올라가는 것이 일반적이다. 더하기 빼기를 배워야 곱하기 나누기를 알 수 있고, 미분과 적분처럼 어려운 것들은 나중에 배운다. 이를 상향식(bottom-up) 접근이라고 하며 공교육과 사교육을 막론하고 일반적인 접근이다. "이런거 배워서 어디에 써요?"라는 질문은 공부하기 싫은 이의 핑계처럼 여겨지기도 하고, "크면 다 알게 돼"라는 답이 여기에 더해지면 지식과 무관한 나이가 권위처럼 여겨진다. 하향식 학습 학교를 벗어나 사회에 나와서 뭔가를 배우다 보면 당장 성과를 내야 할 때가 잦다. 기초부터 차근차근 배우기를 기대하기는 어렵고 일단 일이 되게 만드는 것이 최우선이다. 왜 그런지는 나중에 배우는데 안 배워도 되는 경우, 배울 수 없는 상황도 많..
[파이토치 첫걸음](최건호, 2019) "텐서플로 or 파이토치, 뭘 배워야 하나요?" 요새는 좀 뜸하지만 작년, 재작년쯤 커뮤니티에 자주 올라온 질문. 딥러닝 = 텐서플로라는 공식이 상당히 오래 있었고 지금도 텐서플로가 저물었다고 말하긴 힘들다. 일단 텐서플로를 만든 곳이 구글이라는 점, 그리고 공개된 코드가 많다는 점이 상당한 강점으로 작용한다. 그러나 최근에는 딥러닝 입문을 파이토치로 시작하는 분들도 많고, 텐서플로로 짜여진 딥러닝 코드를 파이토치로 변환해서 제공해주는 분들도 많기 때문에 파이토치로 한다고 딱히 어려움은 없다. 딥러닝을 많이 쓰시는 분들 이야기를 들어보면 "어차피 둘 다 알아야 돼요". "파이토치는 뭘로 배워야 해요?" 파이토치를 배우기로 마음 먹은 초보자의 두 번째 질문. 파이토치에 익숙한 많은 분들께서는 공식 홈페이지..
[데이터 스토리](낸시 두아르테 著, 권혜정 驛, 2021) 감정 기억(emotional memory)은 강하다 우리는 잠자는 시간을 제외하고 매일 열댓시간 이상을 살아가면서 수많은 자극에 노출된다. 일어나서 마시는 물 한잔, 하루 세 끼 먹는 밥과 핸드폰으로 보는 메시지와 뉴스들. 그러나 하루가 채 지나기도 전에 기억에서 잊혀지는 것이 대부분이라 "내가 점심에 뭘 먹었지?" 하고 갸우뚱하는 것도 이상한 일은 아니다. 간혹 깊이 새겨져서 제법 오래 가는 기억들이 있다. 감동적이거나, 매우 기쁘거나, 또는 무서웠던 일들. 특히 공포에 관한 기억은 생존 본능을 자극해 편도체에 바로 꽂히고, 그래서 자라를 보고 놀란 사람은 솥뚜껑만 보고도 놀란다. 메시지 전달력 우리가 잠자는 시간을 제외하고 의식이 있는 동안 마주치는 자극들은 의도되지 않은 것들이 별로 없다. 길거리의..
[유닉스의 탄생](브라이언 커니핸 著, 하성창 譯) 이 책은 컴퓨터 책이 아니라 역사책이다. 책의 배경은 1970~80년대 AT&T Bell 연구소. 당시의 벨 연구소는 튜링상과 노벨상 수상자를 배출하던 세계 최고 수준의 연구소였다. 전화회사가 만든 이 연구소에서 유닉스라고 하는 컴퓨터 운영체제가 어떻게 태어났는지, 어떻게 대중화되고, 사업화되고, 모회사의 운명과 함께 어떻게 스러져 갔는지, 그리고 무엇을 남겼는지에 대한 역사서라고 볼 수 있다. 생각보다 익숙한 이름의 사람들, 그리고 알고보니 유닉스에서 유래한 기능들. UNIX에 대한 책인 만큼 UNIX를 중심으로 서술되며, 구글의 전 CEO 에릭 슈미트를 비롯해 놀랄만한 이름들이 자주 언급된다. 그리고 C언어와 TCP/IP 프로토콜, UTF-8 인코딩을 비롯 "이것도 유닉스에서 나왔어?" 싶을 정도로 ..
[파이썬 스킬 업](브라이언 오버랜드, 존 베넷 著, 조인석 譯, 2021) OOO님이 들어오셨습니다. "저 질문좀 해도 되나요?" 카카오톡 채팅방에 누군가 들어오자마자 인사와 함께 질문해도 되냐는 질문을 한다. 파이썬 오픈채팅방 파이썬 처음처럼(링크: https://open.kakao.com/o/gG6kgabb)에서 자주 보이는 풍경. 파이썬을 사용하다 보면 뭔가 안되고, 구글링을 해도 답이 안나오면 오픈카톡을 찾아 들어온다. 질문의 범위는 여러 가지. 책을 따라 했는데 안된다, 자기 의도와 다르게 나온다. 그림을 어떻게 그리냐 등등. 이 방에서 이루어지는 대화의 대부분은 답답한 누군가의 질문과 친절한 여러 분들의 답변이다. 파이썬은 배우기 쉽다. 파이썬을 소개하는 문구 중 절대 다수는 빅데이터, 머신러닝, 4차산업혁명 어쩌고. 이런 광고문구를 한 단계 걷어내면 배우기 쉬운 언..
[보고서 발표 실무 강의](채종서 著, 2021) 일을 하는 사람이라면 보고를 피할 수 없다. 보고(報告)는 이 책의 첫 단어로 사용되는 만큼 첫 단락도 보고라는 단어의 뜻풀이로 시작한다. 사전적으로 "알리어 바치거나 베풀어 알림"이라는 뜻을 가지고 있는 단어로 흔히 피라미드 계층구조에서 아래에서 위로 올라가는 것을 보고라고 생각하기 쉬운 단어. 그렇지만 이 책 전반에서 다루는 예시는 업무를 매개로 이루어지는 모든 소통이라는 큰 뜻으로 보는 것이 좋다. 지시받은 일이 어떻게 수행되는지 상사에게 알리는 것도 보고이지만, 정부의 대국민 보고처럼 경영진의 방침을 전 사원에게 알리고 공감과 실천을 유도하는 것 또한 보고이기 때문이다. 실제 "일단 알아서 해봐!"식의 불명확한 지시로 인해 상사의 의중을 분석하기 위한 회의를 해봤다는 경험이 60%라는 통계를 인용..
[비트의 세계](데이비드 아우어바흐 著, 이한음 譯, 2021) 비트의 세계라는 제목으로 번역된 이 책의 원제는 Bitwise: A life in a code 일반인들에게 낯설 bitwise는 컴퓨터공학 용어로 비트 단위 라는 뜻이다. 예를 들어 "사과 또는 포도"라는 인간의 말은 장을 볼 때 사과가 없으면 포도를 사가야겠다는 의사로 표현될 수 있지만 컴퓨터는 다르게 인식한다. 먼저 사과와 포도를 부호화(encoding)해야 한다. 사과에 5, 포도에 6이라는 코드가 매겨져 있는 마트의 상품코드 같은 것을 연상할 수 있다. 여기까지는 사람의 언어로 봐도 무방하지만 컴퓨터 내부에서는 2진수로 바뀌어 사과 = 5 = 0101, 포도 = 6 = 0110라는 숫자 네 개로 표현된다. 이를 4비트라고 하며 4비트로는 총 24 = 16가지 표현이 가능하다. 그리고 "사과 또는 ..
[파이썬 비동기 라이브러리 Asyncio] (케일럽 해팅 著, 동동구 譯, 2021) 비동기 프로그래밍 "한 회사원이 있다. 전화도 받아야 하고 결재 올려 승인을 받아야 하고 메일도 보내야 하고 고객과 만나 업무도 처리해야 한다. 가끔 바쁠 때 "몸이 열 개면 좋겠다"라고 말한다." "멀티 스레드는 실제 몸이 열 개이다. 그래서 전화 받는 공무원, 메일 보내는 공무원, 민원 처리하는 공무원이 각각 존재한다. 당연히 빠르다. 하지만 전화를 끊은 공무원은 시간이 남아도 다른 일을 도와주지 않는다. 그냥 논다." "비동기식 프로그래밍은 '몸이 열 개면 좋겠다'라고 생각만 하고 결국 혼자 모든 일을 다 한다. 대신 엄청나게 똑똑하고 몸이 빠르다. 상사에게 결재 올려 승인이 날 때까지 기다리지 않고 전화도 받고 메일도 보낸다. 이 분은 '일머리'를 안다. 똑똑하고 체계적이고 계획적이다. 열 명의 ..
[메타버스] (김상균, 2020) 어느 날인가부터 메타버스라는 단어가 자주 띈다. 호들갑이 절반 정도 섞인 기사들. 찬찬히 읽어볼라치면 기자도 잘 모르고 쓴 것 같고, 여기저기 글들을 잘라붙인 느낌이 든다. 블록체인 공부를 할 때도 비슷한 느낌이 들었다. 쓰라고 하니까 쓴, 자기도 모를 듯한 느낌의 글들. 그럼에도 불구하고 여러 글을 읽고 메타버스에 대해 받은 느낌은 이 것. "내가 하던 게임이랑 뭐가 다르지? 경우에 따라 VR이 추가된 정도? 회사에 적용하면 스마트 팩토리인데?" "새로운 게 하나도 없어보이는데 왜 뜨는거지? 내가 모르는 다른 게 있나?" 투자를 하건 대비를 하건 개념 파악이 선행되어야 하기 때문에 제대로 된 정의가 고팠다. 내 해석이 어느 정도 맞는 것 같다. 블록체인은 비트코인 이전에 없었던 새로운 개념의 정보 저장..
[친절한 딥러닝 수학](다테이시 겐고 著, 김형민 譯, 2021) 표지와 구성 인공 신경망 이해를 위한 기초 수학이라는 부제와 함께 친절한 딥러닝 수학이라는 제목이 크게 써있다. 두 명의 젊은 여성, 그리고 한 명의 남성이 만화체로 그려져 있다. 300페이지 가량의 부담없는 두께, 태권도 노란 띠나 병아리를 연상시키는 밝은 노란색의 표지. 그리고 대화를 하듯 가끔 도넛도 사오면서 진행되는 질답형식의 본문. 누가 봐도 "딥러닝 초보자님들! 이 책을 집으세요!" 라는 느낌의 디자인. 책을 보내주신 한빛미디어에는 미안하지만 말리고 싶다. 책은 크게 두 부분으로 나뉜다. 전반부는 수학. 경사하강법과 오차역전파를 다룬다. 수식을 하나하나 자세하게 풀어서 설명해준다. 후반부는 코딩. 파이썬으로 밑바닥부터 신경망을 구현한다. 코드를 한 줄 한 줄 친절하게 읽어준다. 그러나 둘 다 ..
[GAN 첫걸음](타리크 라시드 著, 고락윤 譯, 2021) 이 책을 펴기 전 내 상태를 한 마디로 표현하면 이렇다. def __init__(self): super().__init__() self.데이터분석_경험 = True self.머신러닝_경험 = True self.numpy_경험 = True self.pandas_경험 = True self.matplotlib_경험 = True # epsilon @numpy eps = np.finfo("float").eps self.딥러닝_경험 = eps self.텐서플로_경험 = eps self.케라스_경험 = eps # out of my world self.파이토치_경험 = None self.GAN_경험 = None 글자 그대로, 데이터분석과 (딥러닝 제외) 머신러닝을 주로 해 왔다. 주어진 상황이 그랬다. 딥러닝을 해야지..
[돈의 속성](김승호, 2020) ● 2020년 여름에 출판된 책이다. 초판 1쇄 발행 2020년 6월 15일 초판 42쇄 발행 2020년 7월 14일 - 작년에 내가 구매한 버전. 늦게 읽었다. 2021년 3월 9일 현재 100쇄 기념 에디션 판매중 돈을 제법 많이 벌어들였을 이 책을 출판한 곳은 스노우폭스북스. 국제적인 사업을 하며 돈을 많이 번 저자는 이 책으로 돈을 더 벌었을 것이다. ● 돈을 그다지 좋아하지 않았다. 어려서부터 읽은 위인전의 청빈한 선비 개념이 박혀 그래야 하는 줄 알았고 돈은 더러운 것이라는 말도 많이 들었다. 대학 입학 후 1년이 못 되어 IMF를 겪으며 더러운 것이 무서운 것이 되었고 곧이어 없으면 안되는 것, 지켜야 하는 것이 되었지만 불려야 하는 것이라는 생각이 든 건 한참 뒤의 일이다. ● 저자는 부자..
[진지한 파이썬](쥘리앵 당주 著, 김영하 譯, 2021) 젓가락질 잘해야만 밥을 먹나요라는 노래 가사가 있었다. 내 기억으로, 중고등학교때까지 젓가락질을 제대로 못했다. 손가락 길이방향으로 젓가락을 걸치고 손끝을 사용하는 젓가락질이 정석이라면, 그때까지 난 손가락 둘째마디에 젓가락을 끼우고 손가락 전체 근육을 사용해 반찬을 집었다. 어르신들께서 간혹 지적하셨지만 나는 속으로 밥 잘 먹어요 하며 무시하다가 계기는 기억나지 않지만 나중에 커서도 지적받으면 안되겠다는 생각이 들어 다시 연습했다. 지금은 젓가락질도 잘 하고 밥도 잘 먹는다. 파이썬을 2008년에 구글링하며 혼자 배웠다. C에서 matlab을 거쳐 접한 파이썬은 짧고 직관적인 명령어가 매력적이었다. matplotlib으로 그래프를 .jpg, .png 형식으로 쉽게 찍어낼 수 있다는 것도, os.syst..
[명상록] (마르쿠스 아우렐리우스, 180) ● "선행을 한 후에는 선행을 했다는 사실 자체를 잊어버려라" 국민학생 시절, 만화 세계사라는 책이 있었다. 세계의 역사를 굵은 흐름 위주로 만화로 엮은, 권 수가 제법 많은 책이었는데 각 권의 표지 안쪽에는 해당 권을 대표하는 인물의 격언이 쓰여 있고는 했다. 몇 권인지 기억은 나지 않지만 선행을 한 후에는 대가를 바라지 말고 선행을 했다는 사실 자체를 잊어버리라는 말과 함께 마르쿠스 아우렐리우스, 명상록.이라고 쓰여 있던 것이 기억난다. 선행의 대가를 바라지 말라는 말은 많이 들었지만, 한 걸음 더 나아가 그 사실 자체를 잊어버리라는 말이 왠지 깊게 남아 당시 학급신문에 무슨 말인지도 모르면서 저 말을 싣기도 했다. 이후 역사를 배우며 로마제국의 5 현제 중 한 사람이라는 말을 들었고, 영화 속에서는..
[밑바닥부터 시작하는 딥러닝 3](사이토 고키, 2020) "야, 까먹을 게 따로 있지 어떻게 그걸 까먹냐" 일전에 한 선배가 나를 타박하면서 했던 말. 선배는 이해할 수 없는 내 망각의 대상은 군번이었다. 26개월 현역으로 군대를 다녀온 선배에게 군번은 "자다가도 툭 치면 나와야 되는", 글자 그대로 자신의 정체성(ID = identity)이었겠지만 전문연구요원으로 논산 훈련소에서 4주만 보낸 내게는 대체 입사 지원서에 이걸 왜 써넣어야 하는지 모를 성가신 행정코드일 뿐이다. 내게도 20년 가까운 시간이 지났지만 잊혀지지 않는 것이 있다. 지금은 데이터를 다루지만 석사 시절엔 실험을 했다. 참 멋진 선배가 만든, 이온 밀링을 포함해 6가지 소재를 스퍼터링하여 박막을 만드는 장비가 있었는데 이 장비를 함께 사용해서 시료를 만들었을 뿐 아니라 나사 하나하나를 풀고..