본문 바로가기

전체 글

(62)
[대시보드 설계와 데이터 시각화](스티브 웩슬러, 제프리 섀퍼, 앤디 코트그리브 著, 최윤석 譯, 2018) ● 2년 늦은 서평 - 이 책을 처음 읽은 건 2020년 여름, 데이터 시각화 교과서와 함께 읽었다. - 2019년 말, 피드백도 없는 내부에서는 성장이 어렵다 싶어 자양분을 찾아 밖으로 눈을 돌리기 시작했다. - 기술 블로그와 독서 블로그를 만들고, 여러 책을 찾아 읽기 시작했다. - 돌이켜보면 진공청소기처럼 정보를 빨아들여 일단 머리에 넣고 코딩을 하며 손가락 근육에 녹이던 시기. - 간혹 비슷한 정보를 연달아 흡수하면 앞에서 흡수한 정보와 중복으로 처리되는 데이터에 피로감이 커졌는데 - 데이터 시각화 교과서 바로 다음에 읽었던 이 책이 딱 그랬다. - 읽다가도 힘들었고 서평을 쓸 수가 없었다. 사례 나열식 구성이라 더 그랬다. - 시간이 지난 지금 그간 쌓은 경험을 가지고 다시 읽으니 내용이 조금 ..
[핸즈온 데이터 시각화](잭 도허티, 일리야 일라얀코우 著, 김태헌 譯, 2022) ● 내돈내산 - 한빛미디어에서 활동을 2년째 하면서 한 달에 한 권씩 책을 받아보고 있다. - 매달 메일로 목록을 받고 원하는 책 세 권을 회신하면 그 중 한 권을 받아 리뷰를 하는 구조. - 간혹 진짜 원하는 책이 딱 한 권 있는데 그 책을 받지 못하는 경우가 있다. - 일(?)은 일대로 해야 하고 저 책은 읽고 싶고. 답답하지만 어쩔 수 없다. - 그러면 내 돈을 주고 내가 살 수 밖에 없다. 리뷰 의무도 없다. - 이 책이 그렇게 산 책이다. 그렇지만 리뷰를 남기지 않을 수 없다. ● 3분의 2만 데이터 시각화 - 이 책은 총 4개의 큰 단락으로 구성되어 있다: (1) 기본 기술, (2) 시각화 구축, (3) 코드 템플릿과 고급 도구, (4) 진실하고 의미 있는 스토리 전달하기 - 매우 짧은 네 번..
[데이터 시각화 입문](후지 토시쿠니, 와타나베 료이치 著, 김태현 譯, 2020) ● 데이터 시각화 (Data Visualization) - 지금은 많이 익숙해진 단어. - 대개 수치로 표현된 데이터를 그림으로 표현하는 과정이다. - 파이썬같은 프로그래밍 언어로 코딩을 해야만 하는 것은 아니다. - 엑셀에서 마우스로 드래그하고 아이콘을 클릭해서 그리는 그림도 엄연한 데이터 시각화 결과물이다. ● 데이터 시각화를 하면 할 수 있는 일들 - 저자와 역자는 이렇게 말한다. - 저자 : "데이터 시각화의 기본을 익혀 비즈니스에 자연스럽게 적용할 수 있게 되면, 보는 눈이 극적으로 달라집니다. 확실하게 읽히며 사람들에게 사용되는 보고서를 만들 수 있습니다. 무엇보다도 읽는 사람의 시간 효율이 향상되겠죠. (중략) 여러분이 작성하는 차트를 보는 분들도 데이터 시각화의 효과와 가치를 향유하고, 나..
[혼자 공부하는 머신러닝+딥러닝, 파이썬](혼공머신: 박해선 著, 혼공파: 윤인성 著, 2021) ● 혼공족: "혼자 공부하는 일에 능숙한 사람 혹은 그런 무리를 일컫는 신조어" - IT 관련 분야에 발을 들인지 얼마 되지 않아 기존에는 어땠는지 잘은 모르겠으나, (비슷했을 것 같다) - 머신 러닝을 비롯한 인공 지능 관련 분야의 특징으로 독학의 비중이 매우 높다는 것을 꼽을 수 있을 듯 하다. - 벌써 6년이 지난 2016년의 알파고 쇼크는 우리가 벽이라고 생각했던 곳을 힘차게 발로 차서 열어버렸다. - 그 앞에 제법 달달해보이는 = 취업, 승진, 창업의 기회가 널린 길이 놓여 있는 것이 많은 이의 눈에 들어왔지만 - 이 길을 먼저 걸어간 이는 극소수. 어떤 길을 어떻게 따라가야 하는지 알려줄 수 있는 이조차 드물다. - 간혹 학원 등에서 강사가 강의하는 사진이 커뮤니티에 도는데 강사의 코드조차 잘..
[개발자를 위한 머신러닝&딥러닝](로런스 모로니 著, 박해선 驛, 2022) ● 머신 러닝 붐 - 머신 러닝 입문자가 계속 느는 것이 느껴진다. - 정확한 통계 수치를 보지 못해 얼마가 늘었는지, 늘고 있는지는 알 수 없지만 - 최근 강의를 하러 방문했던 한 정부출연기관에서는 기존 DB 담당자들, 웹개발자들이 머신 러닝 입문자로 앉아 있었다. - IT와 거리가 먼 분들 입장에서는 DB나 웹이나 머신 러닝이나 그게 그거 아닌가 싶겠지만 - 밭을 일구는 농부와 배를 타는 어부, 산을 누비는 심마니처럼 바라보는 대상과 생존을 위한 기본기가 다른 것이 이들이다. ● 개발자를 위한 입문서 - 여러 종의 입문서가 시중에 나와있고 이 중 몇 권을 읽었지만 이 책은 조금 독특하다. - 제목인 "개발자를 위한~" (원서는 "~ for coders")에서 알 수 있듯 코딩 자체를 처음으로 하는 이..
[드롭 아웃](Disney+, 2022) ● "여러분, 뭔가 일을 하려면 이 정도는 되어야 하지 않겠습니까?" - 2013년 봄. 입사한 지 얼마 되지 않은 나는 회사가 초빙한 외부 연사의 강연을 듣고 있었다. - 화면에는 나도 이름을 아는 잘 나가는 젊은 여성 CEO의 얼굴이 떠 있었고 - 연사가 방금 넘긴 페이지에는 이 회사의 이사진들이 나열되어 있었다. - 정치, 국방 관련 뉴스에서 이름이 자주 언급되던 헨리 키신저, 조지 슐츠, 제임스 매티스 등등. - "이 정도 사람들의 힘을 빌리면 못할 일이 뭐가 있겠습니까?" - 연사의 목소리는 힘이 넘쳤지만 이상하다는 생각이 들었다. "저 사람들 의학이나 생물학은 아닌데?" - 어차피 나도 이 쪽은 잘 모른다. 그렇게 그냥 넘어갔다. ● 불과 몇 년 뒤 - 실리콘 밸리 스타트업들이 투자를 위해 벌..
[딥러닝을 이용한 정형 데이터 분석](마크 라이언 著, 박찬성 譯, 2022) ● 입문은 대개 딥러닝 - 나처럼 통계나 산업공학을 전공하지 않았는데 필요에 의해 AI라는 분야에 발을 들인 사람의 입문은 대개 딥러닝이다. - 뭔지 몰라도 AI를 하려면 딥러닝을 해야 할 것 같고, - 공부를 하려고 해도 딥러닝 강좌와 책이 먼저 눈에 띈다. - 도입 부분에 scikit-learn 머신러닝을 배우기도 하지만 딥러닝으로 가기 위한 중간 다리로 여겨진다. - TensorFlow로 손글씨 숫자 그림 맞추기인 MNIST 코딩을 따라 쳤을 때 돌아가면 매우 뿌듯하다. ● 현실은 정형 데이터 - 분야에 따라 다르겠지만 이미지 데이터로 딥러닝을 하는 분이 가장 많이 보인다. - 설비 부품에 발생한 결함을 찾거나 기상 사진을 가지고 날씨 예측을 하거나 등등. - 하지만 내가 몸담은 곳에서 내게 보내오..
[사례 분석으로 배우는 데이터 시각화](황재진, 윤영진 著, 2022) ● 데이터 시각화 (Data Visualization, 데이터 가시화) - 숫자 등으로 알아보기 힘들게 나열된 데이터를 그림으로 표현하는 일. - 누군가에게는 궁극의 목적지이고 누군가에게는 수단일 뿐일 수도 있다. - 데이터와 목적에 따라 결과물이 천차 만별이지만 전달력을 향상시키는 정석이 존재하는 것도 사실이다. - 이 정석을 전달하려는 노력이 많지만 막상 예를 들자면 데이터가 너무 다양하고 방법이 다양해 전달이 쉽지 않다. ● Tableau - 이 책의 저자들은 태블로를 사용해 데이터를 불러와 그림으로 변환하는 방법을 체계적으로 소개하고 있다. - 태블로는 복잡한 명령어 없이 직관적으로 데이터 항목을 끌어다 놓는 방식을 사용하기 때문에, - 명령어를 외우느라 에너지를 소비하는 일 없이 데이터의 메시지..
[엑셀 대신 파이썬으로 업무 자동화하기](포스코 인재창조원 著, 2022) ● 수백명의 엑셀 작업자 - 수년 전 이야기. - 공정개발 부서에 회의를 하러 갔는데, 한 층을 가득 메운 수백명의 실무자 모니터에 같은 화면이 떠 있었다. - 모두 엑셀을 띄워놓고 뭔가 숫자를 가져오기도 하고 입력하기도 하고 있었는데, - 이 많은 사람들이 이런 일을 하기 위해 고용되어 있다는 사실, 회사가 비용을 지불한다는 사실이 놀랍게 다가왔다. - 코딩을 지금처럼 본격적으로 할 때는 아니지만, 숫자 옮기고 계산하는 일인데 좀 더 잘 할 수 있지 않나? 싶었다. ● 업무 자동화 - 대학원에서는 Origin을 썼는데, 그 회사에는 Origin 라이센스가 없었다. - 그래프는 엑셀을 사용해 그리는 것이 보통. - 기업도 무료로 사용할 수 있는 프로그램이 있다면 알아서 찾아 쓰라는 방식. 문제시 징계. ..
[SKEPTIC, 29-1. 게임 이론으로 본 도핑의 유혹](2022) ● "abuser는 abusing으로밖에 이길 수 없다" 친구들끼리 모여 PC방에서 스타크래프트를 하던 90년대 말, 종종 반칙을 쓰는 사람들을 만났다. 게임 중간에 동맹 관계를 바꾸어 자기 친구들 편에 붙음으로써 4:4를 5:3으로 만든다거나, 자기 유닛이 없는 상대방 진영을 볼 수 있는 맵핵(map hack)을 쓰는 일이 흔했다. 이런 플레이어를 abuser라고 불렀는데 웬만큼 못하지 않고서야 이기는 일이 불가능하다. 상대방이 맵핵을 쓰면 나도 맵핵을 써야 공정한 게임이 되는 역설이 생겼고, 맵핵을 기본으로 제공하는 PC방들이 절반을 넘는 지경에 이르렀다. 합리적인 선택이다. 맵핵을 하지 않으면 당할 수가 없으니 손님들이 외면하기 때문이다. ● 도핑에 대한 다큐멘터리, (ESPN, 2020) 스켑틱 ..
[최고의 부모들은 아이를 어떻게 키웠을까](김정진 著, 2018) ● 슬슬 아이들을 어떻게 키울지 고민이 생긴다. 아이들을 종종 번쩍 들어 안아주는데 무게가 심상치 않다. 예전엔 동시에 둘 다 안아 들고 빙글빙글 돌리기도 했는데 지금은 하나만 오래 안아도 힘들다. 아기라는 단어가 더 이상 어울리지 않는다. 아이라는 말이 어울리고, 어린이도 어색하지 않다. 밥만 잘 먹이고 아프지 않은 것으로는 부족하다는 생각이 들기 시작한다. 조금 어려운 단어도 알려줘야 할 것 같고, 숫자 계산도 조금 더 빠르게 잘 해야 할 것 같다. ● 아이들이 어떤 직업을 가질지를 생각하면 궁금과 걱정이 동시에 된다. 가장 빠르게 변하는 데이터와 AI를 다루는 일을 하다 보니 사회 변화에 민감해졌다. 이미 학생 입장에서 대학에 들이는 비용은 효용을 초과했다. 좋은 대학을 나와서 최고의 효용을 뽑아낼..
[미국 주식으로 시작하는 슬기로운 퀀트 투자](김용환, Yubin Kim 著, 2021) ● 노동 가치 하락 3~4년 전만 해도 이 정도는 아니었는데, 노동 가치 하락에 대한 기사가 많이 보인다. 코로나 이후 유동성이 폭발하면서 치솟은 주식 시장의 여파 그리고 더 이상 월급을 모아서는 살 수도 없고 대출을 하고 갚기도 어려운 부동산 때문이다. 여기에 하나를 더하면 늘어난 기대 수명. 정년퇴직을 기대한다면 60대 초반, 사기업이라면 50을 넘기기 힘든 현실에서 퇴직 후가 너무 길다. 내가 잠을 자도 돈이 벌리는 시스템이 절실해졌다. ● 주식 시장 개인적으로 부동산 재테크를 좋아하지 않는다. 생존을 위해 반드시 필요한 남의 보금자리를 담보로 내 욕망을 채우는 기분이 들어서 그렇다. 하지만 주식에 대해서는 매우 긍정적이다. 소액으로 시작할 수 있어 모두에게 열려 있다는 점도 긍정적이고, 주식 투자..
[비전공자도 이해할 수 있는 AI 지식](박상길 著, 정진호 畵, 2022) AI 지식은 수명 주기가 짧다 하루가 다르게 새로운 뉴스가 언론에 쏟아지고 여기에 발맞추어 정부에서는 계속 뭔가를 하겠다고 한다. 우리 나라는 워낙 변화가 빠르고 미국은 AI 기술의 원류라 그러려니 해도 자료를 찾으려고 구글을 뒤적거리면 나라마다 엄청난 일을 해대고 있다. 어디서 하나 주워들어서 재활용하기가 만만치 않다. 굵은 줄기를 잡아야 한다. 이 분야에 발을 처음 들였을 때, 쓸려나가는 느낌이 들었다. 깊이 들어간다는 dive라는 표현이 무색하게 어디가 깊이 방향인지도 모르겠더라. 이 쪽을 좀 하다 보면 저 쪽은 뭐지 싶고, 하나를 파다 보면 다른 걸 모른다. 이럴 때일수록 전체적인 그림을 그릴 줄 알아야 한다. 적어도 불안감은 덜 하다. 가볍게 쓰인 글들이 제법 유용하지만 한계가 명확하다 굵은 줄..
[신 타이포그래피 혁명가 얀 치홀트](김현미 著, 2000) 한 우물 파기와 자기 혁신의 공존 얀 치홀트(1902-1974)의 직업은 타이포그래퍼(typographer) 글꼴을 디자인하는 사람이자 포스터와 책을 구성하기도 한 디자이너. 부친도 레터링 아티스트였고 평생 이 길을 걸었으니 유전자 수준부터 한 길을 걸은 사람이지만 캘리그라피를 시작으로 바우하우스와 유겐트슈틸, 추상미술을 만나고 나치의 방해를 받으며 계속 진화한다. "어떤 새로운 것도 영원히 새로울 수는 없듯이 타이포그래피의 모습은 계속해서 변해갈 것입니다." 변화의 폭이 어느 정도였냐면, 자신이 과거에 세운 이론에 경도된 사람과 지면 설전까지 벌였다. "좋은 타이포그래피는 정보의 내용과 성격에 적절한 형태를 갖는 타이포그래피이지 (자신이 과거에 주장하고 기틀을 세운) 신 타이포그래피가 아닙니다." 백 ..
[AI로 일하는 기술](장동인 著, 2022) 데이터 강의 3부작 작년, 여의도에 위치한 모 기업으로부터 3연속 2시간짜리 강의 요청을 받았다. 첫 번째 시간은 데이터 분석에 대해서: 데이터를 어떤 마음으로 들여다 봐야 하는지 두 번째 시간은 데이터 시각화에 대해서: 실무자 입장에서 느낀 중요 포인트를 어떻게 강조해야 하는지 세 번째 시간은 AI로 일하는 방법에 대해서: 조직 내에서 데이터로 일을 만드는 방법에 대해서. AI로 일하는 방법? 처음 두 시간은 내 경험에 전문가들의 조언을 덧붙여 있는 그대로 풀어 놓으면 되는 것이라 걱정이 안됐다. 먼저 과기부 산하 지능정보사회진흥원(NIA) 요청으로 온라인 강의를 했었고, 반응도 좋아서 자신감도 있었다. 문제는 세 번째. 언론 보도와 달리 실무자 입장에서 직간접적인 실패 사례를 백 배쯤 더 많이 경험한..
[파워포인트 디자인 실무 강의 with 신프로](신강식 著, 2022) 파포는 위대하다. 파워포인트로 하는 보고가 너무 외형에 치우친다는 비판이 있는 것이 사실이지만 이는 한편으로 파워포인트를 통해 내용을 꾸미기가 너무 좋다는 것을 반증하기도 한다. 화이트 보드에 포스트잇을 붙이는 느낌, 또는 도화지에 색종이를 오려붙이던 느낌이 살아 있는 인터페이스는 뇌와 모니터의 거리를 좁혀 준다. 심지어 이미지의 색조 조정이나 복잡한 도형 편집 등도 가능해서 다른 프로그램을 쓸 일도 없다. 프레젠테이션(PT)을 준비한다는 것은 파워포인트(ppt)를 만든다는 것과 동의어일 정도. 잘 쓰는 사람은 드물다 몇 년 전에 비해 최근에 보이는 ppt의 질이 엄청 올라갔다. 좋은 template가 많이 퍼져서일 수도 있고, 어려서부터 영상 매체에 익숙한 세대가 ppt를 만들기 시작한 결과라고도 생각..