본문 바로가기

전체 글

(40)
[딥러닝을 이용한 정형 데이터 분석](마크 라이언 著, 박찬성 譯, 2022) ● 입문은 대개 딥러닝 - 나처럼 통계나 산업공학을 전공하지 않았는데 필요에 의해 AI라는 분야에 발을 들인 사람의 입문은 대개 딥러닝이다. - 뭔지 몰라도 AI를 하려면 딥러닝을 해야 할 것 같고, - 공부를 하려고 해도 딥러닝 강좌와 책이 먼저 눈에 띈다. - 도입 부분에 scikit-learn 머신러닝을 배우기도 하지만 딥러닝으로 가기 위한 중간 다리로 여겨진다. - TensorFlow로 손글씨 숫자 그림 맞추기인 MNIST 코딩을 따라 쳤을 때 돌아가면 매우 뿌듯하다. ● 현실은 정형 데이터 - 분야에 따라 다르겠지만 이미지 데이터로 딥러닝을 하는 분이 가장 많이 보인다. - 설비 부품에 발생한 결함을 찾거나 기상 사진을 가지고 날씨 예측을 하거나 등등. - 하지만 내가 몸담은 곳에서 내게 보내오..
[사례 분석으로 배우는 데이터 시각화](황재진, 윤영진 著) ● 데이터 시각화 (Data Visualization, 데이터 가시화) - 숫자 등으로 알아보기 힘들게 나열된 데이터를 그림으로 표현하는 일. - 누군가에게는 궁극의 목적지이고 누군가에게는 수단일 뿐일 수도 있다. - 데이터와 목적에 따라 결과물이 천차 만별이지만 전달력을 향상시키는 정석이 존재하는 것도 사실이다. - 이 정석을 전달하려는 노력이 많지만 막상 예를 들자면 데이터가 너무 다양하고 방법이 다양해 전달이 쉽지 않다. ● Tableau - 이 책의 저자들은 태블로를 사용해 데이터를 불러와 그림으로 변환하는 방법을 체계적으로 소개하고 있다. - 태블로는 복잡한 명령어 없이 직관적으로 데이터 항목을 끌어다 놓는 방식을 사용하기 때문에, - 명령어를 외우느라 에너지를 소비하는 일 없이 데이터의 메시지..
[엑셀 대신 파이썬으로 업무 자동화하기](포스코 인재창조원 著, 2022) ● 수백명의 엑셀 작업자 - 수년 전 이야기. - 공정개발 부서에 회의를 하러 갔는데, 한 층을 가득 메운 수백명의 실무자 모니터에 같은 화면이 떠 있었다. - 모두 엑셀을 띄워놓고 뭔가 숫자를 가져오기도 하고 입력하기도 하고 있었는데, - 이 많은 사람들이 이런 일을 하기 위해 고용되어 있다는 사실, 회사가 비용을 지불한다는 사실이 놀랍게 다가왔다. - 코딩을 지금처럼 본격적으로 할 때는 아니지만, 숫자 옮기고 계산하는 일인데 좀 더 잘 할 수 있지 않나? 싶었다. ● 업무 자동화 - 대학원에서는 Origin을 썼는데, 그 회사에는 Origin 라이센스가 없었다. - 그래프는 엑셀을 사용해 그리는 것이 보통. - 기업도 무료로 사용할 수 있는 프로그램이 있다면 알아서 찾아 쓰라는 방식. 문제시 징계. ..
[SKEPTIC, 29-1. 게임 이론으로 본 도핑의 유혹](2022) ● "abuser는 abusing으로밖에 이길 수 없다" 친구들끼리 모여 PC방에서 스타크래프트를 하던 90년대 말, 종종 반칙을 쓰는 사람들을 만났다. 게임 중간에 동맹 관계를 바꾸어 자기 친구들 편에 붙음으로써 4:4를 5:3으로 만든다거나, 자기 유닛이 없는 상대방 진영을 볼 수 있는 맵핵(map hack)을 쓰는 일이 흔했다. 이런 플레이어를 abuser라고 불렀는데 웬만큼 못하지 않고서야 이기는 일이 불가능하다. 상대방이 맵핵을 쓰면 나도 맵핵을 써야 공정한 게임이 되는 역설이 생겼고, 맵핵을 기본으로 제공하는 PC방들이 절반을 넘는 지경에 이르렀다. 합리적인 선택이다. 맵핵을 하지 않으면 당할 수가 없으니 손님들이 외면하기 때문이다. ● 도핑에 대한 다큐멘터리, (ESPN, 2020) 스켑틱 ..
[최고의 부모들은 아이를 어떻게 키웠을까](김정진 著, 2018) ● 슬슬 아이들을 어떻게 키울지 고민이 생긴다. 아이들을 종종 번쩍 들어 안아주는데 무게가 심상치 않다. 예전엔 동시에 둘 다 안아 들고 빙글빙글 돌리기도 했는데 지금은 하나만 오래 안아도 힘들다. 아기라는 단어가 더 이상 어울리지 않는다. 아이라는 말이 어울리고, 어린이도 어색하지 않다. 밥만 잘 먹이고 아프지 않은 것으로는 부족하다는 생각이 들기 시작한다. 조금 어려운 단어도 알려줘야 할 것 같고, 숫자 계산도 조금 더 빠르게 잘 해야 할 것 같다. ● 아이들이 어떤 직업을 가질지를 생각하면 궁금과 걱정이 동시에 된다. 가장 빠르게 변하는 데이터와 AI를 다루는 일을 하다 보니 사회 변화에 민감해졌다. 이미 학생 입장에서 대학에 들이는 비용은 효용을 초과했다. 좋은 대학을 나와서 최고의 효용을 뽑아낼..
[미국 주식으로 시작하는 슬기로운 퀀트 투자](김용환, Yubin Kim 著, 2021) ● 노동 가치 하락 3~4년 전만 해도 이 정도는 아니었는데, 노동 가치 하락에 대한 기사가 많이 보인다. 코로나 이후 유동성이 폭발하면서 치솟은 주식 시장의 여파 그리고 더 이상 월급을 모아서는 살 수도 없고 대출을 하고 갚기도 어려운 부동산 때문이다. 여기에 하나를 더하면 늘어난 기대 수명. 정년퇴직을 기대한다면 60대 초반, 사기업이라면 50을 넘기기 힘든 현실에서 퇴직 후가 너무 길다. 내가 잠을 자도 돈이 벌리는 시스템이 절실해졌다. ● 주식 시장 개인적으로 부동산 재테크를 좋아하지 않는다. 생존을 위해 반드시 필요한 남의 보금자리를 담보로 내 욕망을 채우는 기분이 들어서 그렇다. 하지만 주식에 대해서는 매우 긍정적이다. 소액으로 시작할 수 있어 모두에게 열려 있다는 점도 긍정적이고, 주식 투자..
[비전공자도 이해할 수 있는 AI 지식](박상길 著, 정진호 畵, 2022) AI 지식은 수명 주기가 짧다 하루가 다르게 새로운 뉴스가 언론에 쏟아지고 여기에 발맞추어 정부에서는 계속 뭔가를 하겠다고 한다. 우리 나라는 워낙 변화가 빠르고 미국은 AI 기술의 원류라 그러려니 해도 자료를 찾으려고 구글을 뒤적거리면 나라마다 엄청난 일을 해대고 있다. 어디서 하나 주워들어서 재활용하기가 만만치 않다. 굵은 줄기를 잡아야 한다. 이 분야에 발을 처음 들였을 때, 쓸려나가는 느낌이 들었다. 깊이 들어간다는 dive라는 표현이 무색하게 어디가 깊이 방향인지도 모르겠더라. 이 쪽을 좀 하다 보면 저 쪽은 뭐지 싶고, 하나를 파다 보면 다른 걸 모른다. 이럴 때일수록 전체적인 그림을 그릴 줄 알아야 한다. 적어도 불안감은 덜 하다. 가볍게 쓰인 글들이 제법 유용하지만 한계가 명확하다 굵은 줄..
[신 타이포그래피 혁명가 얀 치홀트](김현미 著, 2000) 한 우물 파기와 자기 혁신의 공존 얀 치홀트(1902-1974)의 직업은 타이포그래퍼(typographer) 글꼴을 디자인하는 사람이자 포스터와 책을 구성하기도 한 디자이너. 부친도 레터링 아티스트였고 평생 이 길을 걸었으니 유전자 수준부터 한 길을 걸은 사람이지만 캘리그라피를 시작으로 바우하우스와 유겐트슈틸, 추상미술을 만나고 나치의 방해를 받으며 계속 진화한다. "어떤 새로운 것도 영원히 새로울 수는 없듯이 타이포그래피의 모습은 계속해서 변해갈 것입니다." 변화의 폭이 어느 정도였냐면, 자신이 과거에 세운 이론에 경도된 사람과 지면 설전까지 벌였다. "좋은 타이포그래피는 정보의 내용과 성격에 적절한 형태를 갖는 타이포그래피이지 (자신이 과거에 주장하고 기틀을 세운) 신 타이포그래피가 아닙니다." 백 ..
[AI로 일하는 기술](장동인 著, 2022) 데이터 강의 3부작 작년, 여의도에 위치한 모 기업으로부터 3연속 2시간짜리 강의 요청을 받았다. 첫 번째 시간은 데이터 분석에 대해서: 데이터를 어떤 마음으로 들여다 봐야 하는지 두 번째 시간은 데이터 시각화에 대해서: 실무자 입장에서 느낀 중요 포인트를 어떻게 강조해야 하는지 세 번째 시간은 AI로 일하는 방법에 대해서: 조직 내에서 데이터로 일을 만드는 방법에 대해서. AI로 일하는 방법? 처음 두 시간은 내 경험에 전문가들의 조언을 덧붙여 있는 그대로 풀어 놓으면 되는 것이라 걱정이 안됐다. 먼저 과기부 산하 지능정보사회진흥원(NIA) 요청으로 온라인 강의를 했었고, 반응도 좋아서 자신감도 있었다. 문제는 세 번째. 언론 보도와 달리 실무자 입장에서 직간접적인 실패 사례를 백 배쯤 더 많이 경험한..
[파워포인트 디자인 실무 강의 with 신프로](신강식 著, 2022) 파포는 위대하다. 파워포인트로 하는 보고가 너무 외형에 치우친다는 비판이 있는 것이 사실이지만 이는 한편으로 파워포인트를 통해 내용을 꾸미기가 너무 좋다는 것을 반증하기도 한다. 화이트 보드에 포스트잇을 붙이는 느낌, 또는 도화지에 색종이를 오려붙이던 느낌이 살아 있는 인터페이스는 뇌와 모니터의 거리를 좁혀 준다. 심지어 이미지의 색조 조정이나 복잡한 도형 편집 등도 가능해서 다른 프로그램을 쓸 일도 없다. 프레젠테이션(PT)을 준비한다는 것은 파워포인트(ppt)를 만든다는 것과 동의어일 정도. 잘 쓰는 사람은 드물다 몇 년 전에 비해 최근에 보이는 ppt의 질이 엄청 올라갔다. 좋은 template가 많이 퍼져서일 수도 있고, 어려서부터 영상 매체에 익숙한 세대가 ppt를 만들기 시작한 결과라고도 생각..
[SKEPTIC, 27-1. 노화에 도전하는 과학](2021) skeptic: 회의론자. 의심 많은 사람 사전적으로 저런 의미를 가지고 있는 단어 skeptic은 잡지 이름이기도 하다. 1992년 과학적 회의주의자 마이클 셔머에 의해 발행이 시작되었으며 2015년부터는 한국어판이 발행되고 있다. 원서의 번역본 뿐 아니라 국내 유수 대학 교수 및 정출연 연구원들의 기고문이 실리는데 품질이 매우 우수하다. 1년에 4번 나오는 계간지로 현재 28호까지 출간되었다. 정기구독 시작 (2021.12) 권당 15,000원 (홈페이지 주문시 13,500원). 4권을 받는 1년 정기 구독은 50,000원. 비싼 건 아니다. 막상 받아보니 생각보다 가볍다. 물리적 무게도 그렇고 "대중을 위한 새로운 교양 과학 잡지"를 표방하는 만큼 글도 잘 읽힌다. 뇌를 스트레칭하는 느낌으로 아침에..
[데이터 과학자 되는 법](에밀리 로빈슨, 재클린 놀리스 著, 이창화 譯, 2021) 분노와 짜증으로 가득찬 나날 화를 잘 내지 않고 어디 가서도 둥글둥글하다는 말을 듣는 편이지만 데이터에 발을 들인 이후 많이 바뀌었다. 의심이 많아졌고 분노로 가득하며 체력이 감당할 수 있는 범위를 넘어서면서 짜증을 낼 때도 많아졌다. 이런 부정적인 감정은 표면적으로는 특정 데이터나 인물을 향해있지만 나는 안다. 스스로를 향한 것이라는 걸. 기껏 받은 데이터를 원하는 대로 요리하지 못하는 나, 쓸만한 모델을 만들지 못하는 나에게 화가 난다. 내 능력이 한없이 부족하게 느껴지는 것과 비례하여 자기 데이터를 제대로 보지도 않는 오너들이 어이가 없다. 쏟아지는 신기술을 따라잡는 건 사실상 포기, 그런데 현업에서는 옛날 기술만 요구해서 성장은 정체된다. 산책이라도 하면서 냉정하게 판단하려고 노력을 하고 나름의 ..