본문 바로가기

책읽기

[파이썬 라이브러리를 활용한 데이터 분석, 3판](2023, 웨스 맥키니 著,김영근 譯)

 

● pandas 창시자의 3번째 버전

- 파이썬으로 머신러닝을 하건, 데이터 분석을 하건 데이터 파일을 읽어야 하고,

- 엑셀처럼 친절하지는 않은 파이썬에서 데이터를 읽고 처리하는 대표 라이브러리는 pandas.

- 저자인 웨스 맥키니(Wes McKinney)는 이 pandas의 창시자이다.

- 그리고 이 책은 파이썬 분야의 가장 대표적인 데이터 분석 입문 서적 중 한 권으로 자리매김하고 있다.

- pandas의 버전업과 수요의 변화에 맞춰 조금씩 변화를 주고 있는데, 이번에 3번째 버전이 나왔다.

 

● 버전이 바뀐다는 것의 의미

- 나도 몇년 전, pandas를 공부할 때 이 책의 도움을 받았다.

- 구글링을 열심히 하면서 봤던 apply와 달리 groupby를 찾아봤던 기억이 난다.

- 인터넷으로 공부할 때는 당장 쓸 코드를 찾아볼 수 있어서 좋고 

- 책으로 공부할 때는 앞뒤 설명을 통해 기술의 맥락을 파악할 수 있어서 좋다.

- 그런데 같은 책의 버전이 바뀌면 기존 버전을 갖고 있던 사람 입장에서는 느낌이 묘하다.

- 새 책을 또 사서 봐야 하나? 는 마음이 드는게 하나. 내가 알고 있는게 이젠 틀리게 된걸까? 하는 불안이 또 하나.

- 여기에 하나를 더 한다면 새로운게 또 뭐가 나온걸까? 대체 뭘 또 봐야되지? 라는 느낌이 하나.

- 잠시만 한 눈을 팔면 발전의 속도를 넘어 방향이 바뀌는 분야다보니 변화에 민감하기 때문이다.

 

● 2판과의 차이

- 출판사의 설명에도 간결하게 정리되어 있지만, 2판과 목차를 비교해봐도 큰 차이는 없다.

- 파이썬과 numpy 등 라이브러리의 버전 업에 따른 문법 변화 정도가 반영되었고

- 범주형(categorical) 자료형과 래핑되지 않은 groupby에 대한 설명이 추가된 정도.

- 2판을 가지고 있는 분들은 조금 안심해도 될 것 같고

- 아직 데이터 분석을 시작하지 않은 분들은 고민할 것 없이 이 책을 고르면 될 것 같다.

 

● ChatGPT와 pandas-ai 시대, 기본기의 의미

- ChatGPT의 등장 이후 데이터 분석의 판도가 많이 바뀌었다.

- 궁금한 내용을 물어보면 몇 초만에 중급자 이상 수준의 깔끔한 코드를 뱉어주는 ChatGPT의 등장으로

- 페이지를 하나 하나 넘겨가며 들춰봐야 하는 책으로 하는 공부는 조금은 구식으로 느껴지기도 한다.

- 심지어 구글링조차 무의미해지는 느낌이다.

- 수많은 검색결과 중 하나를 골라야 하는 것이 아니라 정답에 가까운 코드를 한 번에 주기 때문이다.

- stackoverflow도 방문객을 많이 잃었다는 통계가 이 전반적인 분위기를 단적으로 말해주고 있다.

- pandas는 숙련자와 초심자의 스킬 차이가 많이 나는 라이브러리인데, ChatGPT가 이 차이를 없앴다.

- 심지어 ChatGPT가 탑재되어 복잡한 데이터 분석을 프롬프트로 처리하는 pandas-ai도 등장했다.

- 이런 시기에 노력을 들여 기본기를 익혀야 하는 의미를 다시 새길 필요가 있다.

 

● 분석가의 머리에서 눈과 손까지의 거리

- ChatGPT가 내놓는 코드가 100%가 아니라는 답은 충분하지 않다.

- GPT 모델이 추가 학습을 게을리한다 해도 하나 둘 붙는 plugin들로 점점 세밀한 기능이 강력해 질 것이기 때문이다.

- 분석가의 역량은 몰입도에 크게 좌우된다고 생각한다.

- 실력이 좋은 분석가라도 계속 울리는 전화벨과 밥먹고 합시다~ 하는 소리에는 장사가 없다. 그래서 귀를 막는다.

- 눈 앞에 있는 데이터는 분석가의 머리에서 아이디어로 꽃피어야 하고, 다시 손으로 빠르게 옮겨져야 한다.

- ChatGPT에게 물어보는 횟수와 시간이 줄어들수록 눈, 머리, 손 사이의 거리는 짧아진다.

- 구글링과 ChatGPT를 통해 야전에서 생존능력을 기르는 것도 중요하지만, 

- 가끔은 여유를 내서 구슬같은 지식들을 한 차례 꿰기를 권한다.

- 구슬을 꿰다 보면 비로소 보이는 빈 자리가 있고, 있는지도 몰랐던 구슬이 나오기 때문이다.

 

※ 한빛미디어 2023 도서 서평단 "나는 리뷰어다"의 일원으로 도서를 제공받아 작성한 리뷰입니다.