회사에서 정산 시스템을 개발하면서 데이터를 다루는 일이 많아졌다. 데이터 자체를 다룬 건 꽤 오래됐지만, 체계적으로 분석이라는 걸 해본 건 최근 몇 년의 일이다. 그 사이 습관처럼 굳어진 방식들을 점검해보고 싶어서 집어 든 책이다.
저자 윤기태 / 한빛미디어 / 2020.02
인상
이론보다 ‘흐름’에 집중한 책이다. EDA(탐색적 데이터 분석)부터 텍스트 마이닝, 시계열 예측, 추천 시스템까지 실용적인 예제를 단계적으로 따라가는 구성이라 막힘 없이 읽을 수 있었다.
특히 “데이터에 질문을 던지는 것”이 분석의 출발이라는 메시지가 인상적이었다. 당연한 말 같지만, 실무에서는 쿼리 짜는 데 급급해 정작 무얼 보려 하는지 흐릿해지는 순간이 많다. 다시 상기시켜 주는 대목이었다.
코드 예제도 깔끔하고 따라 하기 좋았다. 특정 라이브러리 사용법을 암기하는 것보다 분석 사이클 전체를 한 흐름으로 경험하게 해준다는 점이 이 책의 강점이다.
데이터를 오래 다뤘지만 분석이라는 관점에서 접근해본 게 얼마 안 됐다면, 가볍게 시작하기에 좋은 책이다.