R을 활용한 통계부터 머신러닝까지! 나성호 강사님

#강사인터뷰 #나노디그리 #R

R을 활용한 통계부터 머신러닝까지! 나성호 강사님

데이터 분석가

러닝스푼즈 나노디그리 [TO BE! DATA ANALYST] 과정 중 R을 활용한 통계부터 머신러닝까지 가르치실 나성호 강사님을 만나 대화를 나누었습니다.

Q. 안녕하세요. 나성호 강사님! 간단히 자기소개 부탁드립니다.

안녕하세요? 나성호입니다. 저는 약 17년 간 다양한 금융회사를 다니면서, 고객 데이터를 분석하고 직접 마케팅을 수행하는 업무를 가장 많이 하였으며, 현재는 ‘헬로데이터사이언스’라는 작은 회사를 운영하면서 R과 Python을 활용한 데이터 분석 전반에 관하여 강의하고 있습니다. 오랜 기간 기업 현장에서 마케팅 데이터 분석가로 근무했던 경험을 토대로 현업에서 데이터 분석 업무를 담당하시는 수강생분들께 조금이나마 도움이 되는 내용을 전달해드리고자 노력하고 있습니다.

Q. 데이터 분석가로서 R과 파이썬을 모두 안다는 것은 어떤 강점이 될까요?

저는 R과 Python을 둘 다 알아야 한다고 생각하는데요. 일단 두 가지 언어가 가진 뚜렷한 특징이 있습니다. R은 통계학자가 개발한 언어이다 보니 통계 분석에 강력한 패키지를 다수 포함하고 있으며 특히 강력한 시각화를 가능하게 합니다. 머신러닝 알고리즘을 적합하고 해석하는 부분도 R이 강점을 가지고 있습니다. 다만 분석 결과를 활용하려면 회사의 시스템에 탑재해야 하는데 이 때는 Python이 사용될 수 있습니다. 아울러 Python은 Tensorflow 등 딥러닝을 할 때 반드시 알아야 할 언어가 됩니다(물론 R에서도 딥러닝을 할 수 있습니다). 결론은 두 가지 언어를 모두 잘 다룰 줄 알면 매우 뛰어난 역량을 가진 분석가가 된다고 할 수 있습니다.

Q. R을 활용한 통계부터 머신러닝까지 모든 과정을 담당하고 계시는 데, 그렇다면 수업에서는 주로 어떤 내용을 다루시고 또 어떤 형태로 진행되나요?

우선 R을 잘 다룰 수 있으려면 R 자료형과 프로그래밍 언어에 대해서 체화하고 있어야 합니다. 따라서 이번 강의에서는 R 자료형과 프로그래밍 기초부터 시작합니다. 아울러 데이터 분석에 필요한 기초 통계 지식에 대해 가능한 적절한 예시를 들어 전달할 예정입니다. 그리고 제가 금융회사에서 오래 근무했던 경험을 살려 현업에서 데이터 분석가가 갖추어야 할 역량에 대해 소개하겠습니다.

Q. 강사님께서는 아무래도 현업에서 오래 계셨다보니 다양한 에피소드가 있을 것 같아요. 하나만 소개해주실 수 있나요?

R은 단순히 데이터 분석 도구로만 사용되지 않습니다. 실제로 Python으로 할 수 있는 거의 모든 것을 R로도 할 수 있습니다. 저는 웹 크롤링과 텍스트 마이닝도 강의하고 있는데요. 실제로 현업에서 블로그나 뉴스 댓글 등을 크롤러로 수집하여 텍스트 마이닝을 통해 다수의 공통된 의견을 정리하는 보고서도 다수 작성한 바 있습니다. 물론 제가 가장 많이 했던 것은 분류모형을 만들고 타겟 마케팅 캠페인에 활용했던 것입니다. 예를 들어, A라는 신용카드가 새로 출시되었을 때 기존 신용카드 고객 대상으로 Outbound TM을 통해 카드 발급을 권유하는 타겟 마케팅 캠페인을 진행하려고 했을 때, 어떤 고객이 반응할 것인지 여부를 분류하는 모형을 만들었습니다. 모형의 타겟 고객 리스트로 O/B TM을 실행했을 때 타겟 그룹 고객의 평균 반응률이 임의로 뽑은 통제 그룹 고객의 반응율 보다 3배 이상 높은 결과를 얻은 적이 있습니다.

Q. 본 수업에서 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?

직장 경험이 없는 학생들이라면 현업에서 데이터 분석을 하는 이유에 대해 이해하고 있어야 합니다. 그 이해를 바탕으로 현업에서 수익을 높이거나 비용을 감소할 수 있는 문제를 설정해야 하고, 설정된 문제에 따라 목표변수를 먼저 정의할 수 있어야 합니다. 아울러 목표변수와 상관성이 있는 것으로 보이는 다양한 입력변수들로 분석 데이터셋을 구성한 다음, 강의 중에 소개해드리는 다양한 머신러닝 알고리즘을 활용하여 다양한 모형을 적합하고, 모형들의 성능을 비교함으로써 최적의 모형을 선택할 수 있습니다. 마지막으로 최종 모형의 의미를 해석함으로써 실제 업무에 활용할 수 있는 액션플랜을 도출할 수 있어야 합니다. 이와 관련된 내용은 강의 도중에 설명해드리겠습니다.

Q. 끝으로 수강생분들께 말씀 부탁드립니다!

R은 프로그래밍 언어입니다. 저는 영어 공부하는 것과 같은 방법을 사용해야 한다고 생각합니다. 즉, 가능한 많은 코드를 접하고, 무조건 직접 손으로 몇 번이고 반복해서 코딩을 해봐야 합니다. 코드를 눈으로 읽고 해석할 수 있다고 해도 아직은 자신의 것이 아닙니다. 손가락에 코드를 익혀야 비로소 자신의 것이 됩니다. 이번 강의에서 전달해드리는 강의 내용을 제대로 습득하려면 상당한 시간이 소요될 것이므로, 우보천리의 마음가짐으로 꾸준하게 학습하시면 바라시는 바를 성취하실 있다고 저는 확신합니다.