러닝스푼즈 나노디그리 [TO BE! DATA ANALYST] 과정 중 '데이터 과학을 위한 R & 통계' 강의를 맡으신 이윤환 강사님을 만나 대화를 나누었습니다. 왜 통계를 배워야 하는지 흥미롭게 설명해주시는 강사님의 인터뷰를 들어볼까요?

 

Q1. 안녕하세요. 이윤환 강사님! 수강생분들께 간단하게 자기소개 부탁드립니다.

 

이윤환 강사님 : 네. 안녕하세요. 저는 이번 [TO BE! Data Analyst] 과정에서 시작인 데이터 과학을 위한 R & 통계 부분을 담당하게 된 이윤환입니다.
 

저는 모든 생활에서 관심있는 것들을 연구하고 있는 컬처랩을 운영하고 있습니다. 어린 시절부터 컴퓨터를 접해오며 비교적 프로그래밍에 대해서 일찍 접할 기회를 갖게 되었고, 이를 장점으로 삼아 대학에서 통계학 석/박사를 수료하게 되었습니다.
 

지난 10여년 간 대학에서 통계, 데이터베이스, 웹 등의 지식들을 강의했으며 KOCW를 통해 공개 강의를 진행한 경험이 있습니다.
 

저는 사회에 대한 관심이 많아 사회경제, 사회혁신 등의 분야에서 연구를 진행하고 있으며 통계를 통해 지역의 현상을 파악하고 이를 다른 사람들과 나눈 일을 주업무로 하고 있습니다.

 


 
 
Q2. 말씀을 들어보니 강사님께서는 꽤 오랜 기간동안 통계 관련 연구를 해오신 것 같아요! 그렇다면 강사님이 생각하시기에 데이터 사이언스에서 통계를 안다는 것은 어떤 장점이 있을까요?

 

이윤환 강사님 : 네이버 국어사전에 따르면 통계는 “어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자로 나타낸 것” 으로 정의하고 있습니다. 이 정의에 따르면 각종 현상에 대해 단편적인 증거가 아닌 “종합적”인 증거를 제시하는 데 통계는 목적이 있다고 말할 수 있을 것입니다.
 
한번 예를 들어 보겠습니다. 지난 2015년, 통계청의 통계 활용 수기 공모전에서 대상을 받은 “통계로 튀기는 치킨”을 살펴보면 단순히 치킨 판매량의 평균을 구하는 것이 아닌, 치킨 판매에 영향을 미치는 요인(날씨, 이벤트 등)을 고려하여 치킨 판매량을 예측하여 이에 따른 재료 준비 등을 통해 합리적인 운영에 도움이 되었다는 결과를 확인할 수 있습니다.
 
이렇듯 통계는 단순히 계산하는 과정만이 아닌 어떤 현상이 발생하는 것에 영향을 미치는 요소를 파악하기 위해 필요합니다. 통계는 특히, 사회 전 분야에 대한 통찰력을 필요로 하는 학문으로 통계에 대한 지식과 경험으로 데이터 통찰력을 키운다면 실제 현상을 파악하는데 큰 도움이 될 것입니다.
 
또한, 최근 통계는 전통적으로 생각하는 통계 개념인 수리적 방법과 함께 컴퓨터를 활용한 분석 등을 적극적으로 받아들이고 있어 더욱 다양한 사회현상과 자료의 형태에 상관없이 효율적인 분석을 할 수 있게 되었으며 이는 우리의 삶에 큰 도움이 되는 방향으로 발전하고 있습니다.

 


 
 
Q3. 해당 과정에서 R을 사용한 통계 강의를 맡게 되셨어요! 수업에서는 주로 어떤 내용을 다룰 예정이신가요? 그리고 수업은 어떤 형태로 진행되나요?

 

이윤환 강사님 : 사실 여러분은 알게 모르게 학교 수업과정에서 많은 통계 관련 지식들을 배워왔고 접해왔습니다. 하지만, 많은 사람들이 문제 푸는 것에만 익숙하여 이 지식을 실제 현상에 어떻게 적용할 지 모르는 경우가 대부분입니다.
 
우선 이 수업을 통해서 여러분은 우리가 알고 있는 지식들을 실제 상황에 맞춰 제 이해하는 과정에 초점을 맞춰 강의를 진행할 예정입니다. 또한 이렇게 배운 내용은 보다 상위 과정의 지식에서도 사용할 수 있도록 여러분의 기초체력을 키워드리고자 노력할 것입니다. 기초 체력으로 여러분이 보다 어려운 상황을 이해할 수 있도록 도움을 드리려 합니다.
 
그렇기 때문에 이론과 실습을 병행하여 강의를 진행할 예정입니다. 또한 그 안에서 제가 배워온 노하우를 여러분께 전수하고 과정 과정마다 여러분과 소통할 것입니다.
 
교육에 있어서는 상호작용이 중요하다고 생각해요. 그렇기에 수강생 여러분과 많은 대화를 나누며 함께하고자 합니다.

 


 
 
Q4. 이 수업이 끝난 후, 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?

 

이윤환 강사님 : 본 과정은 데이터 분석가 과정이며, 그렇기 때문에 데이터 과학을 위한 통계를 주로 배우게 됩니다.
 
미디어를 통해 나오는 통계 결과물들 중에는 현상을 올바르게 이해하지 못한 채로 숫자로만 이야기한다 거나 그래프 등에서 눈속임을 통해 과장된 연출도 많아지고 있습니다. 수강생분들은 이 과정을 통해 미디어를 통해 전달되는 각 종 통계들을 제대로 이해하며 올바른 지식 수용이 이뤄질 수 있도록 학습한 뒤 통계를 바라보는 시각을 바로 잡을 수 있을 것입니다.
 
또한 이 과정을 통해 정확한 정보를 습득하는 방법을 제공할 것이며 여러분이 만약 정보 제공자가 된다고 했을 때 어떻게 해야 올바른 정보를 전달할 수 있는 지 그 방법도 익힐 것입니다.
 
무엇보다 실제 상황에 대한 올바른 이해를 갖기 위해서는 데이터 통찰력을 키우는 것이 중요합니다. 이러한 통찰력을 키워 여러분이 증명하고자 하는 현상을 설명하는 데에 있어, 필요한 데이터를 조합하여 보다 정확한 정보를 전달할 수 있도록 그 방법을 배워 가실 수 있을 것이라 기대됩니다.

 


 
 
Q5. 강사님께서 컬쳐랩을 운영하시며 데이터를 수집 및 분석하신다고 하셨는 데, 데이터 수집 및 분석을 하면서 가장 흥미로웠던 주제는 무엇인가요?

 

이윤환 강사님 : 저희는 설문조사, 방문조사, 현장조사, 센서를 이용한 데이터 수집 외에도 공공데이터 포털을 적극적으로 사용하고 있습니다.
 
최근 기억에 남는 자료는 “노년층이 춘천에 얼마나 많이 올까?”하는 문제였습니다. 우연히 “노년층의 무임승차”에 대한 기사를 접하고 공공데이터 포털을 통해 코레일이 운영하는 전철 각 역의 승 하차 인원을 확인할 수 있었습니다. 하지만, 이 데이터셋에는 노년층의 무임승차 자료는 빠져 있었기 때문에 관련 정보가 필요하였고 저희는 이 자료를 코레일에 요청하여 필요한 자료를 받을 수 있었습니다.
 
이 자료에는 시간대별로 각 역의 승차인원과 하차인원이 있으며 춘천역과 남춘천역은 경춘선 구간의 마지막 역이므로 상행, 하행에 대한 파악에 어려움이 없어 빠르게 경향을 확인할 수 있었습니다. 노년층의 지난 1년간 춘천 방문 횟수를 측정하기 위하여 오전 11시 이후 오후 4시 이전 방문자로 한정하여 대략 그 크기를 가늠할 수 있었습니다. 이 자료를 통해 원래 알고자 했던 것 외에 남춘천역과 춘천역 이용객들의 패턴을 확인할 수 있었습니다.
 
그 패턴은 다름 아닌 남춘천역을 주로 목적지로서 많이 방문하고 있으며, 춘천에서 돌아갈 때에는 남춘천역보다는 춘천역을 사용한다는 것이었습니다. 이를 잘 적용하면, 춘천을 방문하는 방문객들에게 최적의 여행 경로를 제공하여 춘천에 대한 이미지는 더욱 키울 수 있을 것이라 생각했습니다.
 
흥미로운 주제보다 데이터의 자유분방함이 데이터를 연구하는 사람들에게 큰 호기심을 주는 것이 아닐까 생각합니다.
 

데이터는 원래 목적을 확인하는 과정에서 계속해서 살펴보고 파악할수록 다른 내용들을 확인할 수 있다는 게 정말 매력적인 것 같네요.

 


 
 
Q6. 인터뷰에 응해주셔서 감사합니다. 마지막으로 수강생들에게 하고 싶으신 말씀 해주세요.

 

이윤환 강사님 : 일단 제가 하고싶은 가장 큰 한마디는 ‘저에게 질문을 많이 해주세요’ 예요. 대학 강의를 하며 학생들을 만날 때 마다 비슷한 내용을 가지고 진행하지만 학생들의 질문이 많을수록 더 깊고 많은 내용들을 다룰 수 있게 된 것 같습니다.
 
MIT OCW를 처음 시작할 당시 비싼 등록금을 내고 학교에 다니는 학생들이 누려야 할 강의 자료들이 외부에 공개되는 것은 문제되지 않느냐는 질문에 MIT 총장님은 “교육은 강의 자료가 아닌 교실에서 교수와 학생 간의 상호작용”이라는 말이 기억에 남네요.
 
좋은 강의자료는 인터넷과 서점에 가면 많이 있을 거예요. 하지만 제가 여러분과 강의실에서 만나는 것은 강의자료가 아닌 저만의 경험으로 여러분과 교류하는 것이니 그것을 통해 얻어가는 것이 여러분에게 더 도움되지 않을까 싶습니다. 궁금한 점이 생기면 무엇이든 물어봐주세요.


 
 
 
 


 
 
 
 
 
 
 
※ 데이터 분석가로 커리어를 시작하고 싶다면?