제품 리뷰를 통한 인사이트 도출을 위해 자연어처리를 수강하신 차유진님

#수강생인터뷰 #데이터사이언스 #자연어처리

제품 리뷰를 통한 인사이트 도출을 위해 자연어처리를 수강하신 차유진님

현재 자연어처리 기술을 활용해 회사의 제품을 구매한 고객들의 리뷰를 통해 비즈니스 팀들이 손쉬운 인사이트 도출을 할 수 있도록 도와주는 프로젝트를 진행하기 위해 자연어처리를 학습하신 차유진님의 이야기를 들어보았습니다.

Q. 안녕하세요! 간단한 자기소개 부탁드립니다.

안녕하세요 차유진이라고 합니다. 현재 기업에서 데이터 엔지니어로 일하고 있고, 주요 하는 일은 데이터 파이프라인 및 인프라 구축, 빅데이터 모델링, 그리고 자연어 처리 분석 맡고 있습니다

Q. 혹시 어떤 계기로 자연어처리의 필요성을 느끼고 공부하시게 되셨을까요?

현재 NLP 기술을 활용해 저희 회사의 제품을 구매한 고객들의 리뷰를 통해 비즈니스팀들의 손쉬운 인사이트 도출을 위한 프로젝트를 진행하고 있습니다.
어느 정도 자연어 처리의 기본은 알고 있는 상태였기 때문에 간단한 전 처리로 통해서 프로젝트를 진행했는데, 온라인 리뷰 성격상 구조화되지 않은 텍스트 데이터(unstructured text data)에 관련된 문제점들을 느끼면서 조금 더 고도화된 기술들을 투입하고 싶었습니다. 특히 라벨이 잘 되어 있는 데이터가 많지 않았으며, 진행 하고 싶었던 프로젝트의 특성은 opinion mining을 위한 비지도화된 측면과 엔터티 도출(entity extraction), 그 위에 sentiment analysis, opinion summarization, 그리고 character CNN이나 BiLSTM을 통한 띄어쓰기 등등 시도해보고 싶었던 것은 많았는데, neural network쪽은 사용해본 경험이 많이 없었기 때문에 상용화에 초점을 맞춘 강의를 찾기 시작했습니다. 그러던 중 러닝스푼즈의 자연어처리 강의를 보게 되었고, 상용화에 초점을 맞춘다는 점은 저에게 큰 매력으로 느껴져 수강을 하게 되었습니다.

Q. 자연어 처리 강의를 제공하는 다른 매체(온라인강의, 블로그 책)도 있는데, 러닝스푼즈의 강의를 선택한 이유는 무엇인가요?

첫번째는 Tensorflow를 기반으로 한 상용화를 위한 수업이라는 점입니다. 요즘 PyTorch로도 상용화를 많이 하긴 하지만 여전히 Tensorflow 그리고 Tensorflow 2.0로 들어온 Keras API의 지원과 커뮤니티가 더욱 활성화되어 있어 Tensorflow를 위한 NLP 강의는 그때 당시 상황을 고려했을 때, 러닝스푼즈 강의가 제일 적합 했습니다.
두번째는 시간 단축의 이점이 있다는 점입니다. 온라인 강의 그리고 책으로도 여전히 많이 공부는 하고 있는데 제 경험으로는 가장 시간 대비 ROI가 뛰어난 공부 방법은 직접 강의를 수강하는 것 같아요. 특히 제가 얻고자 하는 것을 강사님께 물어 볼 수 있어서 시간이 매우 단축된다는 점이 저에겐 가장 큰 매력이었습니다. 온라인이나 책으로 모르는 게 있으면 보통 구글이나 스택 오버플로우에서 검색을 해야 되는데, 익히 아시겠지만 질문 자체가 제가 원하는 질문이 아니라면 한참 헤매야 합니다. 강사님한테 수업 중 또는 후에 질문을 하면 답이 바로 나오니 수업이 가치 있는 것 같아요.
마지막으로 커리큘럼을 미리 짜 주시는 것도 공부하는데 시간 단축이 많이 되는 것 같습니다.

Q. 그렇다면, 러닝스푼즈 자연어처리 강의만의 특별한 점 (가장 좋았던 부분)은 무엇인가요?

위 내용과 약간 비슷한 내용인데 러닝스푼즈 자연어 처리 강의에 특별한 점은 상용화에 초점을 맞춘 강의라는 점입니다. 특히 코드 리뷰를 친절하게 설명해주신 덕분에 수업 내에 제공해 주시는 코드를 cookbook처럼 사용할 수 있어서 좋았습니다.

Q. 실무적으로 자연어처리 강의를 들으며 자신에게 가장 도움이 되는 부분은 어느 부분이라고 생각하시나요?

위에 말한 것과 같이 일단 코드를 레시피처럼 내 마음대로 자유자재로 쓸 수 있어서 좋았고 현재 진행하는 프로젝트에서 여러가지 문제점들에 관해 질문을 많이 했는데 답변이 너무 시원해서 도움이 많이 됐습니다.

Q. 강의에서 들으신 자연어 처리를 업무에 적용한다면 어떤 부분을 기대할 수 있을까요?

저희 제품 구매 고객들의 반응에 관해서 판매 영업, 마케팅 팀들이 궁금해하는게 많아요. 어떤 사람들이 사는지 (나이, 성별, 연령대 뿐만 아니라 제품 구매자와 사용자와의 관계), 어떤 점이 좋아서 사는지 (제품의 가격이 합리적인 지, 제품 그 자체가 좋은 지 등등), 다른 회사 제품과 비교 해봤을 때 어떤 점이 더 좋은 지 나쁜 지, 전에 구매하던 제품들은 저가였는지 고가였는지, 등등 질문은 많습니다.
하지만 이런 인사이트를 도출하려면 focus group survey를 하거나 직접 리뷰를 읽을 수 밖에 없는데, 전자는 가격이 많이 나가면서 sample size는 작고, 후자는 특성상 정성적인 조사 밖에 안되는데, 이 강의를 통해 비용 절감, 높은 sample size, 그리고 정량적인 인사이트 도출 하는 application 만드는 데 도움이 많이 되었습니다.

Q. 실습을 통해 배웠던 내용을 업무에 적용하신다면, 어떤 부분을 기대할 수 있을까요?

Tensorflow를 이용해 위에 말씀드린 opinion mining 관련 된 feature들을 몇가지 만들 예정입니다. 또한, 실제로 NLP 개념을 이용하여 고객 리뷰를 분석하는 데에 활용해 다른 팀에게 도움이 될 수 있는 인사이트를 줄 예정입니다.

Q. 이 수업을 어떤 분에게 추천하고 싶나요? 현재 수강을 고민하는 분들에게 하시고 싶은 말이 있다면?

자연어처리 관련 앱이나 대시보드를 만들고 싶은 사람한테 추천 드리고 싶습니다. 특히 python 활용 능력이 중급 정도 되고, logistic regression같은 기본적인 머신 러닝 기법을 잘 아시는 분, 예전에 tensorflow 좀 다뤄 보신 분들에게 추천 드리고 싶습니다. 수업 내용이 어려운 부분이 있기 때문에 미리 어느정도 공부를 하신다면 강의를 통해 시간을 효율적으로 활용하실 수 있으리라 생각됩니다.