파이썬을 활용한 텍스트마이닝 첫걸음
- 6주 만에 완성하는 나만의 한국어 텍스트 분석 프로그램

 

텍스트마이닝 기본기를 위해 준비된 커리큘럼

6주동안 텍스트 분석의 기본기를 다지는 것은 물론, 실무에서 바로 활용할 수 있는 텍스트 분석 프로그램을 완성하는 것을 목표로 합니다.
 
- '한국어 텍스트'분석 기본기
- 데이터를 한눈에 볼 수 있는 '시각화'
- 파이썬 코드로 '구현'하여 완성된 프로그램

 

한국어 텍스트 분석을 업무에 바로 활용할 수 있도록 알려드립니다. 텍스트마이닝 기법이 필요한 것은 수 많은 데이터, 그중에서도 텍스트 속에 담겨있는 의미를 파악하기 위한 것이죠. 본 과정을 통해 완성되는 텍스트 분석 프로그램을 업무에 바로 활용해보세요.

파이썬을 활용한 텍스트마이닝 첫걸음
파이썬 입문자를 위한 특별 이벤트

본 과정은 파이썬 기본 문법을 알고 계신분들을 대상으로 합니다. 다만, 꼭 수업에 참여하고 싶은 입문자 분들을 위해 온라인 학습 자료를 제공드립니다.

※ 사전 학습 자료는 카톡으로 문의바랍니다.

일    정05.18 ~ 06.22 | 6회
매주 토요일 10:30 ~ 13:30 | 일 3시간
총 18시간 강의
정    원15명
준비물노트북
가    격90만 원70만 원
장    소러닝스푼즈 강의장
강남대로94길 15, S2빌딩 3층

*강남역 11번 출구 3분 거리 (지도확인)

강의특징

러닝스푼즈에서 수강해야 하는 이유

실제 비즈니스 프로젝트에
기반한 커리큘럼

본 과정은 자동차 고객 후기 분석 및 전세계 수만건의 뉴스 데이터에서 정보를 추출하는 프로젝트 등의 실제 비즈니즈 사례를 바탕으로 구성되었습니다. 또한, 텍스트 마이닝을 보다 쉽게 접근할 수 있도록 노래 가사를 이용해 진행하며 실무에 도움되는 핵심 내용을 선별하여 수업합니다.

로보어드바이저
텍스트 분석 총괄

강사님은 현재 인사이저에서 로보 어드바이저의 알고리즘에 반영될 수 있도록 매일 생성되는 전세계 수만건의 뉴스 데이터에서 정보를 추출하여 요약 및 가공하는 업무를 담당하고 있습니다. 텍스트 분석을 통해 실제 비지니스를 개선하고 있는 강사님의 프로세스와 노하우를 전달하고 있습니다.

종강 후 가져가는
한국어 텍스트 분석 프로그램

형태소 분석, 연관어 분석, 토픽 모델링 등 매주 단계별로 텍스트 분석 프로그램을 완성해갑니다. 6주의 수업이 끝난 후엔, 완성된 한국어 텍스트 분석 프로그램을 통해 본인이 가진 자소서, 뉴스, 고객 후기, 상품 후기 등 다양한 테이터를 적용해볼 수 있습니다.

실습예시

텍스트 분석 프로세스를 단계별로 진행하며, 각 방법에 따른 시각화도 함께 다룹니다.

(TF-IDF)
노래별 핵심 키워드 찾기

SNA / Heatmap / Visualization
텍스트 분석 방법에 따른 시각화

강화역량

6500곡 이상의 가사를 분석하며, 텍스트 분석 역량을 강화할 수 있도록 합니다.

파이썬 문법 리뷰

파이썬 반복문/ 조건문/ 리스트/ 딕셔너리/ 문자열/ 함수/ 판다스

형태소 분석

긴 노래 가사를 의미 단위로 나누어 살펴보기

의미 정리하기

중요하지 않은 단어 제거 / 비슷한 단어 통합 하기 / 키워드 별 주요 단어 살펴보기

소셜 네트워크 분석 (SNA)

노래 가사 속 단어의 관계 분석하기

토픽모델링 (LDA)

이 많은 걸 언제 다 보지? 토픽 뽑아서 살펴보기

어휘 비교 분석

가수별 주요 사용 어휘 비교 분석하기

핵심 키워드 찾기

노래별 핵심 키워드 찾기(TF-IDF)

수강대상

텍스트 분석으로
고객의 진짜 마음, 생생한 후기를 알고 싶은 분

수천곡의 노래 가사 분석으로
트렌드를 파악하고 싶은 분

6주동안 완성한 분석 프로그램을
업무에 바로 활용하고 싶은 분

자소서, 후기, 노래 가사
작성한 사람의 생각을 알고 싶으신가요?

파이썬을 활용하여
텍스트 마이닝을 해보고 싶은 분

파이썬의 자료형(list, dictionary)에 대해 알고 있다.
반복문(for, while)과 조건문(if)의 사용법을 알고 있다.
"2"(str) 와 2(int) 의 차이점을 알고 있다.
 
본 과정은 파이썬 기본 문법을 알고 계신분들을 대상으로 합니다.
다만, 꼭 수업에 참여하고 싶은 입문자 분들을 위해 온라인 학습 자료를 제공드립니다.
 
※ 사전 학습 자료는 카톡으로 문의바랍니다.

텍스트마이닝 사례

01

국내 대기업, 텍스트마이닝을 활용해 업계 1위 달성

42억 건에 달하는 SNS 글을 수집하고 분석한 결과, 만두와 맥주 안주에 대한 키워드가 급증한 것을 발견한 트렌드전략팀은 '맥주 안주 마케팅'을 활발히 전개하여 업계 1위로 자리매김하였다.

02

해외 쇼핑몰, 방문자 성향 분석으로 마케팅 효과 급증

SNS 댓글 기반으로 토픽 모델링 및 감성 분석을 수행하여, 쇼핑몰에서 제공되는 서비스에 대한 고객의 긍정/부정적인 경험을 확인하고 정확한 니즈를 바탕으로 브랜드 개선활동 전개하여 재방문율 개선할 수 있었다.

03

수제화 브랜드,
연관어 분석으로
구매 결정적요인 발견

온라인 커뮤니티 데이터 분석을 통해 수제화에 관심있는 소비자의 특징이 사업 초기 예상했던 모델과 다름을 파악하고, 구매결정요인을 반영한 마케팅 활동과 타겟팅을 통해 매출 급등하였다.

커리큘럼

* 회차별 주제를 클릭하면 상세한 커리큘럼이 나옵니다.

1주차. 텍스트 분석 준비하기 : 네이버뮤직 크롤링 실습

텍스트 분석에 활용되는 파이썬 함수와 라이브러리에 대해 점검해보는 시간입니다.
앞으로 파이썬을 활용한 코드 작성에 어려움이 없도록 꼭! 필요한 기초 문법을 함께 리뷰하고, 다루게될 데이터에 대해서도 확인합니다.  
 

이론

  • 딕셔너리 / 리스트 / 문자열
  • 반복문 / 조건절 / 함수
  • 판다스(자료 읽어오기 / 저장하기)

실습

  • 데이터분석 자료 준비하기: 네이버뮤직 크롤링 자료 소개
  • 여러 개의 엑셀 파일에서 데이터 통합/정리 하기

2주차. 긴 노래가사 의미단위로 나누어서 살펴보기 : 형태소 분석

3주차. 텍스트에서 의미 찾아보기 : 데이터 전처리

4주차. 노래 가사 단어간의 관계 분석하기 : 네트워크 분석(SNA)

5주차. 주제 분류하기 / 가수별 노래 가사 비교하기 : 토픽모델링(LDA)

6주차. 노래 핵심 키워드 찾기 : TF-IDF 개념 및 실습

강사소개 및 인터뷰

장남수 강사님

(현) 인사이저 텍스트분석 총괄
(전) 아모레퍼시픽
- 제품 수요예측
- 재고 및 공급 망 관리
- 데이터분석 프로젝트 진행

- 성향분석기반 추천 서비스 기술자문
- SNS 분석을 통한 예측 시스템 기술자문
- 데이터분석 컨설팅 및 기술자문
- 크롤링 전문 회사 기술자문
- 자동차 VOC 분석 프로젝트
- "마케터를 위한 파이썬 데이터분석(가제)" 출간예정
- POSTECH 산업경영공학과

1. 자기소개 부탁드립니다.

안녕하세요. 인사이저에서 텍스트분석 총괄로 일하고 있는 장남수 입니다. 인사이저에서는 로봇어드바이저리의 알고리즘에 반영될 수 있도록 매일 생성되는 전세계 수만건의 뉴스 데이터에서 정보를 추출하여 요약/가공하는 등의 텍스트 분석 업무를 진행하고있습니다 주말에는 데이터분석/머신러닝 스터디 운영, 마케터를 위한 데이터분석 입문 책을 집필을 하고 있으며 웹크롤링 및 분석 강의도 꾸준히 진행하고 있습니다.

 

2. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

강의에서는 1980년대부터 2010년까지 주요 인기가요 6500곡 이상의 노래 가사를 분석해볼 예정입니다. 기존에 따라 부르던 노래들을 텍스트 데이터로 접하는 것도 색다른 재미가 있을 것 같습니다. 노래 가사를 지루하지 않게 분석해보면서 내용 및 진행과정에 대해 익히고, 실제 업무에는 어떻게 적용할 수 있을지 살펴볼 예정입니다.

 

3. 본 강의에서 배운 내용을 수강생분들이 어떻게 활용할 수 있을까요?

텍스트 분석은 비정형 데이터를 분석하는 방법입니다. 비정형 데이터는 숫자로 이루어져 있지 않은, 글로된 데이터를 말하죠. 이 텍스트 안에는 작성자의 감정, 의견, 주장들이 그대로 표현되어 있습니다. 주관적이고 측정하기 쉽지 않은 것들이죠. 과거에는 산업계에서 이러한 비정형 데이터들은 크게 신경을 쓰지 않았습니다. 다루기 어렵기도 하고, 하나 하나 들여다 보는 것은 효율(?)이 낮다는 이유도 있었습니다.

하지만, 산업이 바뀌면서 고객의 입소문에 따라 성과가 좌우되거나, 고객의 의견이 제품이사 서비스에 직접 반영되는 경우가 많아지면서 고객의 목소리가 매우 중요해졌습니다. 여러분 바로 앞에 있는 수많은 비정형 데이터 속에서 인사이트를 얻고싶은 분들께 본 과정을 추천 드립니다.

 

4. 주로 어떤 분야에 있는 분들이 수강대상에 적합할까요?

비정형데이터를 활용하려는 모든 분들이 대상이 될 수 있으며 아래에 해당하는 분들이 활용도가 높으실 것 같습니다.
- 매일 많은 문서를 처리하는 것이 주요 업무이신 분(ex. HR, 리서치)
- 웹 상에서의 고객 반응, 동향, 후기 등을 분석하여 제품/서비스 개발 및 마케팅에 활용하고 싶은 분
- 고객 VOC 데이터에서 홍보/마케팅 인사이트를 얻고자 하시는 분
- 노래 가사 분석으로 트렌드를 파악하고 싶은 분

 

5. 다른 강의와 어떤 차별점이 있나요?

이론을 설명하고 실행 버튼만 누르는 강의가 아니라, '타닥타닥' 타이핑 소리로 가득한 강의입니다. 코드를 띄워놓고 설명하고, 주어진 코드를 실행하는 것은 강의하기 쉬우며, 이해했다고 착각할 수 있는 쉬운 방법입니다. 스스로 고민하는 시간이 있더라도 강의시간에 직접 한 줄씩 코드를 입력하고 실행할 수 있어야 돌아가서도 기억에 남을 수 있습니다.

따라서 우리 강의는 직접 코드를 입력해보고, 발생하는 많은 에러 코드와 오류들을 함게 확인해보며 진행할 예정입니다. 강의가 끝난 뒤 '아, 이런게 있구나..' 하고 돌아가서 어디서부터 시작해야 할 지 모르는 강의가 아니라, '아! 이걸 어디에 적용해볼까?' 라는 호기심이 생기는 강의가 되었으면 합니다.

 

6. 마지막으로 수강생들에게 하고 싶으신 말

텍스트 분석은 비정형 데이터를 정형 데이터로 변환하는 과정에서 많은 고민과 가정이 생깁니다. 그 속에서 정보가 사라지기도 하고, 생기기도 하며, 숨어있기도 합니다. 또한 주관이 개입될 여지가 꽤많은 부분인데, 이것 때문에 텍스트 분석은 도메인 지식이 풍부한 실무 담당자가 가장 잘 할 수 있습니다. 다른 분에게 맡기지 마시고, '텍스트 분석' 도 가능한 실무 전문가가 되시는 건 어떠실까요?

텍스트 분석을 할 수 있다면, 쇼핑몰 댓글/ 블로그/ 까페/ VOC/ 업계 동향 분석 등 할 것이 정말 많습니다. 우리에게 필요한 진짜 정보는 '숫자' 속에 있는 것이 아니라, '말' 속에 있지 않나... 하는 생각을 합니다. 텍스트 분석을 배워 직접 해보시면 정말 쓸모가 많다고 느끼실 것입니다.

텍스트를 분석하는 기술적인 부분은 제가 알려드리겠습니다. 분석에 필요한 내용과 고민, 해석 방향에 대해서 함께 고민해보면 좋을 것 같습니다. 개강일에 뵙겠습니다.

 

수강료 90만 원70만 원
 
수강신청은 결제 순으로 선착순 마감될 수 있습니다.
개강 후 환불은 학원법 시행령 <제18조 제3항> 수강료 반환기준에 의거합니다.
 
*환불 세부규정 확인하기 (클릭)

▼ Python 을 처음 사용하시나요? ▼