R 데이터 분석

R을 활용한 데이터 분석 및 시각화

- 현업 적용을 위한 데이터 분석 및 시각화 대시보드 제작까지!

난이도
3/5

R을 활용해 데이터 분석은 물론 시각화 및 대시보드 제작까지 –

결과물을 현업에 바로 활용해 성과를 높여보세요!

 

 

✓ R은 다뤄봤는데 현업에 적용하지 못할 때

✓ R 기초를 다지고 데이터 분석 스킬셋을 향상시키고 싶을 때

✓ 데이터 분석을 넘어 결과물을 원하는대로 시각화하고 싶을 때

✓ 인터랙티브한 결과물을 만들어 나만의 대시보드를 제작하고 싶을 때!

 

 

데이터를 직접 수집하는 것부터 전처리, 시각화하는 것까지!

마케팅/서비스/영업/인사 등 어떤 분야에서든

R을 활용해 성과를 창출해낼 수 있도록 만들어 드립니다.

일    정04.11 ~ 05.23 | 6회
매주 토요일 10:00 ~ 13:00 | 일 3시간
총 18시간 강의
*휴강일 : 05월 02일 연휴
정    원15명
준비물노트북
가    격85만 원60만 원
장    소러닝스푼즈 강의장
강남대로94길 15, S2빌딩 4층

*강남역 11번 출구 3분 거리 (지도확인)
미래의 경쟁력을 결정할
R을 활용한 데이터 분석 및 시각화!
딱딱한 이론으로 배우는 것이 아닌
다양한 프로젝트를 통한 데이터 분석으로
분석스킬 강화와 바로 쓸 수 있는 반응형 대시보드까지 모두 가져가세요!

| 강의특징

01
ALL-IN-ONE! 데이터 수집부터 시각화까지 한 번에

엑셀 파일, 텍스트 파일, API 데이터 등 데이터를 수집하는 방법부터 dplyr 패키지 등을 활용한 전처리 및 ggplot2 패키지 등을 활용한 시각화까지! 현업 데이터 사이언티스트가 실제로 거치는 프로세스를 그대로 따라해보며 데이터 분석에 필요한 모든 것을 한 번에 습득합니다.

02
스킬셋 강화! 다양한 프로젝트를 통한 데이터 분석 능력 향상

불러온 데이터를 바로 분석할 수 있다면 좋겠지만, 데이터는 늘 분석가의 의도대로 만들어져있지 않습니다. 자신의 필요에 맞게 데이터를 정제해 분석할 수 있도록! 공공데이터, API데이터, 웹 데이터 등을 활용한 다양한 데이터 분석 프로젝트를 통해 데이터 분석 스킬셋을 강화시켜 나갑니다. 

R 데이터분석
03
즉시 활용! 인터랙티브한 대시보드 제작

ggplot2 패키지를 활용한 시각화를 넘어 R Markdown, flexdashboard, Shiny를 활용한 인터랙티브한 대시보드 제작까지! 데이터 분석 결과를 필요에 따라 명확하게 표현할 수 있도록 도와드리는 것은 물론, 현업에 돌아가 즉시 활용할 수 있는 대시보드 결과물을 종강 후 무조건 가져갈 수 있도록 합니다.

6주 후 –

과연 어떤 결과물을 가져갈 수 있을까요?
데이터 분석 스킬셋 획득은 물론,
인터랙티브한 대시보드 제작까지!


수업이 끝나면 반드시 가져가는 결과물을
포트폴리오 활용 및 현업에 즉시 적용해보세요!

| 수강효과

01
분석 프로세스 A-Z 학습 및 데이터 분석 스킬 강화
데이터 분석 프로세스를 학습한 결과, 이제는 어떤 데이터 셋을 만나도 자동적으로 손이 나가게 됩니다. 또한 통계기반 사고능력을 바탕으로 데이터 분석을 하게 되어 더욱 명확한 결과를 얻어낼 수 있게 됩니다. 마케팅/영업/기획/인사관리 등 회사에 쌓여있는 고객 데이터 분석 결과물로 의사결정을 해야 하는 모든 직무에서 정확한 근거를 바탕으로 성과를 창출해낼 수 있게 됩니다.
02
대시보드 제작을 통한 포트폴리오 및 업무 적용
시각화 패키지를 통해 내가 가지고 있는 데이터를 자유자재로 원하는 형태로 시각화할 수 있습니다. ggplot2 패키지를 통해 도식화할 수 있음은 물론, R Markdown을 통해 구현된 시각화 자료를 문서로 공유할 수 있게 됩니다. 이후 Shiny 패키지를 사용하여 공유범위가 웹으로 확장됨으로써 원하는 형태의 대시보드를 완성할 수 있습니다. 그 결과, 취업/이직 시 포트폴리오로 제출할 수 있으며, 보고서 및 PT 자료로 사용하는 등 내가 표현하고자 하는 바를 자유롭게 전달할 수 있습니다.
03
데이터 사이언티스트의
모든 노하우 전수
강사님이 데이터를 만난 순간부터 최종 결과물을 얻어 내기까지 어떤 프로세스로 접근하고 고민하는 지 그 모든 노하우를 공유합니다. 그 결과, 데이터 분석 및 시각화를 할 때 걸리는 시간을 최소화할 수 있으며, 효율적으로 결과물을 얻어낼 수 있게 됩니다. 만약 개별 데이터로 포트폴리오를 제작해야 하는 경우, 강사님께서 직접 코칭하여 수강생분들의 포트폴리오 제작을 가이드해드립니다.

| 수강대상

데이터 수집 → 분석 → 보고서 작성 프로세스를 빠르게 처리하는 방법을 알고 싶으신 분

데이터 분석 포트폴리오를 제작하기 원하시는 분

파이썬 데이터 분석

SQL로 데이터 가공과 요약 방법은 익혔지만 시각화하는 방법을 몰라 고민하셨던 분

R 시각화 스킬을 더욱 키우고 싶은 취준생 및 현직자

'R 데이터분석'
마케팅/영업/인사/기획 등
이제는 어떤 직무에서든 필수적인 역량입니다.

| 수강후기

| 커리큘럼

R을 다시 돌아보고 다양한 유형의 자료를 다루는 방법에 대해 학습합니다. 또한, 외부 파일 데이터를 불러오고 이들을 분석에 사용할 수 있도록 정제하는 과정에 대해 알아봅니다.

이론
  • 언어의 구조
  • 자료형 : 숫자, 문자 등의 데이터 저장 방식 학습
  • 데이터 관리를 위한 관계형 모델 입문 및 R 데이터 구조 학습
실습
  • R Studio 설정, 기본 문법 사항, R package 사용, R 자료형 및 자료구조 복습
  • dplyr 패키지를 활용한 자료 다루기 : filter(), select(), arrange(), mutate(), summarise(), group_by()
  • 파일 데이터 불러오기 : text file, excel file 등 저장된 파일 불러오기
  • 데이터 정제하기 : 결측자료 처리하기, 스케일링, factor 변환 등
  • 개인 수집 데이터 : 6주간 개인 데이터를 수집하고 이를 6주차 분석 자료로 활용하기 위한 개인 수집 데이터에 대해 이야기
데이터로부터 의미를 찾는 과정은 교과과정에서도 여러분들은 충분히 배우셨습니다. 바로 평균, 분산, 표준편차 등입니다. 하지만, 그들을 계산하는데에만 머물렀다면 이젠 그 의미를 알아볼 것입니다. 이미 배운 것을 바탕으로 새롭게 탐색적 자료분석 기법을 통해 자료가 갖고 있는 의미를 도출하는 연습을 하고자 합니다. 또한 숫자만으로 요약하는 것이 아니라 ggplot2 패키지와 확장 기능을 이용하여 전체 자료를 보다 쉽게 보여줌으로써 데이터의 경향을 명확히 보여주는 방법에 대해 학습합니다.

이론
  • 데이터의 특성과 의미 : 평균, 분산, 표준편차
  • 탐색적 자료 분석(EDA)
  • Grammar of Graphics : 그래프의 구성 요소들을 살피고 컴퓨터에서 데이터를 도표화하는 과정에 대해 학습
실습
  • mean(), var(), sd(), summary(), apply() 계열 함수를 사용하여 데이터의 특성 도출
  • fivenum(), IQR(), boxplot() 함수 사용 후 결과 이해
  • ggplot2 패키지를 이용하여 도표 그리는법 실습
  • ggplot2 확장 패키지를 이용하여 다양한 기능을 가진 도표 제작
공공데이터 포털로부터 서울 각 구의 자료를 찾아보고 관심있는 데이터를 지도와 함께 나타내는 방법에 대해 학습합니다.

이론
  • 실생활과 데이터, 그리고 공공데이터의 의미
실습
  • 공공데이터포털에서 행정구역별자료와 다양한 자료들을 함께 서칭하고 다운로드
  • 1 – 2회차 과정에 학습한 내용을 가지고 추출한 데이터의 전처리 및 데이터의 의미 살피기
  • Leaflet을 이용한 지도 제작 : leaflet(), setView(), Tile과 Provider Tile, 다양한 Marker 사용, popup을 이용한 세부 정보 표시하기 등
  • 공공데이터로부터 얻은 정보를 Leaflet지도상에 각자 표현
웹 페이지에 게시되어 있는 데이터를 우리의 PC로 가져오는 과정에 대해 알아보고 그 의미를 찾아 재현 가능하고 재사용 가능한 문서로 만들어 다른 사람들과 정보를 공유하는 방법에 대해 알아봅니다.

이론
  • 웹 작동방식 : 웹 연결을 위한 Request과 Response, 정보 전달 방식 GET과 POST에 대해 학습
  • 웹 페이지 주소와 웹 페이지 구조 : URL 살펴보기, HTML 문서 구조, DOM과 CSS 선택자를 이용한 요소 가져오기
  • 정규표현식에 사용하는 패턴 지정에 대해 학습
실습
  • 웹 페이지에서 데이터 추출하기 : httr 패키지를 이용한 요청과 응답받기, rvest 패키지를 이용하여 HTML 문서 읽기 등
  • 1 – 2회차 과정에 학습한 내용을 가지고 추출한 데이터의 전처리와 의미 살피기 진행
  • 정규표현식을 이용하여 패턴을 가진 문자열 추출
  • R Markdown을 이용한 문서 만들기 : R Markdown 의 기본 문법, RPubs에 등록

Open API를 이용하여 실시간으로 데이터를 제공받아 이를 분석하고, 그 결과들을 Shiny 를 이용하여 웹 애플리케이션을 만드는 방법에 대해 학습합니다.

이론

  • Open API 소개
  • XML과 JSON : OpenAPI를 통해 전달받는 데이터의 유형에 대해 학습
  • R Shiny app 소개 : R Shiny App 구성, 다양한 위젯 종류에 대해 학습
  • 반응성 프로그래밍 : 반응성 체인, 반응성을 위한 값, 표현식, 관찰자에 대해 학습

실습

  • Open API를 이용하여 데이터 가져오기 : 키 발급과 키를 이용한 연결, API가 필요로 하는 정보 전달하기(헤더 이용하기), 응답형식(XML과 JSON)에 따른 값 가져오기 등
  • Shiny 앱을 통해 사용자에게 대화형 환경으로 의미 전달하는 방법에 대해 실습

6주간 수집한 각자의 데이터를 이용하여 다양한 의미 도출 방법을 적용해 보고, 이러한 방법에 따른 결과를 flexdashboard를 이용하여 한 화면에 전달하는 방법에 대해 학습합니다.

 

실습

  • googlesheet4 패키지를 이용한 Google Sheet에 저장된 각자의 데이터를 읽는 방법을 실습
  • story board를 만들면서 flexdashboard의 기능을 살펴보기
  • flexdashboard 본격 사용하기 : 레이아웃 설정하기, 메뉴 만들기(navbar 설정하기), htmlwidgets 패키지 사용하기, Shiny App 추가하기 등
  • flexdashboard를 이용하여 개인 데이터 분석 결과 발표

| 강사소개 및 인터뷰

데이터 분석

이윤환

현) 컬쳐 랩(Culture lab) 대표
- 한림대학교 의과대학 겸임교수
- 한림대학교, 한림성심대학교, 중앙대학교 [통계], [데이터 베이스], [웹 개발] 등 데이터 사이언스 강의
- KOCW [통계 프로그래밍과 분석을 위한 R 입문], [R을 이용한 통계학 입문] 등 4개 강의
- 한빛미디어 [제대로 알고 쓰는 R 통계분석] 저자

 

1. 자기소개 부탁드립니다.

반갑습니다. 데이터를 이리저리 뒤적이는 것을 좋아하는 이윤환이라고 합니다. 저는 통계학을 전공하였고 대학원에서는 당시 유행하던 데이터 마이닝 기법을 적용한 프로그래밍, 문항반응이론에 기반 시스템 개발과 실제 적용, 대학의 교육개발센터에서 온라인 플랫폼으로 사용할 시스템을 개발하였으며, 대학에서 통계학, DB, 웹, 정보시스템 등의 강의를 진행하고 있습니다. 개인적으로 데이터에 기반한 연구를 수행하는 개인사업체를 운영하고 있으며, 사회혁신과 관련한 활동을 지역에서 수행하고 있습니다.

수강생분들과 함께하는 시간외에도 여러 사회활동을 지역에서 하고 있으며, 이런 사회활동은 데이터의 맥락 이해에 더 없이 도움이 되고 있으며 데이터를 다루는 사람들에게는 이는 무엇보다 중요하다고 생각합니다. 저는 여러분들과 함께하며 단순히 기법과 방법을 전해드리는 것이 아니라 우리가 두 발을 딛고 사는 사회에서 발생하는 데이터에 대한 맥락을 이해하고 데이터 간의 연계에 대한 제 경험을 여러분들의 데이터에 대한 통찰을 키우는 데 도움이 될 것이라 생각합니다.

 

2. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

수업계획 상 이론과 실습이 나누어져 있습니다만 이론과 실습을 함께 수행하는 과정이 많을 것입니다. 본 과정에서 다루는 이론은 따분한 지식이 아닌 여러분들의 능력에 필요한 가장 기본적인 지식으로 암기보다는 여러분들의 손에 익은 이론이 되기 위해 실습 과정을 충분히 갖고자 합니다. 또한, 이론만 여러분들이 익히는 것이 아니라 실제 이를 활용하기 위한 프로젝트 중심의 과정을 운영할 것입니다. 단순 문제 풀이가 아니라 여러분 각자의 방식대로 주어진 상황을 풀어보고 제가 갖고 있는 경험의 공유를 통해 저와 여러분들은 R 코드를 통해 많은 대화를 할 것입니다.

3. 본 강의에서 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?

우선 여러분들이 수집한 데이터에서 의미를 찾아 여러분들의 현업에서 의사결정에 큰 기여를 할 것입니다. 그리고 무엇보다, 여러분들이 사회를 구성하는 다른 사람들과 데이터를 통해서 현 사회를 과학적으로 바라보는 시선을 가질 것입니다. 그리고, 여러분들이 데이터로부터 찾은 의미를 보다 쉽게 전달하여 다른 사람들과 이야기하는 또 하나의 언어를 가지실 것으로 기대합니다.

 

4. 다른 강의와 어떤 차별 점이 있나요?

앞서서도 말씀드렸듯이 단순히 기법만 익히는 과정이 아닙니다.
우리 앞에 있는 데이터를 다양한 시야로 바라보고, 다양한 사회현상에 대입하여 생각하는 과정을 진행합니다.
이와 같은 과정이 중요한 것은 기법만 가지고 데이터의 의미를 찾는 것은 한계가 있기 때문입니다.
사회는 다양한 현상들과 연결되어 있으며 우리에게 주어진 데이터는 이렇게 연결된 현상 속에 관찰 시점에 습득한 단편이기 때문입니다.

본 과정에서는 1차적인 기법외에 데이터에 대한 통찰을 키우고, 다른 사람들과 자연스럽게 나의 견해를 보이고 대화하는 방법에 대해 알아보고자 합니다.
또한, 저와 강의 시간만이 아니라 인터넷에 연결되어 있으면 어느 때고(과정 마친 이후에도) 함께 고민하고 이야기 할 것이라 자신있게 말씀드립니다.

 

5. 마지막으로 수강생들에게 하고 싶으신 말

데이터를 들여다보고 의미를 찾는 것이 직업 이전에 여러분들의 취미였으면 좋겠습니다. 데이터는 뒤지면 뒤질수록 자기가 숨겨놓은 이야기를 풀어줍니다. 일로써만 접근하면 조금은 지루한 일일수도 있고요… 내 직업이 데이터 다루는 사람이 아닌데? 라고 하시더라도, (개인적으로는 별로 안 좋아하는 단어입니다만) 4차 산업혁명 시대를 살아가는 우리에게 데이터를 다루는 것은 일상이 되지 않을까요? 우리 데이터 합시다.

 

수강료 85만 원60만 원
수강신청은 결제 순으로 선착순 마감될 수 있습니다.
개강 후 환불은 학원법 시행령 <제18조 제3항> 수강료 반환기준에 의거합니다.

*환불 세부규정 확인하기 (클릭)

25만 원 할인, 놓치지 마세요!