파이썬 머신러닝 마스터
: 신약개발 AI 엔지니어와 경진대회 참여

기초부터 경진대회 참여까지 한 번에 끝내는 파이썬 머신러닝

강의 난이도
2/5
2개의 프로젝트와 최종 경진대회 참여!
머신러닝 기초부터 실전 적용까지 모두 경험해보세요.
쉽게 찾아볼 수 있는 머신러닝과 관련된 책과 강의들. 하지만 대부분 이론과 준비된 실습을 하고 끝나버리고 맙니다. 배운 내용을 디테일하게 적용하며 볼 수 있는 기회는 쉽게 얻을 수 없는거죠. 머신러닝 기초부터 실전 적용까지 한 번에! 2개의 프로젝트와 1번의 경진대회를 경험하며 머신러닝을 탄탄하게 배워나갈 수 있습니다. 본 강의로 머신러닝을 한 번에 끝내보세요!

일정

20.11.01 ~ 20.12.06 | 총 6회
매주 일요일 14:00 ~ 17:00, 총 18시간
* 개강 3일 전 온라인 라이브 접속 방법을 안내드립니다.

정원 및 준비물

총 15명
노트북

장소

* 본 과정은 온라인 라이브로 진행됩니다. 따라서 인터넷 연결이 가능한 모든 장소에서 수강하실 수 있습니다.
머신러닝 기초부터 최종 경진대회 참가까지.
머신러닝을 배우는 데 가장 효율적인 방법을 과정에 담았습니다.
그동안 타 강의에서 느끼셨을
어려움과 아쉬움들은 뒤로하세요.
본 과정으로 만족시켜 드리겠습니다.

6주 후, 수강생이 갖추게 될

광범위한 머신러닝 기법 중
실무에서 가장 활발히 쓰이는
머신러닝 지식 탑재
실무와 유사한 데이터인
경진대회 데이터를 활용한 실습경험
2개의 개인 프로젝트와
1개의 경진대회 참가로 얻게되는
프로젝트 결과물
지식과 경험에서 끝나지 않도록 –
다양한 프로젝트를 기반으로
머신러닝을 마스터할 수 있도록 도와드리겠습니다.

| 강의특징

01
더 이상 머신러닝을 배우겠다고 시간·돈낭비 안하셔도 됩니다.
통계적인 지식이 없어도, 파이썬 기초 실력만으로 머신러닝 알고리즘을 기초부터 활용까지 탄탄하게 배울 수 있습니다. Pandas, Numpy, Scikit-Learn 등의 기초 머신러닝 라이브러리부터 XGBoost, LightGBM, NNI 등 현업 및 경진대회에서 자주 사용되는 최신 라이브러리를 학습할 수 있는 커리큘럼으로 구성되어 있습니다.
02
말로만 가르치는 무의미한 강의가 아닙니다.
힘들게 책이나 유튜브로 머신러닝 이론을 배워봤자 직접 적용하지 못하면 아무런 의미가 없습니다. 또한 연습용 데이터로 백 날 연습해봐야 실전에서 써먹지도 못합니다. 본 과정은 이론 3 / 실습 7 비율의 커리큘럼으로 구성되어 있습니다. 그리고 캐글 및 데이콘에서 제공하는 실제 경진대회 데이터를 활용하여 이론을 배운 후 바로 적용해보는 연습을 반복합니다.
03
신약개발 AI 데이터 엔지니어의 코칭을 받을 수 있습니다.
수업에서 진행하는 프로젝트와 관련된 피드백은 물론 실무 적용, 경진대회 등 다양한 상황에서의 머신러닝 적용과 관련된 피드백을 온·오프라인으로 받으실 수 있습니다. 페이스북 캐글 코리아 운영진이자 캐글 상위 2%. 그리고 다양한 기업 프로젝트를 경험해보셨던 강사님의 꼼꼼한 피드백을 받아보세요!
5번의 준비단계를 거친 후
최종적으로 우리는 데이콘 경진대회에 참가합니다.
01
사전준비
최종적으로 데이콘 경진대회에 참여하기 위해, 머신러닝 기초부터 차근차근 단계를 밟아 나갑니다. 실무는 물론 경진대회에서 활발하게 사용하고 있는 머신러닝 기법을 중점적으로 학습하며, 수업 후 적절한 과제는 물론 1·2차 프로젝트를 경험하며 복습을 돕습니다.
02
데이콘 경진대회 ‘월간 데이콘’ 참여
데이콘은 한국형 캐글이라 불리는 곳으로, 많은 기업과 공공기관에서 데이터를 제공해주면 주어진 과제를 해결하여 상금을 획득하는 방식의 경진대회 플랫폼입니다. 지금까지 배웠던 내용을 바탕으로 실전 머신러닝 데이터 분석을 위해 경진대회에 참가합니다.
03
코드 리뷰 및 조언
경진대회 참가가 끝난 후, 강사님의 코드 리뷰가 진행됩니다. 이 과정에서 수강생분들의 코드에 대해 피드백을 주며 자신의 실력을 더욱 확고히할 수 있습니다. 특히 모든 프로젝트에서 작성된 코드에 대해 이후 ‘포트폴리오’로 활용될 수 있도록 안내해드립니다.
캐글 상위 랭커이자 캐글코리아 운영진.
신약개발 AI 엔지니어의 코칭을 받아보세요!
강천성 강사
(현) 신약개발 AI 스타트업 AI Engineer
(전) SK주식회사 C&C DB Engineer
– 페이스북 커뮤니티 캐글 코리아 운영진
– 캐글 경진대회 참여, 상위 2%
– 국내 L 백화점 데이터 분석 프로젝트 참여
– 충남대학교 병원 의료 데이터 분석 프로젝트 참여
– 삼성, sk 등 머신러닝 강의 진행

| 수강효과

01
명확한 예측을 바탕으로
정확한 성과 창출 가능
데이터 분석. 특히 머신러닝을 활용하는 이유는 결과물을 바탕으로 정확한 성과를 창출해낼 수 있기 때문입니다. 머신러닝은 더 이상 전문가의 산유물이 아닙니다. 마케터, 기획자, 인사담당자 그리고 분석가 등 모든 직군의 수강생분들이 머신러닝을 자신의 데이터에 적용해 인사이트를 발굴해 성과를 창출해낼 수 있습니다.
02
머신러닝 데이터 분석 파이프라인 설계능력 습득
머신러닝 알고리즘의 기초 개념과 원리를 학습한 후 다양한 실습을 통해 기초적인 머신러닝 파이프라인을 설계할 수 있는 능력을 갖추게 되셨습니다. 이후 ‘A 데이터에는 B 기법을 사용해야 한다’ 등과 같은 판단력이 생기게 됩니다. 전처리, 모델선택, 학습, 후처리 등 머신러닝 파이프라인을 설계할 수 있는 능력으로 결과물의 퀄리티를 높여 성과를 창출해보세요!
03
취업 & 승진에 활용할 수 있는 프로폴리오 습득
과정에서 진행하는 3번의 프로젝트 및 개별 컨설팅을 통해 최대 4개의 결과물을 얻어가실 수 있습니다. 특히 경진대회 관련 뛰어난 경력을 가진 강사님께서 Github 사용법 및 포트폴리오 제작법 등을 안내해 직접 코칭해드립니다. 결과적으로 취업 및 이직, 그리고 승진에 활용하실 수 있도록 도와드립니다.

| 수강대상

Python 기초와 Numpy, Pandas 등 정형 데이터를 다룰 수 있는 라이브러리 기초를 학습한 수강생

머신러닝 관련 도서 1권 이상 보았거나, 입문 단계에서 초급 및 중급 단계로 넘어가고 싶은 수강생

실제 데이터를 다뤄보며 기본기를 다지고, 프로젝트에서 적용할 수 있는 실전 기술을 익히고 싶은 수강생

'빠르게 전문가로 만들어 드리겠습니다'라는 말씀은 드리지 않겠습니다.
하지만 자신 있게 말씀드릴 수 있는 건 데이터를 보고 무엇을 시도해야할 지,
어떤 방식으로 프로젝트를 해야할 지 판단하고 적용할 수 있는 수준으로 만들어 드리겠습니다.

– 강사님 인터뷰 –

| 수강후기

| 강의자료

이해하기 쉽게 설명되어 있는 교재
복습을 도와주는 꼼꼼한 스크립트

| 커리큘럼

전처리, 모델 선택, 학습, 후처리등으로 이루어진 기본 머신러닝 파이프라인의 흐름을 배웁니다. 또한, 프로젝트를 진행하며 저지르기 쉬운 실수와 주의사항에 대해 알아봅니다. 먼저 Anaconda, Jupyter Lab등 머신러닝 개발 환경을 구축합니다. 이후 정형 데이터를 다루기 위한 Numpy와 Pandas 라이브러리의 기본적인 사용 방법에 대해 실습 및 데이터의 분포, 자료 형, 값의 범위를 조정하는 전처리 이론 및 실습을 진행합니다.

이론
– 머신러닝 프로젝트의 흐름
– Anaconda, Jupyter 등 머신러닝 개발 환경 라이브러리 소개
– Numpy, Pandas 라이브러리 소개
– 스케일링, 라벨링, 차원 축소 등 기초 전처리 이론

실습
– Anaconda 설치 및 사용법 (파이썬 가상 환경)
– Jupyter Lab 설치 및 사용법
– Numpy, Pandas 사용법
– Transform, Encoding, PCA 등 전처리 실습
지도 학습 알고리즘의 종류 중 하나인 분류(Classification)에 대해 학습합니다. 로지스틱 회귀, SVM, 결정 트리, 랜덤 포레스트 등 기본적인 머신러닝 알고리즘부터 경진대회에서 자주 사용되는 모델에 대해 학습하고 실습을 진행합니다. 마지막으로 분류 모델을 위한 평가 방법과 혼동 행렬(Confusion Matrix)을 통해 분류 모델 평가 시 주의 사항에 대해 배우고 실습을 진행합니다.

이론
– 분류 모델 기초 이론
– 분류 모델 평가 방법과 주의사항
– 경진대회에서 자주 사용되는 모델

실습
– Logistic Regression, SVM, Decision Tree, Random Forest 모델 실습 및 평가
– XGBoost, LightGBM 라이브러리 모델 실습 및 평가
선형 회귀(Linear Regression)의 기본적인 개념에 대해 학습합니다. 머신러닝 모델을 기반으로한 회귀 모델의 개념 및 실습을 진행합니다. 회귀 모델을 위한 평가 방법과 회귀 모델 평가 시 주의 사항에 대해 배우고 실습을 진행합니다. 비지도 학습의 대표적인 군집화(Clustering)에 대해 학습합니다. k-means 알고리즘의 원리와 군집화 알고리즘을 위한 평가 방법을 배우고 실습을 진행합니다.

이론
– 회귀 모델 기초 이론
– 회귀 모델 평가 방법과 주의사항
– 머신러닝 알고리즘 기반 회귀 모델 기초 이론
– 군집화 기초 이론, k-means DB-SCAN

실습
– Linear Regression 모델 및 머신러닝 모델을 기반으로 한 회귀 모델 실습 및 평가
– k-means, DB-SCAN 알고리즘 실습 및 군집화 평가
주어진 데이터뿐만 아니라 학습하지 않은 데이터에 대해 일반화 성능을 향상시키기 위한 모델 검증과 앙상블에 대해 학습합니다. 단일 모델 자체의 성능을 향상시킬 수 있는 하이퍼 파라미터 탐색을 배워봅니다. k-Fold 교차 검증(Cross Validation), Voting, Out-Of-Fold 앙상블 등 모델의 일반화 성능을 검증하여 향상 시킬 수 있는 알고리즘을 배워봅니다.

이론
– 모델 검증 기초 이론
– 앙상블 기초 이론

실습
– k-Fold 을 활용하여 모델 검증 실습
– Grid Search을 활용한 하이퍼 파라미터 탐색 알고리즘 실습
– Voting, Out-Of-Fold(k-Fold) 모델 앙상블 실습
고급 앙상블 기법인 스태킹 앙상블에 대해 학습합니다. k-Fold를 활용한 라벨 후처리에 대해 학습합니다. AutoML 라이브러리(NNI)를 활용한 파라미터 튜닝에 대해 학습하고 실습을 진행합니다.

이론
– 스태킹 앙상블 기초 이론
– AutoML(NNI) 라이브러리 소개

실습
– 스태킹 앙상블, k-Fold 라벨 후처리 실습
– AutoML(NNI) 라이브러리를 활용한 하이퍼 파라미터 튜닝 실습
– 프로젝트 마무리 실습
본 강의에서 배운 모든 내용을 최종적으로 점검하는 프로젝트 및 리뷰를 진행합니다. 최종 프로젝트는 정해진 시간 동안 주어진 데이터의 목적에 맞게 머신러닝 파이프라인을 구축하는 테스트 입니다. 프로젝트 종료 후 리뷰를 통해 수강생이 본 강의를 수강하는 동안 얼마나 성장하였는지 인식하고 부족한 부분을 채울 수 있도록 돕습니다.

| 강사소개 및 인터뷰

강천성
(현) 신약개발 AI 스타트업 AI Engineer
(전) SK주식회사 C&C DB Engineer

프로젝트 이력
– 페이스북 커뮤니티 캐글 코리아 운영진
– 캐글 경진대회 참여, 상위 2%
– 국내 L 백화점 데이터 분석 프로젝트 참여
– 충남대학교 병원 의료 데이터 분석 프로젝트 참여

강의 이력
– 삼성 청년 SW 아카데미 개발자 특강 진행
– 서울 IT 직업전문학교, 캐글 & 머신러닝 특강
– Dacon, 머신러닝 기초 특강
– 한국토지주택공사 국토 도시 데이터분석 경진대회 자문
– SK Planet, T-Academy 머신러닝 기초 특강 진행
– 삼성전자 반도체 부문 임직원 머신러닝, 딥러닝 기초 실습 진행
1. 자기소개 부탁드립니다.
안녕하세요. 신약개발 인공지능 스타트업에서 AI Engineer 업무를 담당하고 있는 강천성입니다. 머신러닝 경진대회를 준비하거나 실무에 머신러닝 기술을 적용하고자 하는 분에게 현업 프로젝트 경험과 다양한 머신러닝 경진대회 경험을 압축하여 활용하실 수 있도록 도와드리겠습니다.
2. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?
입문 강의가 아닌 기초~중급 단계의 강의이므로 머신러닝 알고리즘의 기초부터 실제 머신러닝 프로젝트에 사용할 수 있는 기술 및 노하우를 전달해드리려고 합니다. 프로젝트(과제)를 통해 배운 것을 즉시 활용하여 적용해볼 수 있도록 진행할 예정입니다.
3. 본 강의에서 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?
머신러닝 입문 단계에서 기초, 중급으로 나아갈 수 있도록 도와드리겠습니다. 기초뿐만 아니라 경진대회나 실무에 도전할 수 있는 수준을 목표로 하는 강의이며, 본 강의를 수강한 이후에는 데이터를 살펴보고 목적에 맞는 머신러닝 파이프라인을 설계할 수 있는 능력을 갖출 수 있게 됩니다.
4. 다른 강의와 어떤 차별 점이 있나요?
1. 실제로 프로젝트를 경험해보지 않으면 얻을 수 없는 노하우를 배울 수 있습니다. 뿐만 아니라 앙상블, 모델 튜닝(AutoML), 실험 관리 등 프로젝트를 진행하면서 유용하게 쓰일 수 있는 라이브러리들에 대해 배우고 실습을 진행할 수 있습니다.

2. 오프라인 강의뿐만 아니라 과제 및 별도의 온라인 세션을 통해 질의 응답 및 코칭을 진행할 예정입니다. 지속적으로 수강생분들의 의견을 반영하여 좋은 강의가 될 수 있도록 노력하겠습니다.
5. 마지막으로 수강생들에게 하고 싶으신 말
‘빠르게 전문가로 만들어드리겠습니다.’ 라는 말씀은 드리지 않겠습니다. 또한, 본 강의를 수강하며 과제와 프로젝트로 인해 힘드실 수 있습니다. 하지만 자신 있게 말씀드릴 수 있는 건 본 강의를 제대로 수강하신 분이라면 데이터를 보고 무엇을 시도해봐야 할지 어떤 방식으로 프로젝트를 진행해야 할지 판단하고 적용할 수 있는 수준으로 만들어드리겠습니다.
수강료 90만 원50만 원
수강신청은 결제 순으로 선착순 마감될 수 있습니다.
개강 후 환불은 학원법 시행령 <제18조 제3항> 수강료 반환기준에 의거합니다.
# 환불 세부규정 확인하기 (클릭)
온라인 라이브 40만 원 특별할인,
놓치지 마세요!