CV, 컴퓨터비전, 영상 인식, 딥러닝, 강의
  • 데이터사이언스
  • 중급, 고급

이미지와 텍스트를 넘나드는 컴퓨터비전 : Detection부터 Multimodal까지

YOLOv5 모델을 이용한 실시간 Object Detection부터 텍스트와 이미지를 활용한 멀티모달 모델 학습까지, 다양한 기술을 구현해볼 수 있는 컴퓨터비전 강의!

1기
강의 일정
23.12.03 ~ 23.12.31 (총 5회) 매주 일요일 10:00 ~ 13:00 (총 15시간)

Object Detection부터 Multimodal까지,
실전 컴퓨터비전 프로젝트!

더욱 심화된 컴퓨터비전 강의! 실무에 꼭 필요한 모델링 및 문제 해결 방법을 배워가세요.

강의소개

Object Detection, OCR, Image Genertation 등
실무 중심의 다양한 컴퓨터비전 기술을 배워가세요.

딥러닝 컴퓨터비전 강의

01. YOLO, Transformer 기반 모델을 활용한
자동차 객체 탐지 (Object Detection)

자율주행 자동차를 위한 신호등, 자동차, 사람 등의 탐지와 번호판 인식, 핸드폰 자동 보정을 위한 환경 인식에 사용되는 객체 탐지를 배워봅니다. 객체 탐지에 많이 쓰이며 사용이 편리한 YOLOv5를 이용해 실시간으로 자동차 객체 탐지 실습을 진행합니다. 또한 최근 컴퓨터비전의 SOTA 모델들이 Transformer에 기반한 DETR (DEtection TRansformer) 모델로부터 발전되고 있습니다. 이에 따라 CNN만을 활용한 객체 탐지가 아닌 DETR 모델로 객체 탐지를 실습합니다.

02. 얼굴 인식을 위한 샴 네트워크와 OCR 기술 학습

얼굴 인식, 동물 또는 식물 분류, 이미지 검색 등에 활용되는 Siamese Neural Network를 통해 Few-Shot Learning과 Matrix Learning의 응용 방법을 배우고 실습해 봅니다. 또한, 인쇄된 문서를 디지털 이미지 파일로 변환하는 기술인 OCR (Optical Character Recognition) 기술을 통해 이미지에서 텍스트를 추출하는 실습을 진행합니다. 이러한 OCR 기술을 배워 자동차 번호 인식, 시각 장애인을 위한 시스템, 이미지 글씨 번역, 문서 자동화 등에 활용할 수 있습니다.

03. 이미지와 텍스트를 결합한 멀티모달 모델 구현

최근 이미지, 텍스트, 센서 데이터가 결합된 멀티모달 기술이 IT 기업들에게 주목받고 있습니다. 이러한 트렌드에 맞춰 이미지와 텍스트 데이터를 활용해 멀티모달 모델을 구현해 봅니다. ResNet, GAN, DCGAN, DALL-E mini 등의 모델을 활용해 이미지 기반의 텍스트를 생성하는 Image Caption과 텍스트를 입력받아 이미지를 생성하는 Image Generation을 배웁니다.


본 강의에서
무엇을 얻어갈 수 있나요?

실제 업무에서 직면할 다양한 문제 상황에 대응하는 전략을 체계적으로 습득하실 수 있습니다.

  • 실시간 영상 처리를 위한 모델 구현

    YOLO와 CV SOTA 모델의 기반 DETR 학습

    Object Detection 분야에서 많이 쓰이는 YOLO 모델과 Transformer 기반의 모델인 DETR을 사용하여 객체 탐지를 실습합니다. 이를 통해 기본에 충실한 CNN과 DNN, RNN, DETR 모델을 이해할 수 있으며 또한 YOLOv5를 이용한 실시간 객체 탐지 및 DETR를 통해 컴퓨터비전에서 핵심적인 역할을 하는 심화된 Object Detection을 배워가실 수 있습니다.

    딥러닝 컴퓨터비전 강의
  • IT 기업이 주목하는 멀티모달 기술

    Image Caption과 Image Generation

    이미지, 텍스트 등 다른 특성을 갖는 데이터를 활용하기 위한 전처리, 통합, 변환 방법을 배울 수 있습니다. 강의에서의 Image Caption 및 Image Generation을 통해 이미지 및 영상 검색, CCTV 영상 텍스트화, 웹툰 그림 및 채색, 데이터 학습을 위한 데이터 생성 등 현업에서 사용되는 멀티모달 기술들을 알아가실 수 있습니다.

    딥러닝 컴퓨터비전 강의
  • 에러 해결을 위한 스마트한 디버깅

    실무에서의 케이스를 통한 문제 해결 노하우

    PyTorch를 활용한 딥러닝 코드 구현 방법을 배우고, 에러가 발생하면 강사님과 함께 이슈를 해결해 봅니다. 컴퓨터비전 분야에 사용되는 다양한 모델 실습을 통해 본인만의 최적화된 솔루션을 구현할 수 있도록 합니다. 이를 통해 실무에서의 복잡한 문제들을 유연하게 해결하는 능력을 습득할 수 있습니다.

    딥러닝 컴퓨터비전 강의

객체, 얼굴, 문자 인식 및 생성 등 다양한 케이스로
자율주행, 자동화, AI 플랫폼에 컴퓨터비전을 적용해보세요.


본 강의가 특별한 이유는
무엇인가요?

1

실무 문제 해결을 위한
최신 딥러닝 알고리즘

PyTorch를 활용하여 기본적인 CNN뿐만 아니라 Transformer 기반의 DETR 모델, CRNN, DCGAN, DALL-E min 등 실무에서의 컴퓨터비전 문제 해결을 위한 다양한 최신의 딥러닝 알고리즘을 학습합니다.

2

멀티모달 인공지능 모델
SCIE 논문 저자의 직강

이미지, 텍스트를 결합한 멀티모달 모델로 해외 저널에 논문을 게재한 실력있는 강사님과 오프라인으로 컴퓨터비전 기법을 배웁니다. 강의를 통해 컴퓨터비전 분야에서 활용될 수 있는 멀티모달에 대해 심층적으로 알아갈 수 있을 뿐만 아니라 현업에서의 노하우도 함께 얻어가실 수 있습니다.

3

실제 적용 사례에 기반한
다양한 컴퓨터비전 기술

OCR, Image Caption, Image Generation, Siamese Neural Network 등 다양한 주제를 통해 다채로운 문제를 풀어봅니다. 이를 통해 모델링 구조화를 배우고 실무에서 사용되는 기술들을 업무에 적용해볼 수 있습니다.

수강 대상

이런 분들은 꼭 들으셔야 해요!


컴퓨터비전의 최신 모델을 배워
성능을 향상시키고 싶은 분


Object Detection 외에
다양한 기법들을 경험하고 싶은 분


프로젝트나 연구에서 멀티모달
기술을 적용하고 싶은 분

강사소개

우리 강사님을 소개할게요!

딥러닝 컴퓨터비전 강의
Sean
이력사항
  • (현) 금융 대기업 데이터사이언스
  • (전) H그룹 금융 대기업 데이터사이언스
  • 멀티모달 인공지능 모델 SCIE 논문 및 KCI 논문 저자
  • 딥러닝 기반 특허 2건 등록

1. 간단하게 자기소개 부탁드립니다.

현재 금융 대기업에서 데이터사이언스로 근무 중이고, H그룹 금융 대기업에서 데이터사이언스로 근무했으며, 중견기업 NLP 팀에서 데이터사이언스 연구원으로 근무했습니다. 대학원에서 NLP와 Vision의 멀티모달 모델로 SCIE 해외 저널 및 KCI 저널에 논문을 게재했으며 딥러닝 기반의 기술 특허 2개를 등록했습니다. 그만큼 데이터사이언티스트로서 자부심과 학문에 대한 열정으로 키운 실무 기반의 문제해결 능력을 강의로 공유하고자 합니다.

2. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

본 강의는 실제 문제 해결을 목표로, Computer Vision의 핵심 문제들을 체계적으로 다룹니다. 이를 위해 다양한 딥러닝 모델과 PyTorch 프레임워크의 특성을 깊이 있게 활용하는 모델링 기법들을 실습 중심으로 학습합니다. 실무에서 직면할 수 있는  Object Detection, OCR, Image Caption과 같은 주요 컴퓨터비전 문제들을 해결하기 위한 최적의 모델 선택 및 적용 전략을 세심하게 다룹니다. 이 과정을 통해 다양한 딥러닝 모델의 구조 및 실제 적용 사례를 깊이 있게 파악하며, 실전 능력을 향상시킬 수 있습니다.

3. 본 강의에서 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?

Computer Vision에서 자주 보게 되는 Object Detection 문제를 해결하기 위해 DNN, CNN 그리고 Transformer 기반의 모델 실습으로 하나의 문제에서도 새로운 모델링을 적용할 수 있는 방법을 배웁니다. 또한 Object Detection뿐만 아니라 실제로 어려운 문제 상황에서 적절한 해결 전략을 세우는 능력도 함께 키우게 됩니다. 본 강의를 마친 후에는, 개인 프로젝트의 확장, 신규 아이디어의 구현, 혹은 새로운 연구 주제의 수행 등 다양한 방면에서 바로 활용할 수 있는 힘이 됩니다.

4. 주로 어떤 분야에 있는 분들이 수강 대상에 적합할까요?

딥러닝과 Computer Vision을 이용해 문제를 해결해 보고 싶지만 어떻게 공부해야 할지 몰라서 망설이고 계신 분이나 공부하고 싶으신 분 에게 적합합니다. 컴퓨터비전과 딥러닝에 관심 있지만 어떻게 시작해야 할지 막막하게 느끼는 분들은 물론, 이미 강의를 통해 공부했으나 실무적인 적용과 심화 학습을 원하시는 분들까지 도움이 되도록 유익하게 강의를 설계했습니다.

5. 다른 강의와 어떤 차별 점이 있나요?

이 강의는 일반적인 Computer Vision 강의에서 다루는 Object Detection이나 CNN 모델에만 집중하지 않습니다. 실무에서는 다양한 상황과 문제에 부딪히게 되고, 이를 해결하기 위해서 각각의 문제에 대해 적절한 솔루션을 찾아내야 합니다. 따라서 Object Detection뿐만 아니라 OCR, Image Caption, Image Generation 등 다양한 컴퓨터비전 문제를 해결하는 방법을 배우고, 단순히 이론에 그치지 않고 실습 위주로 직접 문제를 해결하는 방법 배웁니다.

6. 마지막으로 수강생들에게 하고 싶으신 말이 있다면?

Computer Vision과 딥러닝은 현재 우리의 일상과 다양한 산업 분야에서 사용되고 있고 새로운 서비스를 위해 계속해서 연구되고 있습니다. 강의를 통해 Computer Vision과 딥러닝을 심도 있게 이해하고 실전에 적용하는 능력을 키울 수 있습니다. 함께 성장하는 이번 강의에서 여러분을 만나 뵙게 되어 기쁩니다.

커리큘럼 (5)

  • SECTION 1. CNN과 Transfomer 기반의 Object Detection 실습

    강의 목표

    • PyTorch를 이용해 깊이 있는 학습 모델링 방법을 공부합니다. 컴퓨터 비전에서 핵심적인 역할을 하는 Object Detection에 대한 실질적인 이해를 심화시킵니다. Object Detection을 해결하면서 간단한 딥러닝 모델에서 CNN 모델 및 Transformer 모델을 구축하는 방법을 학습합니다. 현업에서는 자율주행 자동차를 위한 신호등, 자동차, 사람 등 탐지와 번호판 인식, 핸드폰 자동 보정을 위한 환경 인식 등에서 사용됩니다.

    이론

    • CNN, Transformer 이론
    • Object Detection 성능 평가 방법

    실습

    • CNN 기반 모델의 Object Detection 실습 (직접 만들어 보기)
    • Transformer 기반 모델의 Object Detection 실습 - DETR (DEtection TRansformer)
    • YOLOv5를 이용한 실시간 Object Detection
  • SECTION 2. Siamese Neural network 실습 - 동일 인물 찾기

    강의 목표

    • Siamese Neural Network를 통해 Few-shot Learning과 Matrix Learning의 이론을 배웁니다. Few-shot Learning과 Matrix Learning의 응용 방법을 배우고 실습합니다. 현업에서는 얼굴인식, 동물 및 식물 분류 및 이미지 검색등에 활용됩니다.

    이론

    • Siamese Neural Network를 통한 동일인물 찾기

      Siamese Neural network로 배우는 few shot learning과 matrix learning 이론

    실습

    • Siamese Neural network 실습
  • SECTION 3. OCR 실습 - 이미지 기반의 텍스트 추출

    강의 목표

    • 실무 환경에서는 Object Detection 뿐만 아니라 다양한 문제를 해결해야 합니다. 여러 문제를 해결해 보기 위해 OCR 기술을 통해 이미지에서 텍스트를 어떻게 추출하는지 실습을 통해 학습합니다. 현업에서는 자동차 번호 인식, 시각 장애인을 위한 시스템, 이미지 글씨 번역, 문서자동화 등에 활용됩니다.

    이론

    • OCR(Optical Character Recognition) 이론

    실습

    • OCR 모델 실습 - EasyOCR, 실습 모델 추가 예정
  • SECTION 4. Image Caption 실습 - 이미지 기반 텍스트 생성

    강의 목표

    • Image Caption에 대한 이론을 배우며, 딥러닝 모델이 시각 정보인 이미지를 언어인 텍스트로 설명을 생성하는 모델을 학습합니다. 컴퓨터 비전과 자연어 처리의 멀티모달 모델을 통해 모델이 이미지를 이해해 텍스트를 생성하는 방법을 실습합니다. 현업에서는 이미지 및 영상 검색, 시각장애인을 위한 시스템, 자동 자막 플랫폼, CCTV영상 텍스트화 등에 사용됩니다.

    이론

    • Image Caption 이론

    실습

    • Image Caption 실습 - COCO Dataset, ResNet101 모델 기반 학습
  • SECTION 5. Image Generation 실습 - 텍스트 기반 이미지 생성

    강의 목표

    • Image Generation에 대한 이론을 배우며 이미지와 텍스트의 멀티모달 생성 모델에 대해 학습합니다. Image Caption방식인 이미지를 모델이 이해하고 설명을 생성하는 방식의 반대인 텍스트를 입력받아 이미지를 생성하는 모델을 실습합니다. 현업에서는 만화, 웹툰 채색 및 그림을 돕고, 데이터 학습을 위한 데이터 생성등에 활용됩니다.

    이론

    • Image Generation 이론

    실습

    • Image Generation 실습 - GAN, DCGAN, DALL-E mini(infer)

커리어 성장으로 가는 길, 러닝스푼즈와 함께 하세요!

지금 보고 계시는 강의의 관련 태그로 다른 강의도 찾아보세요.

오프라인

이미지와 텍스트를 넘나드는 컴퓨터비전 : Detection부터 Multimodal까지

강의찾기