일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Git
- 기능과 역할
- 객체 탐지
- DACON
- 리눅스 빌드
- 커스텀 애니메이션 적용
- AI Security
- Towards Deep Learning Models Resistant to Adversarial Attacks
- DOTA dataset
- InstructPix2Pix
- 사회초년생 추천독서
- TensorFlow Object Detection Model Build
- 논문 분석
- Custom Animation
- Branch 활용 개발
- CARLA simulator
- Object Detection Dataset 생성
- TensorFlow Object Detection Error
- TensorFlow Object Detection 사용예시
- paper review
- TensorFlow Object Detection API install
- object detection
- Paper Analysis
- 크롤링
- Carla
- VOC 변환
- Linux build
- Docker
- 논문분석
- 개발흐름
- Today
- Total
목록전체 글 (47)
JSP's Deep learning
1. 언어모델의 역사 Transformer의 등장을 통해서 RNN의 입력 시퀀스 길이에 따른 모델 복잡도, 기울기 소실 문제 등을 개선하였다. Transformer는 거대 언어 모델(Large Language Model)의 토대가 되었다. 현재(2023년)에는 범용 인공지능에 한 발짝 다가선 ChatGPT가 화두에 올랐다. 2. Transformer 2.1. 구조 2.1.1. 전체 구조 Transformer의 구조는 크게 5가지로 나눌 수 있다. 인코더 입력 전처리된 입력 문장에 대한 임베딩을 수행한다. 포지션 인코딩을 통해 위치 값을 반영한다. 디코더 입력 디코더의 입력 문장에 대한 임베딩 및 포지션 인코딩을 수행한다. 학습시에는 정답문장, 추론(번역 task)시에는 시작 토큰이 최초 입력으로 주어진다..
1. InstructPix2Pix란? 이미지와 텍스트(지시어)의 입력으로 이미지를 지시어대로 편집하는 Diffusion 모델 Prompt to Prompt 기법을 적용하여 편집된 이미지와 편집 전 이미지의 일관성을 보장 GPT-3와 Stable Diffusion모델을 사용하여 이미지와 그에 맞는 지시어 그리고 편집된 이미지의 학습데이터를 구축 (즉, 기존의 대형 언어모델과 이미지 생성 모델을 사용하여 학습데이터셋 구축) 기존 image to image 모델과 다르게 이미지 스타일 변화, 배경 변경 등 다양한 이미지 편집 기능을 수행 (하지만 학습데이터셋에 존재하지 않는 편집기능은 수행할 수 없음) 2. 용어정리 2.1. Prompt to Prompt Prompt의 각 토큰(단어)이 어떤 픽셀과 유사한지를..
mmdetection이란? Tensorflow object detection API처럼 다양한 객체 탐지 모델을 제공하고 학습, 추론, 파인튜닝, 모델 수정 등 다양한 기능을 제공하는 open source이며, pytorch을 기반으로 구성되어있다. 1. mmdetection 다운로드 git clone https://github.com/open-mmlab/mmdetection.git 2. Dockerfile 빌드 GPU 이름 확인 nvidia-smi --query | fgrep 'Product Name' CUDA GPU와 호환되는 Compute Capability 확인(링크) GTX3090 : 8.6 pytorch docker image을 통한 버전확인 pytorch : 1.9.0 cuda : 11.1 ..