JSP's Deep learning

Notice

Recent Posts

Recent Comments

Link

GitHub

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (47)

JSP's Deep learning

[Paper Review - NLP] Transformer : Attention Is All You Need

1. 언어모델의 역사 Transformer의 등장을 통해서 RNN의 입력 시퀀스 길이에 따른 모델 복잡도, 기울기 소실 문제 등을 개선하였다. Transformer는 거대 언어 모델(Large Language Model)의 토대가 되었다. 현재(2023년)에는 범용 인공지능에 한 발짝 다가선 ChatGPT가 화두에 올랐다. 2. Transformer 2.1. 구조 2.1.1. 전체 구조 Transformer의 구조는 크게 5가지로 나눌 수 있다. 인코더 입력 전처리된 입력 문장에 대한 임베딩을 수행한다. 포지션 인코딩을 통해 위치 값을 반영한다. 디코더 입력 디코더의 입력 문장에 대한 임베딩 및 포지션 인코딩을 수행한다. 학습시에는 정답문장, 추론(번역 task)시에는 시작 토큰이 최초 입력으로 주어진다..

Paper Review/NLP 2023. 5. 2. 17:01

[Paper Review - Diffusion] InstructPix2Pix : Learning to Follow Image Editing Instruction

1. InstructPix2Pix란? 이미지와 텍스트(지시어)의 입력으로 이미지를 지시어대로 편집하는 Diffusion 모델 Prompt to Prompt 기법을 적용하여 편집된 이미지와 편집 전 이미지의 일관성을 보장 GPT-3와 Stable Diffusion모델을 사용하여 이미지와 그에 맞는 지시어 그리고 편집된 이미지의 학습데이터를 구축 (즉, 기존의 대형 언어모델과 이미지 생성 모델을 사용하여 학습데이터셋 구축) 기존 image to image 모델과 다르게 이미지 스타일 변화, 배경 변경 등 다양한 이미지 편집 기능을 수행 (하지만 학습데이터셋에 존재하지 않는 편집기능은 수행할 수 없음) 2. 용어정리 2.1. Prompt to Prompt Prompt의 각 토큰(단어)이 어떤 픽셀과 유사한지를..

Paper Review/Diffusion 2023. 4. 4. 23:17

[Deep learning - Useful library] mmdetection 설치 및 테스트

mmdetection이란? Tensorflow object detection API처럼 다양한 객체 탐지 모델을 제공하고 학습, 추론, 파인튜닝, 모델 수정 등 다양한 기능을 제공하는 open source이며, pytorch을 기반으로 구성되어있다. 1. mmdetection 다운로드 git clone https://github.com/open-mmlab/mmdetection.git 2. Dockerfile 빌드 GPU 이름 확인 nvidia-smi --query | fgrep 'Product Name' CUDA GPU와 호환되는 Compute Capability 확인(링크) GTX3090 : 8.6 pytorch docker image을 통한 버전확인 pytorch : 1.9.0 cuda : 11.1 ..

Deap learning/Useful library 2023. 3. 29. 23:36

이전 Prev 1 2 3 4 5 ··· 16 Next 다음

목록전체 글 (47)

JSP's Deep learning

티스토리툴바