2024/09/10 6

알파채널을 적용한 GradCAM 히트맵

- 이런식으로 그래드캠의 히트맵용 Pseudo Color를 투명도를 지정하는 알파채널값으로 대치하면 주목하는 대상물체만을 보여주는 몉보기 효과 같은 동영상이 만들어집니다.- 이것은 미디어 아트나 특수효과 분야에서 쓰임새가 있을거 같습니다. import torchfrom torchvision import models, transformsfrom PIL import Imageimport numpy as npimport cv2from imageio import mimread, mimsaveclass GradCAM: def __init__(self, model, target_layer): self.model = model self.target_layer = target_layer ..

딥러닝 2024.09.10

비디오파일의 모든 프레임들을 이미지파일로 쪼개서 저장하는 터미널 명령어

$ ffmpeg -i myvideo.avi -vf fps=fps=10 frame_%04d.png ​- 초당 10프레임으로 촬영된 비디오파일의 모든 프레임들을 이미지파일들로 쪼개서 저장하는 터미널 명령어 입니다. - 쪼개진 이미지들은 frame_0001.png, frame_0002.png , frame_0003.png ... 이런식으로 저장됩니다.​- 참고로 ffmpeg 설치명령은 이러합니다.맥오에스:$ brew install ffmpeg우분투 리눅스:​$ sudo apt install ffmpeg윈도우즈:$ scoop install ffmpeg  - 터미널에서 작동하는 이미지 처리 유틸은 imagemagick, 동영상 처리 유틸은 ffmpeg, 오디오 처리 유틸은 sox 가 있습니다.- 모두 오픈소스..

맥 팁들 2024.09.10

맥오에스 내장도구로 딥러닝 학습하기. (무설치, 무코딩, 무고인물)

- 나름 역사가 제법 된, 맥용 딥러닝/머신러닝 개발도구 입니다.- 처음엔 CoreML 이란 이름을 달고 나왔드랬죠.- 딥러닝 알고리즘을 몰라도 학습이 가능한 하이엔드 유틸러티로 사용이 쉽고 심플합니다.   - 그림처럼 다양한 딥러닝 학습이 가능한데, 그중 우리는 가장 간단한 이미지 분류를 해 보자구요.- 참고로 두번째 아이콘인 멀티레이블 이미지 분류기는  이미지 한장에 복수개의 레이블을 갖는 분류기를 말합니다.   - 이 짤엔 트레이닝 데이타 영역에 이미 데이타가 채워진게 보이지만, 당근 원래는 비어있습니다.- 특이한건, 애플의 앱 답게 이미지들이 들어있는 폴더를 드래그앤 드랍 하기만 하면  학습 데이타셋 입력이 된다는 것이죠~   - 이런식으로 클래스 별로 이미지들이 들어있는 폴더들의 상위폴더(여기선..

앱개발 2024.09.10

맥 터미널에서 병렬처리하는 유틸, Gnu Parallel

$ ls *.png | parallel 'mogrify -scale 25% {}'​- CPU 병렬처리로 현재 폴더내 모든 png 이미지를 25% 크기로 줄이는 이미지매직 + gnu parallel 명령어 입니다. - imagemagick은 영상처리를 담당하고 Gnu Parallel은 병렬처리만을 담당합니다. 둘다 오픈소스 도구 이구요~ - 당연히, 따옴표 내부의 이미지매직 명령어를 변경하면 다양한 영상처리를 병렬처리화 할수 있겟죠?​- 명령을 내리면 위 그림처럼 모든 쓰레드를 사용하여 고속연산해 줍니다.당근, CPU의 코어가 많을수록 유리 하죠.​- gnu parallel 설치하기맥오에스 터미널: $ brew install parallel리눅스 터미널: $ sudo apt install parallel윈..

맥 팁들 2024.09.10

ComfyUI로 합성데이타 생성하기

- 그림처럼 노드들을 링크로 연결하여 코딩없이도 StableDiffusion 같은 초거대AI기반 모델로 복잡한 이미지 생성을 가능하도록 한다.- 이러케 특정 기능을 수행하는 하나의 노드 연결구조를 워크플로우 하고 부르며 저장하기와 로딩으로 남이 만들어논 워플로우를 나도 사용할수 있게된다.- 이미지생성의 실행은 우상단의 Queue 버튼을 누르면 시작되며 에러가 없으면 그림처럼 이미지들이 생성된다. - 합성된 데이타는 입력한 레퍼린스 이미지와 "비슷은 하지만 새로운" 데이타가 만들어지며, 인간이 취사선택으로 이상한걸 버리면 딥러닝 학습에 적합한 오그먼테이션용 합성 데이타가 얻어지는 것이다. - 이 기술은 일종의 Oneshot LoRA 파인튜닝으로 볼수 있다.- 한장의 이미지 만으로 초거대AI 모델(SDXL)..

딥러닝 2024.09.10