목록이미지 (5)
맥에서 오픈소스로

- 오토엔코더(Auto-Encorder)의 오토(Auto)- 란 말은 자동(automatic)이란 뜻이 아니고 오토-코릴레이션(Auto-Correlation)에서 유래한 말입니다.- 원래는 신호처리에서 유래한 용어입니다. 자기자신(Self-) 이란 의미로 쓰인거죠. - 즉, 입력과 출력에 동일한 이미지가 들어간다는 뜻입니다. - 신경망의 입력과 타겟에 동일한 이미지가 들어가게 학습함으로서 병목구간에서 의미있는 피쳐들을 뽑아내는 원리인거죠 ..그래서 오토-엔코더 .- 하지만 이 그림처럼 입력과 출력에 다른 이미지가 들어가는 엔코더도 저렇게 오토엔코더라고 부르는거 같습니다. ..개인적으로는 저런 엔코더는 Cross-Encoder 라고 불러야 하지 않을까? 라고 생각합니다.- 왜냐하면 신호처리에선 같은 두 이..

$ magick identify -format '%f: %C\n' * | grep -i truncated- 현재폴더 내의 수천~수만개의 이미지들 중에 truncated 된 이미지가 있는지 찾는 imagemagick 명령어 입니다. - truncated image(깨진 이미지)란 이 그림처럼 이미지 일부가 미센싱 등의 이유로 미완성된 이미지를 말하는데 ..회색부분은 검정색으로 나타나는게 더 일반적입니다.- 이렇게 이미지 뷰어로 보이면 그나마 다행인데 아예 미리보기등의 뷰어로 안보이는 이미지 파일들도 존재하죠.- 수만 수백만장의 이미지 데이타셋으로 딥러닝을 학습하다가 truncated image 오류가 발생하면 아주 난감한데.. 그 이유는 대부분 딥러닝 학습코드의 data_loader 에는 파일명 정보를..

- 어떤 활용이 가능할진 아직 모르겠지만 업계 최초로 ComfyUI에 입력된 이미지의 푸리에 스펙트럼을 만드는 Node 를 만들어 보았습니다.- 파이썬 패키지로 torch 와 scipy, pillow, 그리고 numpy 등을 사용했습니다.- ComfyUI 에 이미지 뒤집기나 이진화, 에지검출 등의 간단한 노드만들기는 쉬우나 주파수도메인에서의 변환이나 필터링 같은걸 만드는 건 꽤나 어렵더군요.. 왜냐하면 이미지데이타를 텐서로 바꾸어서 CUDA 메모리상에서 처리해ㅔ 주어야하기 때문입니다.- 그래도 한번 만들어 봤다는 ~import torchimport numpy as npfrom PIL import Image, ImageOps, ImageFilterfrom scipy.fft import fft2, ffts..

- 다만 아직 FLUX 가 mps 모드를 지원하지 않아 cpu mode 로 돌려서인지 꽤나 느립니다.이미지 한장 생성시에 한 8초 정도 걸려요.(m1 mac mini 16기가 기준). - 글자 생성은 영문인 경우 몇번 시도하면 그중에 한장은 정확하게 만들어 줍니다.- 하지만 한국어 글자는 아직 갈길이 머네요~ --; - 네거티브 프롬프트 없이 짧은 포지티브 프롬프트 입력 만으로 이런 정도의 이미지들을 만들어 줍니다. 구동 환경:- H/W: m1 macmini 16GB- O/S: OSX 소노마- W/B: Safari- ComfyUI in CPU mode.Stable Diffusion 동네에 FLUX라는 강력한 새모델이 오픈됬다고 해서 m1 맥미니에서 오랫만에 ComfyUI를 돌려보았습니다.아직은 Flu..

$ ffmpeg -i myvideo.avi -vf fps=fps=10 frame_%04d.png - 초당 10프레임으로 촬영된 비디오파일의 모든 프레임들을 이미지파일들로 쪼개서 저장하는 터미널 명령어 입니다. - 쪼개진 이미지들은 frame_0001.png, frame_0002.png , frame_0003.png ... 이런식으로 저장됩니다.- 참고로 ffmpeg 설치명령은 이러합니다.맥오에스:$ brew install ffmpeg우분투 리눅스:$ sudo apt install ffmpeg윈도우즈:$ scoop install ffmpeg - 터미널에서 작동하는 이미지 처리 유틸은 imagemagick, 동영상 처리 유틸은 ffmpeg, 오디오 처리 유틸은 sox 가 있습니다.- 모두 오픈소스..