GitHub - lucidrains/deep-daze: Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network)
- OpenAI의 CLIP과 Siren을 이용해서, 간단한 문자열을 넣으면 이미지를 생성해주는 도구 $ imagine "a house in the forest" - 기본 모드는 최대 77자만 가능 - create_story 옵션을 주면 전체 이야기/노래/시 등을 변화하는 이미지로 생성가능
OpenAI의 Dall-E가 클로즈드 소스여서, 이걸 오픈으로 구현하고자 하는 시도들 - DALL·E : 텍스트에서 이미지 생성하기 https://news.hada.io/topic?id=3537 - DALL-E in Pytorch https://github.com/lucidrains/dalle-pytorch - Big Sleep - text-to-image : CLIP + BigGAN, https://github.com/lucidrains/big-sleep
OpenAI의 CLIP 을 이용한 다른 프로젝트 - 유튜브 비디오 내부를 자연어로 검색하기 https://news.hada.io/topic?id=3741 Text-to-speech function is limited to 200 characters |