AI가 상용화가 되면서 그 발전 속도가 정말 무서울 정도다...이제는 스마트폰 기준으로 생성AI는 드디어 2023년 10월 15일 현재, [보고],[듣고],[말하고], [제안]하고 그리기 까지 한다. 이제 스스로 [생각]하고[판단] 만한다면...정말..

이형님이 진짜 오실지도..





실제 최근 뉴스와 25년전에 나온 영화의 이야기와 이제는 구분이 되지 않는다? 심지어는 가따 끼워맞추니까 저 드론의 생긴것도...영화의 그것과 비슷.....

어쨌든 예상했던 결과지만 기술의 발전속도가 워낙에 빠르지만 이 AI라는것은 특성상 하드웨어적 통제를 벗어날 수 만 있으면 발전속도가 무한급으로 성장할 수밖에 없으니...단순히 문명의 발달을 무조건적으로 좋게만 받아들이는게 맞지는 않을 것도 같다..경계하며 통제방안을 만들어야 한다는 유명한 사람들의 말이 상당부분 공감간다.
암튼 각설 작년 11월에 나와서 아직 1년이 안된 현시점에서 Chat GPT는 그림을 그리고 듣고 말하기 시작했다.
그중에서도 오늘은 그림을 그리는 이야기를 해볼까 한다.
사실 이미지생성 ai는 이미 많이 존재 한다. 유 명한 몇개만 꼽자면 당연히 Chat GPT를 만든 open ai의 Dall-e2

너무도 유명하고 가장 많이 사용되는 미드저니 Midjourney

그리고 강력한 Custom 기능을 가진 Stable Diffusion

나 같은경우에는 3가지를 다 사용한다
스테이블 디퓨전은 사실 기능적으로 할 수있는게 많아 보인다. Webui 를 통해서 Custom 해야하는 특징때매 일반 인들의 접근이 약간 부담스러운 부분이 있지만 그만큼 매력적이다.

나같은경우도 Git-hub를 통해서 PC에 설치 해서 사용하는 방법과 구글 코랩방법을 다썼는데 일단 편하게 PC 버전으로 좀 공부중이다. PC 성능을 좀 타는 편이다. 당연한 얘기지만....다른 AI 들은 SaaS 방식인데 비해 스테이블 디퓨전은 내 하드웨어 자원을 사용하니까...그래서 구글코랩을 통해서들 많이 하는것 같다. 개인의 기량과 PC의 성능에 따라 퍼퍼먼스가 상당하다.
어쩌면 활용도가 나한테는 제일 높아질 확률이 높다.
현재는 내가 가장 많이 사용하고 있는 것이 Midjourney이다.
디스코드 가입만하면 사용할 수 있을정도로 접근이 굉장히 쉽고, 가장 유명하고, 일반적으로 프롬프트에 따른 그림도 가장 예술적면에서 수려하게 그린다.



나름대로 정형화 되어있고 필요에 맞는 그림을 잘 그려낼 수 있는데....뭐랄까 어쨌든 디스코드내에서만 써야되다보니 불편함도 있고....뭐 그런게 있다.

최근 작업중인 스토리가 있어서...하는방식이 GPT 를 통해서 스토리와 컨셉을 기획하고, GPT의 Conversation 중 미드저니 프롬프를 학습시킨 녀석을 통해 미드저니에서 생성을 해서 사용하는 식으로 많이 하는데...귀찮고 그런게 좀 있다..
Dalle 같은경우에는 사실 크게 사용한적은 없고 다만, 전에 유튜브보고 따라서,
Open AI API 사용법을 공부하는 차원에서 첨으로 사용을 해봤다.

작성하면 그림 그려주는 스마트폰 App 샘플
빵형 이라는 분이 올려놓은 강의 보고 그냥 따라한거다
물론 Develop 할수 있는 요소는 있는 되게 귀찮아서 그냥 안하고 다른 공부하는중이다.
그냥 현재는 단순히 Chat GPT 에게 물어보면 GPT API가 단순한 Dalle 프롬프트를 생성 해서 Dalle API 에게 던지면 Dalle가 그림을 생성해주는 방식이다
하지만 응용 하면 괜찮은 사용처들이 나올거같다.

그러던 와중에 최근에 Dalle3 소식을 듣게 되었다. DALLE3 가 발표되면서 프롬프트창에서 입력하면 바로 이미지가 생성되는 것이 가능해졌다고...

그러면서 성능향상에 대한 여러 이야기들이 나오고있다.

기존보다 더 긴 프롬프트를 통해 고화질 고품질의 그림을 생성할 수 있고, 혐오컨텐츠 방지기능과 안정성이 훨씬 좋아졌다고한다...그와동시에 특정 아티스트 스타일 이미지를 요청하는것은 금지 시켜 저작권에 대한 보호기능도 생겼다.
내가 볼때는 어느쪽이 더 좋고 나쁜건 없는것 같고 필요에 따라 사용 해야 하는것으로 보인다. 현재까지는 근데 내가 가장 구미가 당기는 부분이 2가지였는데
첫번째까 DALLE3 는 Text 표현을 아주 잘 해준다는것이다. 미드저니의 취약점이 Text는거의 포기해야한다. 오히려 있으면 편집이 힘들어져서 안하는게 좋다. 이번에 파티룸 로고를 만드는 과정에서도 무진장 애를 썼는데 결국은 뽑아서 뽀샵으로 후처리를 했다.


그런데 이제 DALLE3를 사용하면 되지 않을까싶다.
그래서 1차적으로 어떻게 하는지 한참 찾았는데 API로 밖에 못쓰나 했다...ChatGPT에서 사용하는 방법을 알아냈다.
챗GPT에서 그림그리는 방법
우선 필요 조건이 있다 : Chat GPT PLUS 사용자여야 한다. 즉, 유료회원 전용이다 아직까지는

두번째 조건은 Settings 가 이렇게 되어 있어야한다

세번째가 젤 중요한데 그냥 PLUS 회원이라고 제공해주는게 아니라 신청을 해야된다 아직 Alpha 수준이라서 그런거같다.
찾기가 쉽지 않은데 그냥 Url로 들어가면 된다
https://forms.gle/bjPwvdZrRyJqKhQLA
DALL-E in ChatGPT Alpha Access Form
We have excess capacity and I can add some more people! Please fill in this form. You will only be able to use DALL-E in ChatGPT if you have ChatGPT Plus. Please do not fill this out if you don't have ChatGPT Plus
docs.google.com
위 Url을 통해서 신청
그러면 신청이 전달되고 길게는 24시간 정도 안에 Chat GPT 다시 접속하면

이렇게 Dall.e3 가 추가 된것을 볼 수 있다. 선택하고 사용하면 된다...저런게 좀 아쉽다 브라우징과 확장형 분석과 Dalle 를 한번에 이용할 방법은 없으니 아직....
이제 미드저니용 프롬프트를 따로만들어서 미드저니 가서 하고..그렇게 안해도 된다. 그치만 여전히 미드저니는 더 수려한 그림을 그리기에 좋으므로 각자 필요에 따라 사용하면 좋을것 같다.
그리고 중요한 Tip 하나! ChatGPT PLUS 즉 유료 회원이 아니여도 Dalle3 무료로 사용가능하다. 다만 어느정도인거같다 내가볼때는...성능이 좀 달라보이지만, 그래도 사용할만한 수준인거같다.
바로 MS Edge 브라우저를 사용하는 방법이다

Edge 브라우저를 최신업데이트 하면 오른쪽 위에 빙채팅 아이콘이있다. 이제 빙채팅을 통해 그림 생성 요청을 하면 DALLE를 통해 그림을 그릴수있다. 약간의 성능차이는 있는거같다. 느낌이. 한글도 잘먹힌다.
재밌는 세상...
'Issue 등등..' 카테고리의 다른 글
| 내가 만든 음악으로 유튜브 음악채널 만들었다 AI음악가 (0) | 2024.07.22 |
|---|---|
| 인스타그램 가입 오류 "보내드린 SMS 코드를 입력하세요" (0) | 2023.04.30 |
| ‘트랜스포머: 비스트의 서막’ 2023년 6월 개봉 "언제 만든거야? 또" (1) | 2022.12.04 |
| 12년만에 대한민국이 월드컵 16강에 진출했다! 아이 기분조아!! (2) | 2022.12.04 |
| FTX 거래소 파산 "금융위기는 정말 다채로운 방법으로 어떻게 해서든 온다." (0) | 2022.11.13 |