Stable Diffusion: Różnice pomiędzy wersjami

Usunięte 195 bajtów ,  6 wrz 2022
m
troche łatwiejsza metoda xD
mNie podano opisu zmian
m (troche łatwiejsza metoda xD)
Linia 7: Linia 7:
= Generowanie obrazków =
= Generowanie obrazków =


== Google Colab ==
== Uzyskiwanie dostępu do modelu ==
 
Na początku trzeba uzyskać dostęp do modelu:
* Załóż konto na stronie https://huggingface.co/
* Załóż konto na stronie https://huggingface.co/
* Przejdź do strony https://huggingface.co/CompVis/stable-diffusion-v1-4 i kliknij "Access repository"
* Przejdź do stron [https://huggingface.co/CompVis/stable-diffusion-v1-4 Stable Diffusion v1-4] oraz [https://huggingface.co/CompVis/stable-diffusion-v-1-4-original Stable-Diffusion-v-1-4-Original] i w obu kliknij "Access repository"
* W ustawieniach konta, na stronie https://huggingface.co/settings/tokens utwórz nowy token z dowolną nazwą i rolą "Read".
* W ustawieniach konta, na stronie https://huggingface.co/settings/tokens utwórz nowy token z dowolną nazwą i rolą "Read".


 
== Uruchamianie ==
Do generowania można wykorzystać Google Colab, środowisko troche przypominające wirtualną maszynę, gdzie do dyspozycji są gangsta karty graficzne. :D
* Otwórz projekt w Google Colab: https://colab.research.google.com/github/neonsecret/stable-diffusion/blob/main/optimized_colab.ipynb
 
Projekt colab jest dostępny pod linkiem: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb
 
* Z menu Runtime na górze wybierz "Change runtime type" i w Hardware accelerator wybierz GPU.
* Z menu Runtime na górze wybierz "Change runtime type" i w Hardware accelerator wybierz GPU.
* W projekcie jest dodanych kilka fragmentów kodu. Najeżdżając myszką w to miejsce można odpalić wybrany fragment:
* W projekcie jest dodanych kilka fragmentów kodu. Najeżdżając myszką w to miejsce można odpalić wybrany fragment:
[[Plik:Colab.png]]
[[Plik:Colab.png]]
* Odpal po kolei wszystkie fragmenty aż do tego gdzie jest przykładowy obrazek z astronautą na koniu.  
* Uruchom 4 pierwsze fragmenty po kolei.  
Jeden z nich poprosi o wklejenie tokenu wygenerowanego wcześniej.
3 fragment poprosi o dostęp do dysku google (do przechowywania modelu)<ref>Model zajmuje 4 GB, dobrze jest wybrać tutaj drugie konto google żeby nie marnować miejsca :D</ref>, w 4 trzeba wkleić token ze strony huggingface.co.
 
* 3 linijka w fragmencie do generowania obrazków wygląda tak:
<code>prompt = "a photograph of an astronaut riding a horse"</code>
 
Można zmienić ten tekst na swój własny i odpalić ten fragment na nowo, aby wygenerować obrazek (powinien zadziałać też skrót Ctrl+Enter)


=== Generowanie kilku obrazków naraz ===
== Generowanie obrazków ==
Pod nagłówkiem "Okay next run one of the three (img2img, txt2img, inpainting)" wybierz jakiej wersji chcesz użyć:
* txt2img - Generuje obrazki na podstawie tekstu
* img2img - Generuje obrazki na podstawie tekstu oraz innego obrazka
* inpainting - pozwala wrzucić jakiś obrazek i zastąpić jego fragment.


Żeby wygenerować więcej obrazków naraz, naciśnij Ctrl+F i poszukaj fragmentu, który zaczyna się od <code>from PIL import Image</code>. Uruchom go, a zaraz poniżej jest kolejny fragment gdzie można zmienić tekst na własny i generować obrazki.
Po uruchomieniu jednej z tych wersji zobaczysz link podobny do <code>Running on public URL: https://46385.gradio.app</code>, gdzie możesz generować obrazki.  


=== RAM ===
Żeby wygenerować więcej niż 1 obrazek, zwiększ parametr "n_iter" :D


Czasami może wyskoczyć błąd o braku pamięci RAM. Żeby go rozwiązać kliknij w menu na górze Runtime > Restart runtime. Trzeba niestety wtedy odpalić na nowo te fragmenty kodu od <code>!nvidia-smi</code> do <code>pipe = pipe.to("cuda")</code>.
== Przypisy==
<references/>


[[Kategoria:Oprogramowanie]]
[[Kategoria:Oprogramowanie]]