Przejdź do zawartości

Stable Diffusion: Różnice pomiędzy wersjami

Gruntownie przebudowana sekcja o generowaniu offline.
m (→‎Inne: +)
(Gruntownie przebudowana sekcja o generowaniu offline.)
Linia 1: Linia 1:
{{Achtung|Linki na tej stronie są z listopada 2022 i mogą być nieaktualne.}}
'''Stable Diffusion''' - model AI do generowania obrazków na podstawie tekstu, podobny do [[Dall-E]].
'''Stable Diffusion''' - model AI do generowania obrazków na podstawie tekstu, podobny do [[Dall-E]].


Linia 7: Linia 6:


== Generowanie obrazków online ==
== Generowanie obrazków online ==
{{Achtung|Linki na tej stronie są z listopada 2022 i mogą być nieaktualne.}}
Z modelu można dość łatwo skorzystać bez instalowania ani pobierania niczego :D  
Z modelu można dość łatwo skorzystać bez instalowania ani pobierania niczego :D  


Linia 63: Linia 63:


== Generowanie obrazków offline ==
== Generowanie obrazków offline ==
{{Achtung|UWAGA! Używanie Stable Diffusion offline wymaga mocnego kompa. }}
Poniżej znajdują się informacje na temat korzystania ze Stable Diffusion offline.  
Istnieją liczne sposoby na używanie Stable Diffusion offline, które różnią się sposobem skomplikowania.  


=== Easy Diffusion ===
WAŻNE:
Rozwiązaniem przyjaznym dla nowych użytkowników jest Easy Diffusion. Nie wymaga wiedzy technicznej i czytania skomplikowanych instrukcji.  
* Upewnij się najpierw, że spełniasz wymagania sprzętowe.  
* Jeśli generowanie obrazków trwa bardzo długo, możliwe, że musisz coś dodatkowo skonfigurować w programie lub systemie.
* Czas generowania zależy od używanego programu. Zmiana programu może pomóc.


* [https://github.com/cmdr2/stable-diffusion-ui Strona główna projektu]
=== Instalacja i uruchamianie oprogramowania ===
* [https://github.com/cmdr2/stable-diffusion-ui/wiki Wiki projektu]
Istnieją różne narzędzia pozwalające generować obrazki lokalnie na swoim komputerze. Oto wybrane opcje, które są darmowe:
* [https://github.com/AUTOMATIC1111/stable-diffusion-webui?tab=readme-ov-file#stable-diffusion-web-ui AUTOMATIC1111] - bardzo popularny wybór, ponieważ był jednym z pierwszych i jest cały czas aktywnie rozwijany. Nie należy do najbardziej intuicyjnych, ale powstało do niego wiele narzędzi i wtyczek.
* [https://github.com/easydiffusion/easydiffusion?tab=readme-ov-file#easy-diffusion-30 Easy Diffusion] - program starający się być przystępnym w instalacji i użytkowaniu.
* [https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#fooocus Fooocus] - program, który wiele roboty wykonuje za użytkownika. W locie dopracowuje prompty.


==== Instalacja Easy Diffusion na Windows ====
{{Llawlyfr
{{Llawlyfr
|Szerokość = 369
|Szerokość = 369
|Wysokość =
|Wysokość =
|Tekst1 = Znajdź link do pobrania wersji Windows [https://github.com/cmdr2/stable-diffusion-ui na tej stronie].
|Tekst1 = Wejdź w link z nazwą wybranego programu i znajdź instrukcję pobierania oraz instalacji.
<br>
<br>
Odpowiedni przycisk znajdziesz w opisie pod listą plików.  
Jeśli pierwszy raz jesteś na GitHubie i widzisz ogromną listę plików, to możliwe, że musisz po prostu zjechać niżej do instrukcji.
|Tekst2 = Obecnie program posiada instalator typowy jak dla innych aplikacji.  
|Tekst2 = Wykonaj procedurę pobierania i instalacji.
<br>
Zwróć uwagę, że procedura może się różnić w zależności od posiadanego systemu oraz karty graficznej.
|Tekst3 = Uruchom program. Interfejs prawdopodobnie odpala się za pomocą przeglądarki i znajduje się pod lokalnym adresem np. <code>http://127.0.0.1:7860/</code>
<br>
Adres zależy od programu oraz konfiguracji. Powinna być o tym informacja w instrukcji.
}}
}}


==== Uruchamianie Easy Diffusion na Windows ====
=== Pobieranie i instalacja modeli ===
{{Llawlyfr
Wraz z pobranym programem zapewnie pobierze się także jakiś domyślny model. Jednakże oprócz tego istnieje wiele modeli przygotowanych przez społeczność w różnych celach. Przeglądać je możesz na stronie [https://civitai.com/ CivitAi].
|Szerokość = 369
 
|Wysokość =
'''Rodzaje modeli:'''
|Tekst1 = Uruchom utworzony skrót i zaczekaj, aż konfiguracja w oknie tekstowym się zakończy.  
* '''Checkpoint''' - podstawa wymagana do tworzenia. To za jej pomocą jest generowany obrazek. Sam checkpoint może być w zupełności wystarczający.
|Tekst2 = Jeśli wszystko pójdzie dobrze, interfejs powinien się otworzyć na nowej karcie domyślnej przeglądarki.  
* '''LORA''' - mniejszy model, który "pokazuje" podstawowemu checkpointowi, jak wygląda dana postać, interakcja, styl itp. Działa we współpracy z checkpointem. Niestety trzeba trochę poeksperymentować, by znaleźć optymalne duo checkpoint i LORA. Mogą koegzystować słabo lub być zupełnie niekompatybilne.
|Tekst3 = Możesz uzyskać dostęp do interfejsu z dowolnej przeglądarki poprzez adres <code>http://localhost:9000/</code>.
 
}}
'''Baza modeli:'''
* '''SD 1.4, SD 1.5''' - modele oparte na Stable Diffusion 1.4 / 1.5. Mają stosunkowo niskie wymagania sprzętowe i są dedykowane niewielkim rozdzielczościom. Ceną jest jednak niższa jakość i gorsze rozumienie intencji użytkownika.
* '''SDXL''' - modele oparte na nowszym Stable Diffusion XL. Mają wyższe wymagania sprzętowe i zaleca się użyć wyższych rozdzielczości (co dodatkowo podnosi wymogi). Jednak nagrodą jest lepsza jakość i trafniejsze rozumienie intencji użytkownika.
 
Upatrzony model należy umieścić w odpowiednim folderze programu. W zależności od rodzaju, ścieżka będzie wyglądać inaczej (np. gdzie indziej umieścisz checkpoint, a gdzie indziej LORA). W razie wątpliwości poszukaj informacji na stronie programu.
 
== Tworzenie obrazków ==
W tej sekcji zostały wyjaśnione różne elementy i wskaźniki dotyczące tworzenia obrazków.
 
Alternatywnie pomocne może być przejrzenie [https://github.com/easydiffusion/easydiffusion/wiki wiki do Easy Diffusion] oraz [https://getimg.ai/guides poradników na geting.ai], które dobrze tłumaczą podstawy.
 
=== Prompt ===
Prompt to - mówiąc najprościej - polecenie, jakie wydajesz modelowi.
 
Optymalny sposób formułowania promptu zależy od tego, w jaki sposób model był trenowany. Na jego stronie powinny być informacje. Warte wypróbowania zwykle są:
* Język naturalny np. <code>a photograph of an astronaut riding a horse</code>
* Tagi oddzielone przecinkami np. <code>girl, black hoodie, bedroom</code>
** Jeśli używasz modelu dedykowanego hentai, być może dobrze rozumie tagi ze stron typu booru jak Danbooru, E621, Gelbooru, Rule34, [[Sankaku Complex]] itp.
* Model może posiadać "trigger words", których wpisanie jest potrzebne, by uzyskać pożądany rezultat np. odpowiedni styl dla modelu.
 
'''Dodatkowa pomoc w promptach:'''
* [[Galerie dzieł AI]]
 
'''Zewnętrzna pomoc w promptach:'''
* [https://openart.ai/promptbook Stable Diffusion Prompt Book]
 
=== Negative prompt ===
W negative prompt umieszczasz to, czego nie chcesz widzieć na obrazku.  
 
W części modeli warto wpisać tam wszelkie opisy sugerujące niską jakość. Ale są też takie, gdzie najlepiej pozostawić negative prompt puste.
 
Przykładowy negative prompt:
<code>Deformed, blurry, bad anatomy, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, poorly drawn hands, missing limb, blurry, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, mutated hands and fingers, out of frame, watermark</code>
 
=== Wagi w promptach ===
Poszczególnym elementom promptu możesz przyznawać wagi, które informują model, na czym ma się bardziej skupić. Waga 1 jest domyślna. Rzeczy poniżej są mniej istotne (0-1), a powyżej - bardziej (1-2).
* <code>girl on a (chair)1.2, (baseball cap)0.8</code> - w tym prompcie waga dla "chair" jest powyżej średniej, zaś waga dla "baseball cap" poniżej średniej.
 
=== Image Size ===
Rozmiar obrazka.
 
'''Zalecane rozmiary dla modeli opartych na SD 1.4 i SD 1.5:'''
* 512 x 512
 
'''Zalecane rozmiary dla modeli opartych na SDXL:'''<br>
* 1024 x 1024
* 1152 x 896
* 896 x 1152
* 1216 x 832
* 832 x 1216
* 1344 x 768
* 768 x 1344
* 1536 x 640
* 640 x 1536
''Przy czym 512 x 512 również może się dobrze sprawdzić.''
 
=== Inference Steps ===
Liczba kroków, zanim model uzna obrazek za ukończony.
 
Przy zbyt małej liczbie jakość będzie niska. Przy zbyt dużej liczbie nie będzie różnicy w jakości, więc niepotrzebnie zostanie wydłużony czas pracy.
 
Pomóc w zrozumieniu wskaźnika może [https://getimg.ai/guides/interactive-guide-to-stable-diffusion-steps-parameter ten poradnik]. Warto pobawić się podglądem z suwaczkiem.
 
Dla standardowych modeli zwykle zaleca się wartości '''20-40'''. Przy czym dobrze zacząć od dolnych i przesuwać wyżej, gdy jakość nie jest zadowalająca.


==== Pobieranie i wgrywanie modeli do Easy Diffusion ====
Dla modeli turbo optymalne może być zejście nawet do '''5-8'''.
Oprócz podstawowego Stable Diffusion są dostępne liczne modele za darmo. Możesz je wygodnie przeglądać na stronie [https://civitai.com/ civitai.com].


{{Llawlyfr
=== Guidance Scale / CFG Scale ===
|Szerokość = 369
Wskaźnik, jak bardzo model kieruje się promptem.  
|Wysokość =
|Tekst1 = Pobierz model z dowolnego źródła. Bardzo łatwo zrobisz to na [https://civitai.com/ civitai.com].
|Tekst2 = Pobrany plik być może masz umieścić w folderze <code>models/stable-diffusion</code>.
<br>
Czytaj jednak instrukcje do modeli. Czasami wymagają czegoś jeszcze. [https://github.com/easydiffusion/easydiffusion/wiki/Custom-Models Więcej informacji], [https://civitai.com/articles/530/im-a-noob-faq-your-questions-answered-that-you-didnt-know-to-ask Jeszcze więcej informacji].
|Tekst3 = Aby tworzyć obrazki w pobranym modelu w Easy Diffusion, rozwiń w interfejsie panel '''Image settings''' i znajdź linię '''Model'''.
|Liczba4 = [[File:Innovation_-_The_Noun_Project.svg|20px]]
|Tekst4 = Pamiętaj, że różne modele były trenowane na różnie opisanych bazach danych, dlatego mogą wymagać innego formułowania poleceń.
<br>
Część z nich posiada też "Trigger Words", które musisz wpisać, by obrazki nabrały charakterystycznego stylu dla pobranego modelu.
}}


=== Inne oprogramowanie do generowania offline ===
Przy zbyt niskiej wartości obrazek będzie miał niewiele wspólnego z promptem. Przy zbyt wysokiej wartości może spaść jakość oraz kreatywność.
* [https://github.com/AUTOMATIC1111/stable-diffusion-webui?tab=readme-ov-file#stable-diffusion-web-ui AUTOMATIC1111] - bardzo popularny wybór, ponieważ był jednym z pierwszych i jest cały czas aktywnie rozwijany. Nie należy do najbardziej intuicyjnych, ale powstało do niego wiele narzędzi i wtyczek.
* [https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#fooocus Fooocus] - program, który wiele roboty wykonuje za użytkownika, dzięki czemu pozostaje skupić się jedynie na promptach i obrazkach.


=== Poradniki zewnętrzne ===
Zwykle zaleca się wartości '''5-15'''.
* [https://rentry.org/voldy Spory poradnik zawierający listę modeli itp. (ANG)]
* [https://www.reddit.com/r/StableDiffusion/wiki/tutorials/ Zbiór poradników zebrany na r/StableDiffusion (ANG)]


== Wybrane modele ==
== Wybrane modele ==
Linia 135: Linia 190:


== Linki zewnętrzne ==
== Linki zewnętrzne ==
* [https://civitai.com/ Citivai] - zbiór różnych modeli do Stable Diffusion
* [https://civitai.com/ Citivai] - zbiór różnych modeli do Stable Diffusion (ANG)
* [https://lexica.art/ Lexica] - galeria obrazów wygenerowanych w Stable Diffusion wraz z wprowadzonymi opisami.
* [https://rentry.org/voldy rentry.org] - spory poradnik zawierający listę modeli itp. (ANG)
* [https://prompthero.com/ Prompthero] - galeria obrazów wygenerowanych w różnych AI wraz z wprowadzonymi opisami.
* [https://www.reddit.com/r/StableDiffusion/wiki/tutorials/ r/StableDiffusion/wiki/tutorials] Zbiór poradników zebrany na r/StableDiffusion (ANG)


== Zobacz też ==
== Zobacz też ==