Back to Annotated Deep Learning Paper Implementations

විමසුමක් සමඟ ස්ථාවර විසරණය භාවිතා කරමින් තීන්ත ආලේපන රූප

docs/si/diffusion/stable_diffusion/scripts/in_paint.html

latest7.2 KB
Original Source

homediffusionstable_diffusionscripts

View code on Github

#

විමසුමක් සමඟ ස්ථාවර විසරණය භාවිතා කරමින් තීන්ත ආලේපන රූප

11importargparse12frompathlibimportPath13fromtypingimportOptional1415importtorch1617fromlabmlimportlab,monit18fromlabml\_nn.diffusion.stable\_diffusion.latent\_diffusionimportLatentDiffusion19fromlabml\_nn.diffusion.stable\_diffusion.samplerimportDiffusionSampler20fromlabml\_nn.diffusion.stable\_diffusion.sampler.ddimimportDDIMSampler21fromlabml\_nn.diffusion.stable\_diffusion.utilimportload\_model,save\_images,load\_img,set\_seed

#

රූපයේ පින්තාරු කිරීමේ පන්තිය

24classInPaint:

#

28model:LatentDiffusion29sampler:DiffusionSampler

#

  • checkpoint_path යනු මුරපොලේ මාර්ගයයි
  • ddim_steps නියැදි පියවර ගණන වේ
  • ddim_etaDDIM නියැදිη නියතය
31def\_\_init\_\_(self,\*,checkpoint\_path:Path,32ddim\_steps:int=50,33ddim\_eta:float=0.0):

#

39self.ddim\_steps=ddim\_steps

#

ගුප්ත විසරණය කිරීමේ ආකෘතිය පටවන්න

42self.model=load\_model(checkpoint\_path)

#

උපාංගය ලබා ගන්න

44self.device=torch.device("cuda:0")iftorch.cuda.is\_available()elsetorch.device("cpu")

#

ආකෘතිය උපාංගයට ගෙන යන්න

46self.model.to(self.device)

#

ඩීඩීඅයිඑම් නියැදිකරු ආරම්භ කරන්න

49self.sampler=DDIMSampler(self.model,50n\_steps=ddim\_steps,51ddim\_eta=ddim\_eta)

#

  • dest_path ජනනය කරන ලද රූප ගබඩා කිරීමේ මාර්ගයයි
  • orig_img යනු පරිවර්තනය කිරීමට රූපයයි
  • strength මුල් රූපයේ කොපමණ ප්රමාණයක් සංරක්ෂණය නොකළ යුතුද යන්න නියම කරයි
  • batch_size යනු කණ්ඩායමක් තුළ ජනනය කළ යුතු රූප ගණන
  • prompt සමඟ රූප ජනනය කිරීමේ විමසුම
  • uncond_scale යනු කොන්දේසි විරහිත මාර්ගෝපදේශs පරිමාණයයි. මෙය භාවිතා වේϵθ​(xt​,c)=sϵcond​(xt​,c)+(s−1)ϵcond​(xt​,cu​)
[email protected]\_grad()54def\_\_call\_\_(self,\*,55dest\_path:str,56orig\_img:str,57strength:float,58batch\_size:int=3,59prompt:str,60uncond\_scale:float=5.0,61mask:Optional[torch.Tensor]=None,62):

#

විමසුම් කණ්ඩායමක් සාදන්න

73prompts=batch\_size\*[prompt]

#

රූපය පටවන්න

75orig\_image=load\_img(orig\_img).to(self.device)

#

ගුප්ත අවකාශයේ රූපය කේතනය කර එහිbatch_size පිටපත් සාදන්න

77orig=self.model.autoencoder\_encode(orig\_image).repeat(batch\_size,1,1,1)

#

සපයා නොමැතිmask නම්, රූපයේ පහළ භාගය ආරක්ෂා කර ගැනීම සඳහා අපි නියැදි ආවරණයක් සකස් කරමු

80ifmaskisNone:81mask=torch.zeros\_like(orig,device=self.device)82mask[:,:,mask.shape[2]//2:,:]=1.83else:84mask=mask.to(self.device)

#

ශබ්දය මුල් රූපය විසුරුවා හරින්න

86orig\_noise=torch.randn(orig.shape,device=self.device)

#

මුල් පිටපත විසුරුවා හැරීමට පියවර ගණන ලබා ගන්න

89assert0.\<=strength\<=1.,'can only work with strength in [0.0, 1.0]'90t\_index=int(strength\*self.ddim\_steps)

#

AMP වාහන වාත්තු

93withtorch.cuda.amp.autocast():

#

කොන්දේසි විරහිත පරිමාණය තුළ හිස් විමසීම් සඳහා කාවැද්දීම්1 ලබා නොගනී (කන්ඩිෂනේෂන් නැත).

95ifuncond\_scale!=1.0:96un\_cond=self.model.get\_text\_conditioning(batch\_size\*[""])97else:98un\_cond=None

#

කඩිනම් කාවැද්දීම් ලබා ගන්න

100cond=self.model.get\_text\_conditioning(prompts)

#

මුල් රූපයට ශබ්දය එක් කරන්න

102x=self.sampler.q\_sample(orig,t\_index,noise=orig\_noise)

#

වෙස්ගත් ප්රදේශය ආරක්ෂා කර ගනිමින් is ෝෂාකාරී රූපයෙන් ප්රතිනිර්මාණය කරන්න

104x=self.sampler.paint(x,cond,t\_index,105orig=orig,106mask=mask,107orig\_noise=orig\_noise,108uncond\_scale=uncond\_scale,109uncond\_cond=un\_cond)

#

ස්වයංක්රීය එන්කෝඩරයෙන් රූපය විකේතනය කරන්න

111images=self.model.autoencoder\_decode(x)

#

පින්තූර සුරකින්න

114save\_images(images,dest\_path,'paint\_')

#

CLI

117defmain():

#

121parser=argparse.ArgumentParser()122123parser.add\_argument(124"--prompt",125type=str,126nargs="?",127default="a painting of a cute monkey playing guitar",128help="the prompt to render"129)130131parser.add\_argument(132"--orig-img",133type=str,134nargs="?",135help="path to the input image"136)137138parser.add\_argument("--batch\_size",type=int,default=4,help="batch size",)139parser.add\_argument("--steps",type=int,default=50,help="number of sampling steps")140141parser.add\_argument("--scale",type=float,default=5.0,142help="unconditional guidance scale: "143"eps = eps(x, empty) + scale \* (eps(x, cond) - eps(x, empty))")144145parser.add\_argument("--strength",type=float,default=0.75,146help="strength for noise: "147" 1.0 corresponds to full destruction of information in init image")148149opt=parser.parse\_args()150set\_seed(42)151152in\_paint=InPaint(checkpoint\_path=lab.get\_data\_path()/'stable-diffusion'/'sd-v1-4.ckpt',153ddim\_steps=opt.steps)154155withmonit.section('Generate'):156in\_paint(dest\_path='outputs',157orig\_img=opt.orig\_img,158strength=opt.strength,159batch\_size=opt.batch\_size,160prompt=opt.prompt,161uncond\_scale=opt.scale)

#

165if\_\_name\_\_=="\_\_main\_\_":166main()

Trending Research Paperslabml.ai