Back to Annotated Deep Learning Paper Implementations

එම්එල්පී මික්සර් අත්හදා බැලීම

docs/si/transformers/mlp_mixer/experiment.html

latest5.2 KB
Original Source

hometransformersmlp_mixer

View code on Github

#

එම්එල්පී මික්සර් අත්හදා බැලීම

මෙය එම්එල්පී මික්සර් ආකෘතියක්පුහුණු කිරීම සඳහා කරන ලද පයිටෝර්ච් අත්හදා බැලීමකි.

12fromlabmlimportexperiment13fromlabml.configsimportoption14fromlabml\_nn.transformersimportTransformerConfigs15fromlabml\_nn.transformers.configsimportFeedForwardConfigs16fromlabml\_nn.transformers.mlm.experimentimportTransformerMLM,ConfigsasMLMConfigs

#

වින්යාසකිරීම්

මැස්ඩ් භාෂා ආකෘති සඳහා අත්හදා බැලීමක් නිර්වචනය කරන MLMConfigs ස්ථානයෙන් මෙය උරුම වේ.

19classConfigs(MLMConfigs):

#

MLPසඳහා වින්යාසගත කළ හැකි පෝෂක-ඉදිරි ජාලය

29mix\_mlp:FeedForwardConfigs

#

මිශ්රMLP වින්යාසයන්

32@option(Configs.mix\_mlp)33def\_mix\_mlp\_configs(c:Configs):

#

38conf=FeedForwardConfigs()

#

එම්එල්පීහි ප්රමාණය අනුක්රමික දිග වේ, මන්ද එය ටෝකන හරහා යොදන බැවිනි

40conf.d\_model=c.seq\_len

#

කඩදාසි GELU සක්රිය කිරීමට යෝජනා කරයි

42conf.activation='GELU'

#

45returnconf

#

ට්රාන්ස්ෆෝමර්වින්යාසයන්

48@option(Configs.transformer)49def\_transformer\_configs(c:Configs):

#

අපගේ වින්යාසගත කළ හැකි ට්රාන්ස්ෆෝමර් ක්රියාත්මක කිරීම භාවිතා කරමු

56conf=TransformerConfigs()

#

කාවැද්දීම්සහ පිවිසුම් උත්පාදනය සඳහා වචන මාලාව ප්රමාණ සකසන්න

58conf.n\_src\_vocab=c.n\_tokens59conf.n\_tgt\_vocab=c.n\_tokens

#

කාවැද්දීමප්රමාණය

61conf.d\_model=c.d\_model

#

අවධානයමොඩියුලය MLPMixer වෙත වෙනස් කරන්න

63fromlabml\_nn.transformers.mlp\_mixerimportMLPMixer64conf.encoder\_attn=MLPMixer(c.mix\_mlp.ffn)

#

67returnconf

#

70defmain():

#

අත්හදාබැලීම සාදන්න

72experiment.create(name="mlp\_mixer\_mlm")

#

වින්යාසසාදන්න

74conf=Configs()

#

වින්යාසයන්අභිබවා යන්න

76experiment.configs(conf,{

#

කණ්ඩායම්ප්රමාණය

78'batch\_size':64,

#

අනුපිළිවෙලදිග 32. වේගයෙන් පුහුණු කිරීම සඳහා අපි කෙටි අනුක්රමික දිගක් භාවිතා කරමු. එසේ නොමැතිනම් එම්එල්එම් ආකෘති සදහටම පුහුණු කිරීමට ගත වේ.

81'seq\_len':32,

#

1024එපොච් සඳහා දුම්රිය.

84'epochs':1024,

#

එක් 1 යුගයකට වරක් පුහුණුව සහ වලංගු කිරීම අතර මාරු වන්න

87'inner\_iterations':1,

#

ට්රාන්ස්ෆෝමර්වින්යාසයන්

90'd\_model':128,91'transformer.ffn.d\_ff':256,92'transformer.n\_heads':8,93'transformer.n\_layers':6,94'transformer.ffn.activation':'GELU',

#

මික්සර්එම්එල්පී සැඟවුණු ස්ථර ප්රමාණය

97'mix\_mlp.d\_ff':128,

#

නෝම් ප්රශස්තකරණය භාවිතා කරන්න

100'optimizer.optimizer':'Noam',101'optimizer.learning\_rate':1.,102})

#

ඉතිරිකිරීම සහ පැටවීම සඳහා ආකෘති සකසන්න

105experiment.add\_pytorch\_models({'model':conf.model})

#

අත්හදාබැලීම ආරම්භ කරන්න

108withexperiment.start():

#

පුහුණුධාවනය

110conf.run()

#

114if\_\_name\_\_=='\_\_main\_\_':115main()

Trending Research Paperslabml.ai