එම්එල්පී මික්සර් අත්හදා බැලීම

මෙය එම්එල්පී මික්සර් ආකෘතියක්පුහුණු කිරීම සඳහා කරන ලද පයිටෝර්ච් අත්හදා බැලීමකි.

12fromlabmlimportexperiment13fromlabml.configsimportoption14fromlabml\_nn.transformersimportTransformerConfigs15fromlabml\_nn.transformers.configsimportFeedForwardConfigs16fromlabml\_nn.transformers.mlm.experimentimportTransformerMLM,ConfigsasMLMConfigs

වින්යාසකිරීම්

මැස්ඩ් භාෂා ආකෘති සඳහා අත්හදා බැලීමක් නිර්වචනය කරන MLMConfigs ස්ථානයෙන් මෙය උරුම වේ.

19classConfigs(MLMConfigs):

MLPසඳහා වින්යාසගත කළ හැකි පෝෂක-ඉදිරි ජාලය

29mix\_mlp:FeedForwardConfigs

මිශ්රMLP වින්යාසයන්

32@option(Configs.mix\_mlp)33def\_mix\_mlp\_configs(c:Configs):

38conf=FeedForwardConfigs()

එම්එල්පීහි ප්රමාණය අනුක්රමික දිග වේ, මන්ද එය ටෝකන හරහා යොදන බැවිනි

40conf.d\_model=c.seq\_len

කඩදාසි GELU සක්රිය කිරීමට යෝජනා කරයි

42conf.activation='GELU'

45returnconf

ට්රාන්ස්ෆෝමර්වින්යාසයන්

48@option(Configs.transformer)49def\_transformer\_configs(c:Configs):

අපගේ වින්යාසගත කළ හැකි ට්රාන්ස්ෆෝමර් ක්රියාත්මක කිරීම භාවිතා කරමු

56conf=TransformerConfigs()

කාවැද්දීම්සහ පිවිසුම් උත්පාදනය සඳහා වචන මාලාව ප්රමාණ සකසන්න

58conf.n\_src\_vocab=c.n\_tokens59conf.n\_tgt\_vocab=c.n\_tokens

කාවැද්දීමප්රමාණය

61conf.d\_model=c.d\_model

අවධානයමොඩියුලය MLPMixer වෙත වෙනස් කරන්න

63fromlabml\_nn.transformers.mlp\_mixerimportMLPMixer64conf.encoder\_attn=MLPMixer(c.mix\_mlp.ffn)

67returnconf

70defmain():

අත්හදාබැලීම සාදන්න

72experiment.create(name="mlp\_mixer\_mlm")

වින්යාසසාදන්න

74conf=Configs()

වින්යාසයන්අභිබවා යන්න

76experiment.configs(conf,{

කණ්ඩායම්ප්රමාණය

78'batch\_size':64,

අනුපිළිවෙලදිග 32. වේගයෙන් පුහුණු කිරීම සඳහා අපි කෙටි අනුක්රමික දිගක් භාවිතා කරමු. එසේ නොමැතිනම් එම්එල්එම් ආකෘති සදහටම පුහුණු කිරීමට ගත වේ.

81'seq\_len':32,

1024එපොච් සඳහා දුම්රිය.

84'epochs':1024,

එක් 1 යුගයකට වරක් පුහුණුව සහ වලංගු කිරීම අතර මාරු වන්න

87'inner\_iterations':1,

ට්රාන්ස්ෆෝමර්වින්යාසයන්

90'd\_model':128,91'transformer.ffn.d\_ff':256,92'transformer.n\_heads':8,93'transformer.n\_layers':6,94'transformer.ffn.activation':'GELU',

මික්සර්එම්එල්පී සැඟවුණු ස්ථර ප්රමාණය

97'mix\_mlp.d\_ff':128,

නෝම් ප්රශස්තකරණය භාවිතා කරන්න

100'optimizer.optimizer':'Noam',101'optimizer.learning\_rate':1.,102})

ඉතිරිකිරීම සහ පැටවීම සඳහා ආකෘති සකසන්න

105experiment.add\_pytorch\_models({'model':conf.model})

අත්හදාබැලීම ආරම්භ කරන්න

108withexperiment.start():

පුහුණුධාවනය

110conf.run()

114if\_\_name\_\_=='\_\_main\_\_':115main()

Trending Research Papers labml.ai