Back to Annotated Deep Learning Paper Implementations

සාපේක්ෂදුර (ROPER) අත්හදා බැලීම සහිත රොටරි ස්ථානීය කාවැද්දීම්

docs/si/transformers/rope/value_pe/arithmetic_experiment.html

latest4.3 KB
Original Source

hometransformersropevalue_pe

View code on Github

#

සාපේක්ෂදුර (ROPER) අත්හදා බැලීම සහිත රොටරි ස්ථානීය කාවැද්දීම්

11fromlabmlimportexperiment12fromlabml.configsimportcalculate13fromlabml\_nn.experiments.arithmetic\_datasetimportArithmeticAutoregression14fromlabml\_nn.transformersimportTransformerConfigs15fromlabml\_nn.transformers.rope.experimentimportConfigsasRoPEConfigs

#

අපි කඹය අත්හදා උරුම කර අංක ගණිතමය එකතු කිරීමේ කාර්යය සඳහා එය භාවිතා කරමු.

අපිපහත සාපේක්ෂ දුර (ROPER) සමග රොටරි ස්ථානීය කාවැද්දීම් භාවිතා කිරීමට අවධානය වෙනස් කිරීමට විකල්පය එකතු කරන්න.

18classConfigs(RoPEConfigs,ArithmeticAutoregression):

#

26pass

#

අවධානයයොමු කිරීමේදී සාපේක්ෂ දුර (ROPER) සහිත රොටරි ස්ථානීය කාවැද්දීම් භාවිතා කරන්න.

29def\_rotary\_value\_pe\_mha(c:TransformerConfigs):

#

33fromlabml\_nn.transformers.rope.value\_peimportRotaryValuePEMultiHeadAttention34returnRotaryValuePEMultiHeadAttention(c.n\_heads,c.d\_model,1.,1.)

#

වින්යාසවිකල්ප

38calculate(TransformerConfigs.encoder\_attn,'rotary\_value',\_rotary\_value\_pe\_mha)39calculate(TransformerConfigs.decoder\_attn,'rotary\_value',\_rotary\_value\_pe\_mha)40calculate(TransformerConfigs.decoder\_mem\_attn,'rotary\_value',\_rotary\_value\_pe\_mha)

#

43defmain():

#

අත්හදාබැලීම සාදන්න

45experiment.create(name="roper\_addition",comment="rotary value 7",writers={'screen','labml'})

#

වින්යාසසාදන්න

47conf=Configs()

#

වින්යාසයන්අභිබවා යන්න

49experiment.configs(conf,{50'max\_digits':7,

#

ස්ථාවරස්ථානීය කාවැද්දීම් නොමැත

53'transformer.src\_embed':'no\_pos',54'transformer.tgt\_embed':'no\_pos',

#

ROPERඅවධානය සහිත එන්කෝඩරය

57'transformer.encoder\_attn':'rotary\_value',

#

කඹයඅවධානය සහිත එන්කෝඩරය 'transformer.encoder_attn': 'භ්රමණය',

#

62'model':'rotary\_pe\_transformer',

#

කසන්දර්භය ප්රමාණය භාවිතා 256

65'seq\_len':512,

#

32වයස අවුරුදු සඳහා දුම්රිය

67'epochs':20,

#

කණ්ඩායම්ප්රමාණය 4

69'batch\_size':16,

#

ආදර්ශප්රමාණය

72'd\_model':128,73'transformer.ffn.d\_ff':512,74'transformer.n\_heads':4,75'transformer.dropout':0.0,

#

ආදම් ප්රශස්තකරණය භාවිතා

78'optimizer.optimizer':'Adam',79'optimizer.learning\_rate':2.5e-4,80})

#

ඉතිරිකිරීම සහ පැටවීම සඳහා ආකෘති සකසන්න

83experiment.add\_pytorch\_models({'model':conf.model})

#

අත්හදාබැලීම ආරම්භ කරන්න

86withexperiment.start():

#

පුහුණුධාවනය

88conf.run()

#

92if\_\_name\_\_=='\_\_main\_\_':93main()

Trending Research Paperslabml.ai