[View code on Github](https://github.com/labmlai/annotated_deep_learning_paper_implementations/tree/master/labml_nn/neox/utils/ init.py)

උපයෝගිතාසහ උදව්කරුවන්

15importtyping16fromtypingimportList,Optional1718importtorch1920fromlabmlimportlogger21fromlabml.loggerimportText22fromlabml\_nn.neox.tokenizerimportget\_tokenizer2324iftyping.TYPE\_CHECKING:25fromtokenizersimportTokenizer

ටෝකනයිසර්සිංගල්ටන්

28\_TOKENIZER:Optional['Tokenizer']=None

ටෝකන්හැඳුනුම්පත් ලබා ගන්න

text ටෝකනයිස් කිරීමේ පා text ය වේ

ටෝකන්හැඳුනුම්පත්_ආපසු ලබා දෙයි_

31defget\_tokens(text:str)-\>List[int]:

38global\_TOKENIZER39if\_TOKENIZERisNone:40\_TOKENIZER=get\_tokenizer()41return\_TOKENIZER.encode\_batch([text])[0].ids

ආදර්ශනිමැවුම් වලින් ටෝකන මුද්රණය කරන්න

ලස්සනමුද්රණ මඟින් ආකෘතියේ (ය) සිට පැති ප්රතිදානයන් ඔස්සේ ටෝකන ඉලක්ක කරයි.

ids ඉලක්කගත ටෝකන් හැඳුනුම් වේ
xs ආකෘතිය (ය) ප්රතිදානයන් වේ

44defprint\_token\_outputs(ids:List[int],\*xs:torch.Tensor):

53ids=ids+[-1]54xs=[[-1]+x[0].max(dim=-1)[1].tolist()forxinxs]5556print\_tokens(ids,xs)

ටෝකනමුද්රණය කරන්න

සංසන්දනයසඳහා ටෝකන මුද්රණය කරන්න

target ඉලක්කගත ටෝකන් හැඳුනුම් වේ
others ආකෘතියෙන් නියැදි ප්රතිදානයන් (ය)

59defprint\_tokens(target:List[int],others:List[List[int]]):

බරටෝකනයිසර්

70global\_TOKENIZER71if\_TOKENIZERisNone:72\_TOKENIZER=get\_tokenizer()

ටෝකනනූල් ලැයිස්තුවට පරිවර්තනය කරන්න

75text=[]76foriinrange(len(target)):77tokens=[\_TOKENIZER.decode([target[i]])iftarget[i]!=-1else'---']78forjinrange(len(others)):79tokens.append(\_TOKENIZER.decode([others[j][i]])ifothers[j][i]!=-1else'---')8081text.append(tokens)

සංඛ්යාන

84correct=[0for\_inothers]85total=0

ටෝකනහරහා නැවත කරන්න

88foriinrange(len(target)):89parts=[(f'{i}: ',Text.meta)]90parts+=[('"',Text.subtle),(text[i][0],Text.subtle),('"',Text.subtle),'\t']

හිස්ඉලක්කය

93iftarget[i]==-1:94forjinrange(len(others)):95parts+=[('"',Text.subtle),(text[i][j+1],Text.subtle),('"',Text.subtle),'\t']9697logger.log(parts)98continue

ටෝකනගණන

101total+=1

වෙනත්ප්රතිදානයන්

104forjinrange(len(others)):105correct[j]+=1ifothers[j][i]==target[i]else0106107parts+=[('"',Text.subtle),108(text[i][j+1],Text.successifothers[j][i]==target[i]elseText.danger),109('"',Text.subtle),'\t']110111logger.log(parts)

සංඛ්යාන

114parts=[(f'{total}',Text.highlight),'\t']115forjinrange(len(others)):116parts+=[(f'{correct[j]}',Text.value),'\t']117logger.log(parts)

ශේෂස්ථර

බෙදන්න n_chunks . n_layers නල මාර්ග සමාන්තර පුහුණුව සඳහා මෙය භාවිතා වේ.

n_layers ස්ථර ගණන වේ
n_chunks කුට්ටි ගණන වේ

ප්රතිලාභ එක් එක් කුට්ටිය සඳහා ස්ථර ගණන සහිත ලැයිස්තුවක් ආපසු ලබා දෙයි

120defbalance\_layers\_simple(n\_layers:int,n\_chunks:int):

130balance=[]131foriinrange(n\_chunks):132balance.append((n\_layers-sum(balance))//(n\_chunks-i))133134returnlist(reversed(balance))

Trending Research Papers labml.ai