Back to Catboost

README

library/cpp/langs/README.md

1.2.101.5 KB
Original Source

Здесь описаны константы для языков и письменностей (скриптов в терминах Unicode).

В терминах этих констант языков работают документная и запросная распознавалки языка.

Имеется набор функций для преобразования констант в двухбуквенный или трехбуквенный код и обратного получения константы по строке с учетом синонимов. Есть функции для определения письменности по языку и по символу).

В списке констант представлены не все языки и письменности, а лишь те, которые представляли интерес для поиска Яндекса и машинного перевода. Имеется несколько псевдоязыков типа LANG_UZB_CYR или LANG_KAZ_LAT.