Новосибирская студентка разработала приложение для перевода и анализа тибетских текстов
Новости17 июля, 10:39

Новосибирская студентка разработала приложение для перевода и анализа тибетских текстов

Студентка Новосибирского государственного университета Анна Мурашкина создала приложение для распознавания, оцифровки и анализа классических тибетских текстов. Об этом РИА Новости рассказали в пресс-службе НГУ.

В вузе заявили, что разработка будет востребована исследователями, архивными работниками и библиотекарями и поспособствует сохранению тибетского текстового наследия, являющегося, в том числе, частью культурного достояния бурятского народа.

Анна Мурашкина изучает направление «Фундаментальная и прикладная лингвистика» и работает в Институте вычислительной математики и математической геофизики Сибирского отделения РАН. Созданная ею система ориентирована на старопечатные документы на основе тибетского слогового письма, восходящего к древнеиндийскому письму брахми. В своей работе студентка использовала изображения страниц классических тибетских текстов XVIII–XX веко, найденные в архивах.

«Со временем, под воздействием природных и антропогенных факторов, бумажные носители подвержены физическому разрушению, что ведет к утрате бесценной информации и ограничивает доступ к этим уникальным материалам. В настоящее время в Тибетском фонде Института монголоведения, буддологии и тибетологии СО РАН хранится до 70 тысяч единиц хроники, которые рискуют быть утерянными. Один из наиболее надежных способов сохранения и систематизации исторических документов — их оцифровка», — отметила исследовательница.

Мурашкина поставила себе задачу разработать более точную, чем уже существующие модель, способную распознавать символы тибетского алфавита и переводить тексты в машиночитаемый вид. Для этого она вручную оформила лингвистическую разметку строк тибетского текста и создала систему оценки качества визуального распознавания символов. Потом исследовательница сравнила результаты и выбрала модель сверхточной нейросети, на основе которой создала полный модульный алгоритм оптического распознавания символов.

fran_kie / Shutterstock / Fotodom

Как защитить ребенка от ротавируса
Комментариев пока нет
Больше статей