Как починить онлайн-переводчик, если ты ребёнок

Как починить онлайн-переводчик, если ты ребёнок

Чем занимались на лингвистической смене школы «Сириус»
3 427

Как починить онлайн-переводчик, если ты ребёнок

Чем занимались на лингвистической смене школы «Сириус»
3 427

В октябре в образовательном центре «Сириус» работала смена «Лингвистика и русский язык». 149 школьников решали олимпиадные задачи, ходили на лекции, мастер-классы, семинары, дискутировали и занимались наукой. Трое ребят рассказали нам, что интересного о языке можно узнать за месяц и как связаны лингвистика и математика.

Как дети ищут ошибки в переводчиках

Всех учеников поделили на группы, которые решали разные научные задачи, например изучали глаголы движения в устных и письменных текстах в проекте под названием «Пойди туда — не знаю куда» или узнавали, что такое «Корпусные методы проверки лингвистических гипотез». Одной из научных задач был «Сравнительный анализ ошибок работы современных онлайн-переводчиков». Участники анализировали ошибки под руководством Станислава Гуревича, сопредседателя оргкомитета Международной олимпиады по лингвистике. Работа строилась так: ребята изучали, как работают разные системы онлайн-перевода, комплексно искали ошибки, задавая разные запросы и изучая переводы.

  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
Смена «Лингвистика и русский язык» в образовательном центре «Сириус»

После обработки массива ошибок они строили гипотезы, как избежать подобных неточностей и явных ляпов. Анализировали Google Translate, Reverso Context, Promt и другие. Одна из участниц семинара обнаружила проблему перевода рода с английского на русский: в английском языке нет рода, а в русском он обязателен. Если форма слова предполагает многозначность или встречается с омонимией (совпадающие по написанию слова с разными значениями — кисть (винограда или руки), система может раз за разом ошибаться. Коллектив из 24 человек был разделён по знанию иностранных языков на пять групп: русский — английский, русский — испанский, русский — немецкий, русский — китайский и русский — французский. Сложилось 10 пар, так как использовали и обратный перевод с иностранного на русский язык.

Это здорово, когда у подростков есть возможность месяц вариться в котле исследовательско-научной жизни

Почему лингвисты изучают онлайн-переводчики? По словам Станислава Гуревича, машинный перевод — совместная работа. Сегодня лингвист, который занимается переводом, должен быть и программистом. Он должен уметь при необходимости объяснить разработчику суть морфологии, грамматики, всей системы изменений в языке — это долгий и кропотливый труд. Современные талантливые и мотивированные школьники и студенты учатся быстро — много открытой информации, которая доступна онлайн.

Что такое «Сириус»

В образовательном центре «‎Сириус» круглый год идут несколько программ по развитию способностей школьников. Участниками смен могут стать ученики 8-го, 9-го и 10-го классов, прошедшие конкурсный отбор и подавшие заявку. Среди программ —тематические смены по физике, математике и программированию, алгоритмам, химии, информатике и другим дисциплинам.


«Почувствовать себя взрослым лингвистом»

10-классница Соня Бюргановская, Санкт-Петербург, 642-я гимназия,
16 лет

Призёр традиционной олимпиады по лингвистике для школьников, победитель регионального этапа Всероссийской олимпиады по русскому, призёр регионального этапа по французскому

«‎Сириус» — первый лагерь в моей жизни без адаптационного периода, когда я смогла сразу влиться в работу. Это был месяц вне дома, я впервые уехала на такой долгий срок и, конечно, нервничала. Но мы работали с лучшими лингвистами, это потрясающий опыт. Все участники программы — необыкновенные, я узнала много талантливых ребят из разных городов.

Меня заинтересовали онлайн-переводчики. Я планирую заниматься компьютерной лингвистикой и увлекаюсь программированием, так что тему выбрала быстро. Работа началась с процесса сбора данных и их анализа. Мы пытались обнаружить, где система ошибается и почему. Объяснять ошибки было трудно, как и искать причину всех сбоев: на большом объёме данных терялась логика и понять, с чем конкретно связано возникновение той или иной ошибки, казалось невозможным. Но мы справились.

Это была моя первая исследовательская работа, я почувствовала себя «‎взрослым лингвистом»: поняла, как проводить исследования, с какими трудностями можно столкнуться и как их избегать.


«Я сделал сайт для школьников с упражнениями по орфографии»

11-классник Арсений Анисимов, Москва, школа № 2101, 17 лет

Призёр Всероссийской олимпиады по русскому языку, призёр олимпиады «Высшая проба», «Турнира Ломоносова» и Московского городского конкурса проектных и исследовательских работ (МГК)

Об октябрьской программе я узнал на прошлой лингвистической смене, в декабре 2018-го. На ней я познакомился с крутыми людьми, которым нравится лингвистика, и понял, что это область, которой я сам хочу заниматься. Декабрь помог подготовиться к Всероссийской олимпиаде по русскому и к московским олимпиадам — я хорошо выступил и прошёл отбор в октябре.

Что мне нравится на смене? Общение с людьми! С учениками, студентами, преподавателями. Исследования тоже были интересные: я занимался глаголами движения. Есть очень похожие пары вроде «нестись» и «носиться». Для иностранцев, изучающих русский, эта тема одна из самых сложных. Но почему мы сами никогда не перепутаем эти два глагола? Почему мы всегда не задумываясь можем определить неправильное употребление, а объяснить, в чём различие, не можем? В исследовании мы отвечали на эти вопросы. И закономерности, которые мы выявили, помогли нам составить упражнения для иностранцев. Конечно, за неделю мы не успели обработать все данные, поэтому сможем продолжать исследование.

Кроме лингвистики, мне нравятся математика и программирование. Сейчас, к примеру, востребованы знания по обработке естественного языка с помощью компьютерных программ. А вообще, я думаю, лингвистику можно связать с любой темой.

Я увлекаюсь футболом, и какие-то интересные факты узнаю из этой области. Например, о происхождении слова «болельщик», которое раньше употребляли в ироничном контексте

Заниматься лингвистикой я начал в восьмом классе. До этого мне нравился русский, но я не рассматривал его для себя как направление. Но на Московской математической олимпиаде мне подарили брошюру с задачами Андрея Зализняка, я попробовал их решить и увидел, что они очень похожи на математические.

  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
Смена «Лингвистика и русский язык» в образовательном центре «Сириус»

Я сделал сайт Ruscript, где собраны упражнения по орфографии для школьников. Эту идею мне предложила учительница русского. Но оказалось, что сайт интересен и взрослым, поэтому я добавил целый раздел с названием «Не про школу».

Когда я начал готовиться к олимпиадам, то делал тесты, похожие на задания Всероса. Например, угадать этимологически родственное слово. Такие упражнения скорее не на знание чего-либо или умение строго обосновать ответ, а на языковое чутьё.

Мне кажется, сочинение своих заданий хорошо помогает подготовиться к олимпиадам. Кроме этого, я поставил себе цель — взять призовое место на Традиционной олимпиаде по лингвистике, и готовлюсь сейчас к ней.


«Лингвистика захватывающе интересна»

9-классник Артём Борисов, Москва, лицей «Вторая школа», 15 лет

Победитель Всероссийской олимпиады по русскому языку и участник Всероссийской олимпиады по математике, дипломант 1-й степени Традиционной олимпиады по лингвистике

Люди, услышав слово «лингвистика», думают о гуманитарной науке, которая полностью противоположна математике. Я считаю, что лингвистика гораздо ближе к точным наукам, чем многие думают, поэтому многие математики преуспевают в лингвистике!

Лингвистика захватывающе интересна: мне очень понравилось изучать особенности строения отдельных языков, в частности русского, и причины возникновения этих особенностей, сравнивать языки между собой. Я выбрал исследовательский проект, целью которого было изучить зависимость морфологического маркирования прямого дополнения от порядка слов в предложении.

  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
  • Смена «Лингвистика и русский язык» в образовательном центре «Сириус»
Смена «Лингвистика и русский язык» в образовательном центре «Сириус»

Это означает, что дополнение можно отличить от подлежащего: например, в предложении «Отец любит сына» маркирование есть, а в предложении «Мать любит дочь» — нет. Мы сформулировали гипотезу и проверили её методами корпусной лингвистики — проанализировали корпус с большим количеством предложений.

Помимо проекта, очень крутыми и полезными для подготовки к олимпиадам были задачные семинары; жаль, что на них была выделена только одна неделя. Сейчас я планирую заниматься тем же, чем и раньше — лингвистикой и математикой, — и решать, на какое направление буду поступать после школы и чем заниматься дальше.

Чтобы сообщить об ошибке, выделите текст и нажмите Ctrl+Enter
К комментариям
Подписаться
Комментариев пока нет
Больше статей