20 сентября 2020, воскресенье, 02:05
VK.comFacebookTwitterTelegramInstagramYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

30 ноября 2017, 11:31

Машинный перевод против второклассников

Каждый год в середине ноября статистику поисковых систем заполняет словосочетание «Русский медвежонок». Так называется конкурс для школьников по русскому языку и лингвистике, который в 2000 году по образцу международного конкурса по математике «Кенгуру» придумали математик из Кирова Игорь Рубанов и лингвист из Москвы Елена Муравенко. Конкурс с тех пор стал очень популярным — в нём ежегодно участвуют больше двух миллионов школьников в России и других странах. Победа в «Медвежонке», в отличие от школьных олимпиад, не даёт никаких льгот или привилегий. Единственная цель конкурса — показать детям, что за скучным предметом «русский язык» может скрываться интересная деятельность: от решения головоломок или внезапного обнаружения древнего родства внешне непохожих слов до открытия языковых законов, которые изучает наука лингвистика.

Например, в этом году восьмиклассники получили возможность за две минуты немного разобраться в грамматике итальянского языка и обнаружить неточность в переводе названия оперы Моцарта:

Даны несколько слов и словосочетаний на итальянском языке и их перевод на русский: tutto ‘весь’, belli ragazzi ‘красивые юноши’, belle ragazze ‘красивые девушки’, famosi poeti ‘знаменитые поэты’, famose italiane ‘знаменитые итальянки’. Название оперы Вольфганга Амадея Моцарта “Сosì fan tutte” буквально переводится на русский язык «Так поступают все», однако для более точной передачи смысла обычно добавляют ещё одно слово. Какое?

(А) люди; (Б) мужчины; (В) музыканты; (Г) итальянцы; (Д) женщины.

 (автор задачи — Пётр Аркадьев)

 А четвероклассники смогли открыть для себя риторические вопросы и задуматься о функциях знаков препинания:

 В XVI веке один английский издатель предложил для некоторых предложений использовать особый знак. Из пяти данных ниже вопросов учителей он подошёл бы к четырём. Определив его предназначение, выберите, для какого вопроса этот знак не подходит.

(А) А голову ты дома не забыл

(Б) Оценку вам тоже одну на двоих ставить

(В) Уроки за тебя делать Пушкин будет

(Г) Ты сделал домашнее задание

(Д) Третья парта, я вам не мешаю разговаривать

(автор задачи — Борис Иомдин)

Участник конкурса получает три десятка задач с выбором ответа (разных для разных классов), которые надо решить за два школьных урока. Конечно, предполагается, что школьники решают задачи самостоятельно. Но некоторым кажется, что вернее будет подсмотреть ответ в интернете. Вот и получается, что в день проведения конкурса запросы вроде «ответы к русскому медвежонку» выходят в топ поисковых систем.

Самым младшим участникам «Русского медвежонка» — ученикам 2-го и 3-го классов — в этом году была дана такая задача:

Вот несколько болгарских слов и их переводы на русский язык: вълк — волк, конче — жеребёнок, патка — утка, петел — петух, прасе — поросёнок, пиле — цыплёнок. Как по-болгарски будет «Русский медвежонок»?

(А) Руски медвежонок; (Б) Руско мече; (В) Руски мечок; (Г) Руски мишка; (Д) Руска мишка.

(автор задачи — Борис Иомдин)

В «Медвежонке» каждый год бывает несколько задач, посвященных не русскому, а другим языкам: в этом году, кроме итальянского и болгарского, это польский и готский. И каждый год возмущенные родители школьников пишут письма организаторам и изливают гнев на форумах:

«Почему мой сын второклассник должен знать польский или болгарский язык?»

«Почему на конкурсе ПО РУССКОМУ языку надо ПЕРЕВОДИТЬ иностранные слова? Где логика?»

«Вот проблема-то и в том как раз — олимпиада-то по РУССКОМУ языку, а не по логике. В наше время на олимпиадах по РУССКОМУ языку были совсем другие задания, не подвластные логике, а лишь только знанию правил и исключений русского языка»

 «Ну пипец, помимо русского еще польский и болгарский надо знать чтобы правильно ответить»

 «Вопрос-при чем тут польский и болгарский язык и зачем забивать этим и так прилично не по годам забитые детские головы? Когда будут "млеко, яйки, шнеле"?»

 «Хотелось бы спросить Вас всех ,кто занимается составлением задач, для чего ученикам второго класса нужны столь сомнительные задачи, на которые можно ответить только "методом тыка"»

 «Я просто понять не могу каким это все боком к русскому языку относится? Ну назвали бы тогда олимпиаду по логике или смекалке или еще как»

Многие уверены: русский язык — это не про логику, а про словарные слова, безударные гласные и запятые. А если задание школьного конкурса почему-то выходит за пределы орфографии и пунктуации, то это всё козни злонамеренных организаторов.

«Русский медвежонок» — не экзамен на знание русского или иностранных языков, а конкурс-игра с подзаголовком «Языкознание для всех». Его цель — заинтересовать школьников русским языком и лингвистикой, показать, чем похожи и чем различаются языки мира, продемонстрировать, что и второклассник может обнаружить языковую закономерность и даже перевести слова на язык, которого он не знает. Для решения задачи на болгарский язык совсем не требуется его знать — нужно лишь понимать, что русские слова жеребёнок, поросёнок, цыплёнок и медвежонок называют детёнышей животных, и увидеть, что по-болгарски все они заканчиваются одинаково (как и по-русски). Многие второклассники с этим справились.

Те, кто решил на собственную логику не рассчитывать, а поискать ответ в интернете, столкнулись с неожиданными проблемами. Современный пользователь интернета твёрдо знает: если попался текст на иностранном языке, можно легко перевести его в интернет-переводчике. Машинный перевод сейчас действительно очень активно развивается (в частности благодаря усилиям лингвистов — а многие из них в детстве успешно участвовали в лингвистических олимпиадах и конкурсах). Но всё же до сих пор онлайн-переводчики часто дают неверные или неточные результаты. Это происходит, в частности, потому, что современный машинный перевод обычно основан на статистических данных интернета, а не на анализе лексики и грамматики. А некоторые родители школьников уверены: авторы задач «Русского медвежонка» сами в языках ни бельмеса, а туда же, экзаменовать школьников.

 «Если не знаешь болгарского языка, то надежда только на переводчик, хотя как раз тут возникли небольшие трудности. Детям на конкурсе точно придётся не легко».

 «Ни один переводчик русско-болгарский не выдаёт перевод, который был бы у вас представлен в ваших вариантах ответов. Похоже, но не так. Сами, видимо, не знали и написали, как думали, примерно! Уж если вы решили использовать задание, которое может знать только тот, кто знает болгарский, и додуматься тут тоже невозможно, то хоть проявляйте больше ответственности и точности!»

 «Ни один переводчик в интернете (их там множество) не выдает точно такого перевода, как представлено у вас в ответах. То есть даже с переводчиком точно определить между вариантом Б и В не представляется возможным. Это неправильно. Обратите на это внимание составителей теста».

Словосочетание «русский медвежонок» по-русски встречается в интернете очень часто (в основном благодаря названию конкурса), а по-болгарски — редко. Вот статистических данных и не хватает, чтобы перевести это словосочетание автоматически, не обращаясь к данным русско-болгарского словаря (где даны переводы слов) и болгарской грамматики (где, в частности, указано, как по-болгарски согласуется прилагательное с существительным). Поэтому некоторые интернет-переводчики в качестве перевода русского словосочетания русский медвежонок на болгарский язык выдают словосочетания руски мечета и руската мечка. Но первое из них означает ‘русские медвежата’ (во множественном, а не в единственном числе), а второе — ‘русский медведь’ (взрослый медведь, а не детёныш), с определённым артиклем. Существует по-болгарски и словосочетание руски мечок, данное в ответе (В) — те, кто не решал задачу сам, а искал ответ в интернете, его и выбрали. Однако оно означает не ‘русский медвежонок’, а ‘русский самец медведя’. Дело в том, что по-болгарски нейтральным названием медведя является слово женского рода мечка, а не слово мужского рода мечок (примерно так же, как нейтральным названием лисы по-русски является слово женского рода лиса, а не слово мужского рода лис). Слово же мече означает ‘медвежонок’ (детёныш медведя) или ‘мишка’ (маленький или игрушечный медведь). Слово мишка, кстати, по-болгарски тоже существует, но означает ‘мышь’.

Всё это легко увидеть в словарях. Но русско-болгарский словарь в интернете найти гораздо сложнее, чем онлайн-переводчик. На это и рассчитывали составители конкурса: хочется, чтобы в нём выигрывали честные школьники, которые решают задачи сами, а не слушают подсказки или подсматривают ответы в интернете.

Многие почему-то уверены: в школьном конкурсе не могут проверять сообразительность — только знания, а логика и лингвистика никак не связаны.

 «Медвежонок — мече, а логики никакой. Вы хотели ее увидеть в "медвежонке"? Но ее и не было никогда».

 Хорошо, что второклассники об этом не знают — они могли ещё ничего не слышать ни о лингвистике, ни о логике, а задачи каждый год решают с успехом. Один школьник в своё время победил в «Русском медвежонке» и так заинтересовался лингвистикой, что недавно получил премию «Просветитель» за книгу об искусственных языках. Кстати, на эсперанто интернет-переводчики уже научились переводить, но как сказать «Русский медвежонок», тоже пока не знают. А вы узнаете, если решите задачу, составленную специально для этой заметки:

Вот несколько слов на языке эсперанто и их переводы на русский язык: alkino — лосиха, anaso — утка, kokido — цыплёнок, porkido — поросёнок, ursino — медведица, virkoko — петух. Как на эсперанто будет «Русский медвежонок»?

(А) Rusa ursa; (Б) Rusa urso; (В) Ruso urso; (Г) Ruso urkido; (Д) Rusa ursido.

Обсудите в соцсетях

«Ангара» Африка Византия Вселенная Гренландия ДНК Иерусалим КГИ Луна МГУ Марс Монголия НАСА РБК РВК РГГУ РадиоАстрон Роскосмос Роспатент Росприроднадзор Русал СМИ Сингапур Солнце Титан Юпитер акустика антибиотики античность антропогенез археология архитектура астероиды астрофизика бактерии бедность библиотеки биоинформатика биомедицина биомеханика бионика биоразнообразие биотехнологии блогосфера вакцинация викинги вирусы воспитание вулканология гаджеты генетика география геология геофизика геохимия гравитация грибы дельфины демография демократия дети динозавры животные здоровье землетрясение змеи зоопарк зрение изобретения иммунология импорт инновации интернет инфекции ислам исламизм исследования история карикатура картография католицизм кельты кибернетика киты клад климатология клонирование комары комета кометы компаративистика космос культура культурология лазер лексика лженаука лингвистика льготы мамонты математика материаловедение медицина металлургия метеориты микробиология микроорганизмы мифология млекопитающие мозг моллюски музеи насекомые наука нацпроекты неандертальцы нейробиология неолит обезьяны общество онкология открытия палеоклиматология палеолит палеонтология память папирусы паразиты перевод питание планетология погода политика право приматы природа психиатрия психоанализ психология психофизиология птицы путешествие пчелы ракета растения религиоведение рептилии робототехника рыбы сердце смертность собаки сон социология спутники старение старообрядцы стартапы статистика такси технологии тигры топливо торнадо транспорт ураган урбанистика фармакология физика физиология фольклор химия христианство цифровизация школа экзопланеты экология электрохимия эпидемии эпидемиология этология язык Александр Беглов Алексей Ананьев Дмитрий Козак Древний Египет Западная Африка Латинская Америка НПО «Энергомаш» Нобелевская премия РКК «Энергия» Российская империя Сергиев Посад альтернативная энергетика аутизм биология бозон Хиггса вымирающие виды глобальное потепление грипп защита растений инвазивные виды информационные технологии искусственный интеллект история искусства история цивилизаций исчезающие языки квантовая физика квантовые технологии климатические изменения компьютерная безопасность компьютерные технологии космический мусор криминалистика культурная антропология культурные растения междисциплинарные исследования местное самоуправление мобильные приложения научный юмор облачные технологии обучение одаренные дети педагогика персональные данные подготовка космонавтов преподавание истории продолжительность жизни происхождение человека русский язык сланцевая революция физическая антропология финансовый рынок черные дыры эволюция эволюция звезд эмбриональное развитие этнические конфликты ядерная физика Вольное историческое общество жизнь вне Земли естественные и точные науки НПО им.Лавочкина Центр им.Хруничева История человека. История институтов дело Baring Vostok Протон-М 3D Apple Big data Dragon Facebook Google GPS IBM MERS PayPal PRO SCIENCE видео ProScience Театр SpaceX Tesla Motors Wi-Fi

Редакция

Электронная почта: polit@polit.ru
Телефон: +7 929 588 33 89
Яндекс.Метрика Top.Mail.Ru
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2020.