Онлайн-переводчики стали лучше, но все еще делают нелепые ошибки. Почему?

  • Эмма Вулкотт
  • Корреспондент Би-би-си по вопросам бизнеса

Подпишитесь на нашу рассылку ”Контекст”: она поможет вам разобраться в событиях.

Автор фото, Getty Images

Подпись к фото,

Качество машинных переводов постоянно улучшается, но ошибки все еще случаются

Приложения для перевода становятся все лучше, но до идеала еще далеко. В особенности это касается редких языков. Могут ли искусственный интеллект и нейросети исправить ситуацию?

Этим летом во время чемпионата мира по футболу в России был зафиксирован резкий рост обращений к сервису Google Translate, показывают данные компании. Болельщики пытались установить контакт с местными жителями и с фанатами из других стран.

Особенно часто они искали перевод слов «стадион» и «пиво».

  • Google объясняет перевод России как «Мордор» сбоем в алгоритмах
  • Уличные камеры по вашему лицу понимают, хороший вы человек или террорист
  • Глава «Яндекс.Переводчика» — о том, как искусственный интеллект меняет мир

Традиционные разговорники уже уходят в прошлое. Недавнее исследование Британского совета показало, что в возрастной категории «16-34» две трети респондентов, находясь в чужой языковой среде, пользуются мобильными приложениями для перевода.

Хотя такие приложения несомненно становятся совершеннее, целиком полагаться на них пока нельзя. Каждый пятый из опрошенных рассказал, что сталкивался с трудностями из-за некорректного автоматического перевода.

Особенно это актуально для носителей локальных языков. Например, валлийцы обращали внимание на то, что «взрывные работы» приложение переводит как «gweithwyr yn ffrwydro» или «рабочие взрываются».

В этом году один из пользователей Google Translate обнаружил, что если ввести в поле для перевода слово «dog» 18 раз и попросить перевести его с языка маори, то сервис выдает следующий текст: «На часах Судного дня без трех минут двенадцать. Знаки и трагические события, во времена которых мы живем, указывают, что мы приближаемся к концу света и второму пришествию Иисуса».

Почему же нелепые ошибки в переводах до сих пор встречаются, хотя на дворе эпоха суперкомпьютеров и машинного обучения?

Главная проблема заключается в том, что у слова зачастую бывает несколько значений. Омографы — слова, которые совпадают в написании, но различаются в произношении — ставят в неловкое положение не только отдыхающих на курортах, но и правительства.

Так, британский кабинет министров в прошедшем июле подготовил «белую книгу» по «брекситу» на немецком языке, в которой «отправление демократических процедур» перевели как «demokratische Übung». Дословно это можно перевести как «демократическую гимнастику».

Для просмотра этого контента вам надо включить JavaScript или использовать другой браузер

Подпись к видео,

Let it snow по-русски: какой онлайн-переводчик работает лучше?

Пропустить Подкаст и продолжить чтение.

Подкаст

Что это было?

Мы быстро, просто и понятно объясняем, что случилось, почему это важно и что будет дальше.

эпизоды

Конец истории Подкаст

Чтобы исключить такие ошибки, алгоритмы машинного обучения в приложениях для перевода постоянно дорабатываются. Они сверяются с предыдущими запросами, принимают во внимание контекст, в котором то или иное слово ранее использовалось, и подбирают наиболее уместное его значение.

В этом году компания Microsoft объявила, что создала искусственный интеллект, который способен переводить не хуже человека. Робот перевел серию публикаций из китайской прессы на английский, и группа независимых экспертов пришла к выводу, что качество перевода было сравнимо с переводом тех же текстов, выполненным двумя профессиональными переводчиками.

В компании говорили, что добиться этого удалось за счет глубоких нейронных сетей и статистического машинного обучения.

Сначала происходит грубый перевод, который затем шлифуется путем повторения разных вариантов, их сравнения и, в конечном итоге, обучения. Схожим образом переводу учатся и люди.

Разработанный компанией инструмент для перевода имеет четкое представление о грамматической структуре предложения в каждом языке, которое сложилось из массива выполненных ранее переводов.

Машинный перевод, качество которого сравнимо с качеством перевода, выполненным человеком, кажется довольно впечатляющим достижением. Но даже в Microsoft признают, что перевод новостных статей — не то же самое, что перевод живого разговора, которому свойственны идиомы, акценты и диалектические особенности.

В прошлом году Google выпустила наушники-вкладыши Pixel Buds, которые умеют в режиме реального времени переводить 40 языков. Качество их переводов при этом вызывает вопросы. Похожий продукт — Pilot Translating Earpiece — с поддержкой 15 языков разрабатывает нью-йоркский стартап Waverly Labs.

Автор фото, Waverly Labs

Подпись к фото,

Устройство для перевода Pilot Translating Earpiece

Но когда приходится осуществлять перевод между двумя языками, у которых нет большой базы взаимных переводов, к которой можно было бы обращаться (например, с сингальского на пушту), задача становится особенно сложной.

Можно сначала перевести с сингальского на английский, а полученный результат — на пушту, но очевидно, что при таком подходе будут появляться ошибки и неточности.

Описанный выше случай с языком маори и апокалиптическими предсказаниями объясняется в том числе избыточной зависимостью машинных переводов от текстов, которые существуют на обоих интересующих пользователя языках. В случае с английским и маори это была Библия.

«Если вы закладываете в модель для перевода предложения из древнего манускрипта и пытаетесь перевести разговор двух современных людей, модель столкнется со сложностями, потому что и содержание, и стилистика современной разговорной речи очень сильно отличается от того, что можно найти в древних манускриптах», — объясняет разработчик искусственного интеллекта из Facebook Гийом Лампл.

  • Компания Skype запустила синхронный перевод голосовых звонков
  • Как вычислить самую грустную песню на свете
  • За пределом понимания: можно ли доверять искусственному интеллекту?

Проект, над которым Лампл сейчас работает вместе с командой исследователей из Facebook и Сорбонны, может предложить решение этой проблемы.

Он использует в качестве текстовой базы по несколько сотен тысяч предложений на каждом языке, но не использует предложения, переведенные напрямую.

Эта система принимает во внимание то, как одни слова сочетаются с другими. Например, в английском слова «кот» и «пушистый» используются вместе так же, как в испанском. Система обучается подобным подстановкам слов, и это позволяет ей делать более точные переводы. Затем используются те же техники, что и в случае с переводчиком Microsoft.

Для просмотра этого контента вам надо включить JavaScript или использовать другой браузер

Подпись к видео,

Кто переводит лучше — «Яндекс» или Google?

По словам Лампла, при помощи такой методики можно не только переводить живые языки, но и расшифровывать мертвые и потерянные.

«Но есть серьезная проблема — недостаток предложений, составленных на этих языках. Например, Манускрипт Войнича (документ XV века, написанный неизвестным алфавитом на неизвестном языке. — Би-би-си) состоит всего лишь из нескольких сотен страниц. Этого слишком мало для нашей модели», — говорит он.

При наличии достаточного объема текста система должна справиться с расшифровкой мертвого языка, полагает Лампл.

Эта перспектива открывает и многие другие удивительные возможности. «Мы можем научиться общаться с инопланетянами, — рассуждает Лампл. — Но для начала им придется много говорить, причем на темы, схожие с теми, на которые обычно говорим мы».

translate-english-to-russian-yandex — Google Suche

AlleBücherVideosNewsBilderMapsShopping

Suchoptionen

English-Russian online translator and dictionary

translate.yandex.com › translator › en-ru

Free online translation from English into Russian and back, English-Russian dictionary with transcription, pronunciation, and examples of usage. Yandex.

Online translation of documents into Russian and other languages

translate.yandex.com › doc

Online translation of documents from English, German, French, Spanish, Polish, Turkish, and other languages into Russian and back.

yandex – translation into Russian from English

www.online-translator.com › translation › english-russian › yandex

translation of «yandex» from English into Russian by PROMT, Yandex . money, transcription, pronunciation, translation examples, grammar, online translator …

Yandex Translate — Apps on Google Play

play.google.com › store › apps › details › id=ru.yan…

Bewertung 4,5

(217.238) · Kostenlos · Android

Translate between any pair of the 100 languages when you’re online. • Translate from French, German, Italian, Russian, Spanish, or Turkish to English while …

Yandex.Translate: 95 languages on the App Store

apps.apple.com › app › yandex-translate-95-langua…

Bewertung 4,7

(3.151) · Kostenlos · iOS

Yandex.Translate. Free translator that can work offline and translate text from photos. • Translate between any pair of the 90 languages when you’re online.

How good is Yandex.Translate for Russian to English … — Quora

www.quora.com › How-good-is-Yandex-Translate-for-Russian-to-English-…

When I want to translate something quickly I use google.translate. But in most cases I use словарь Мультитран that gives you all possible meanings of the …

Ähnliche Fragen

What is the most accurate English to Russian translator?

What does da da mean in Russian?

What does Basta mean in Russian?

Is Google Translate or Yandex better?

Yandex Translate vs Google Translate: Which one Should You …

translatepress.com › Blog

18.07.2022 · If you want to translate English into Russian, Turkish, or other eastern European languages, your best bet is Yandex. For most other languages, …

How To Use Yandex In English — HapBlog.com

www.hapblog.com › how-to-use-yandex-in-english

Yandex Translate is a Russian-based online translator that can translate Russian to English, as well as many other languages. The site is easy to use and …

Yandex introduces automatic English-Russian video dubbing feature

www.ewdn.com › 2021/09/27 › yandex-introduces-…

27.09.2021 · You’ll now be able to watch videos on YouTube and almost any other service with the aid of automatic English-Russian translation dubbing.

Yandex Translate Alternative

doctranslator.com › yandex-translate-alternative

Bewertung 4,9

(219)

Yandex Translate can really help you with most of your translation needs. … French, Italian, Japanese, Portuguese, Russian, Turkish, Chinese and more.

Ähnliche Suchanfragen

Google translate english to russian

Translate Yandex com deutsch

Yandex translator

Yandex Translate App

Best Russian translator

Yandex translate image

translate.yandex.соm emoji

english-russian dictionary

Что такое Google Translate? — чайники

Автор: Джеймс Т. Кейнс и

Обновлено: 26-03-2016

Google Blogger для чайников

Исследуйте книгу Купить на Amazon

Если вам нужно перевести слова или фразу с одного языка на другой, Google Translate может быть полезным инструментом. Это не словарь с английского на какой-то другой язык, который содержит слова одного языка и их соответствующие переводы. Вместо этого Google Translate берет введенное вами слово или фразу, а затем ищет в Интернете лучший перевод среди миллиардов профессионально переведенных документов. Почти мгновенно он предоставляет вам результат поиска в виде перевода.

Как и другие инструменты онлайн-перевода, Google Translate далек от совершенства. У него хорошая репутация точности, но он допускает ошибки — или, скорее, он возвращает неточные результаты поиска перевода. Поэтому вы должны использовать его с осторожностью. Вероятно, он отлично сработает в повседневных ситуациях, например, при заказе ужина на другом языке в ресторане, но если вы полагаетесь на него для официального делового общения, будьте очень осторожны.

Чтобы выполнить базовый перевод с помощью Google Translate на компьютере, выполните следующие действия:

  1. Откройте веб-браузер и перейдите на сайт translate.google.com. Вам не нужна учетная запись Google, чтобы получить к ней доступ, потому что это бесплатно для всех.

  2. Слева выберите язык, с которого вы переводите. Он показывает вам кнопки для трех популярных языков, или вы можете выбрать язык из раскрывающегося меню.

  3. В текстовом поле слева введите слово или фразу, которую хотите перевести.

  4. Справа выберите язык, на который вы хотите перевести слово или фразу.

  5. Нажмите «Перевести».

Перевод появится в текстовом поле справа (см. рис. 1). Значки в нижней части текстового поля позволяют выполнять следующие действия со словом или фразой:

.

  • Щелкните значок звездочки, чтобы добавить слово или фразу в свой личный разговорник. Для этого вы должны войти в свою учетную запись Google.

  • Щелкните значок «Выбрать все», чтобы скопировать и вставить слово или фразу в другой документ.

  • Щелкните значок динамика, чтобы прослушать произношение слова или фразы на этом языке.

Чтобы увидеть другие переводы того же слова или фразы, все, что вам нужно сделать, это выбрать другой язык справа.

Google Translate не заменяет свободное владение языком. Если вы все еще хотите научиться говорить по-испански, по-французски или по-китайски, вам все равно придется посещать языковые курсы, усердно учиться и практиковаться. Но это может быть полезным инструментом, если вам нужно быстро перевести слово или фразу, особенно когда вы в пути.

Рисунок 1: Google Translate в действии.

Эту статью можно найти в категории:

  • Google ,

аудио — Получение произношения слова с помощью Google Translate API

спросил

Изменено
3 года, 11 месяцев назад

Просмотрено
19k раз

Часть Google Cloud Collective

Я пытаюсь сохранить произношение французского слова в файл . wav или .mp3.

Мне было интересно, есть ли что-нибудь в Google Translate API (поскольку у него есть функция произношения), что позволяет мне достичь этой цели. Другие библиотеки тоже будут работать.

  • аудио
  • преобразование текста в речь
  • гугл-переводчик
  • фонетика

2

С тех пор, как был задан этот вопрос, стало намного сложнее «вычищать» MP3 из Google Translate, но Google (наконец-то) настроил TTS API. Интересно, что это оплачивается вводимыми символами, причем первые 1 или 4 миллиона входных символов в месяц являются бесплатными (в зависимости от того, используете ли вы WaveNet или голоса старой школы)

В настоящее время для этого используется gcloud в командной строке (вместо создания это в приложение), вы бы сделали примерно следующее (я перефразирую быстрый старт TTS). Вам нужно base64 , curl , gcloud и jq для этого пошагового руководства.

  1. Создайте проект в консоли GCP или запустите что-то вроде gcloud Projects Create example-throwaway-tts
  2. Включить биллинг для проекта. Сделайте это, даже если вы не собираетесь превышать квоту на халяву.
  3. Используйте консоль GCP, чтобы включить TTS API для только что настроенного проекта.
  4. Снова используйте консоль , на этот раз , чтобы создать новую учетную запись службы.
    • Используйте любое старое имя
    • Не придавайте этому значения. Вы получите предупреждение. Это нормально.
    • Выберите тип ключа JSON, если он еще не выбран
    • Нажмите Создать
    • Удерживайте файл JSON, который загружает ваш браузер
  5. Установите переменную среды так, чтобы она указывала на этот файл, например. экспорт GOOGLE_APPLICATION_CREDENTIALS="~/Downloads/service-account-file.json"
  6. Получите соответствующий токен доступа:
    1. Скажите gcloud , чтобы использовать этот новый проект: gcloud config set project example-throwaway-tts
    2. Установить переменную TTS_ACCESS_TOKEN=gcloud auth application-default print-access-token
  7. Соберите запрос JSON. Я приведу пример ниже. В этом примере мы назовем его request.json
  8. .

  9. Наконец, запустите следующие

     завиток \
    -H "Авторизация: носитель" $TTS_ACCESS_TOKEN \
    -H "Тип содержимого: приложение/json; кодировка = utf-8" \
    --data-raw @request.json \
    "https://texttospeech.googleapis.com/v1/text:синтезировать" \
    | jq '.audioContent' \
    | base64 --decode > very_simple_example.mp3
     

Что это делает, так это

  • аутентификация с использованием токена доступа по умолчанию для проекта, который вы настроили
  • установите тип содержимого в JSON (чтобы jq мог извлечь полезную нагрузку)
  • использовать request.json в качестве данных для отправки с использованием curl флаг --data-raw
  • извлечь значение audioContent из ответа
  • base64 декодировать это содержимое
  • сохранить весь этот бардак в формате MP3

Далее следует содержимое request. json . Вы можете увидеть, куда вставить нужный текст, настроить голос или изменить формат вывода через audioConfig:

 {
  'вход':{
    'текст': 'очень простой пример'
  },
  'голос':{
    'languageCode':'en-gb',
    'имя':'en-GB-Standard-A',
    'ssmlGender':'ЖЕНСКИЙ'
  },
  'аудиоконфиг': {
      'аудиокодирование': 'MP3'
  }
}
 

Исходный ответ

Как намекает Hugolpz, если вы знаете нужное слово или фразу (через предыдущий вызов Translate API), вы можете получить MP3-файлы по URL-адресу, например http://translate.google.com/translate_tts? ie=UTF-8&q=Bonjour&tl=fr

Обратите внимание, что &tl=fr гарантирует, что вы получите французский язык вместо английского по умолчанию.

Вам нужно будет ограничить себя, но если вы ищете небольшое количество слов или фраз, вы должны быть в порядке.

2

Аналогичные функции предоставляет API синтеза речи (в разработке).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *