Ложные друзья переводчика в английском языке Next Level

Каждый человек, который изучает английский язык хорошо знает, что в нем есть слова, помогающие понять смысл даже самого сложного текста. Однако стоит и помнить о тех фразах, которые могут иметь разное значение, хотя будут писаться и звучать практически идентично. Поэтому используя переводчик английского языка часто можно встретить слова-ложные друзья. Постараемся разобраться в самых часто встречающихся случаях.

Почему встречаются слова-ложные друзья переводчика?

Время не стоит на месте, а все вокруг развивается и совершенствуется. То же касается и английского языка. Под влиянием соседних стран, речь переплетается, возникают диалекты. Они непосредственно влияют на значение многих слов, что при переводе по словарям выдает ошибки. Некоторые слова на родном языке очень похожи по своему произношению, однако обозначают разные вещи. Случаются и неумышленные созвучия в разных языках, которые словарь может распознавать неверно, ведь он не связывает слова по смыслу.

Примеры ложных слов

Всего есть несколько видов ложных друзей переводчика английского в зависимости от близости значений и созвучности, наведем их примеры:

  1. 100% недруги. Это слова, которые имеют кардинально разное значение. Еще со школы дети стараются усвоить, что слово magazine не имеет ничего общего с понятием магазин, а слово family с фамилией. Таких слов существует немало, чаще всего неправильный перевод встречается в balloon – воздушный шар, а не баллон, clay – глина, а не клей, fabric – ткань, а не фабрика.
  2. Достаточно похожие. Сюда относятся слова, отличающиеся одной или несколькими буквами. Например: data – это совсем не дата, а данные; doze – обозначает дремоту, но никак не дозу; pasta – это изделия из макарон, а часто это слово принимают за пасту.
  3. Слова, совпадающие по одному из значений. К таким относятся: accent – акцент, имеет дополнительно значение – ударение; bass – бас, дополнительное значение – окунь; patient –пациент, и еще обозначает терпеливого.
  4. Слова, имеющие несколько значений. Такие относятся к одной теме, поэтому их несоответствие в предложении определить довольно сложно. Чаще всего именно в предложениях с этими словами возникает больше всего ошибок, поэтому их стоит выучить. В перечень входят: academic – учитель, а academician – академик; ammonia –аммиак, а ammonium – аммоний; biscuit –сухое печенье, а sponge cake – бисквит; stool –табуретка, а chair – стул и другие.

Что делать, чтобы не попасть на ложных друзей переводчика?

Проще понять будет на примере предложения: “Tom became an object of ridicule”. При дословном переводе окажется, что – “Том трансформировался в сумку”. А такого не может быть. Поэтому стоит поинтересоваться в словаре о значении слова ridicule. Как оказывается, оно означает насмешку. Иногда какое-то слово может не соответствовать теме о которой рассказывается в предложении.

Чтобы правильно перевести смысл, необходимо сопоставлять контекст и смотреть значение сомнительных слов в словаре. Иначе перевод иностранных текстов окажется неприятным заданием с запутанным содержанием полным неясностей. Важно понимать, что часто изначальное значение слов может оказаться ложным, ведь вариантов перевода может быть несколько.

Обойти подводные камни ложных друзей переводчика помогут педагоги школы Next Level. Высокий уровень знаний – не мечта, а реальность, если рядом опытные профессионалы!

Читайте также: Фразы, которые помогут пройти собеседование на английском

What’s Next — перевод — MuzOko

Трек “What’s Next” вышел 5 марта 2021 года, хотя в сети появился, как водится, за пару дней до официального релиза (27 февраля). Drake рассказывает о своём успехе, о своих способностях выпускать мировые хиты и своем богатстве. Этим треком музыкант дает ответ всем фанатам, желающим знать всё о его жизни.

Любопытно, что 19 декабря 2020 года (почти за 3 месяца до выхода данного трека) в сеть был слит неизданный раннее трек Дрейка и Янг Тага “What A Time To Be A Slime”. Так вот, в конце своего куплета Drake зачитывает точно такие же строчки, как и в припеве этой композиции.

Трек “What’s Next” дебютировал на первом месте в чарте Billboard Hot 100 20 марта 2021 года. Это восьмая композиция канадского рэпера, занявшая высшее место в топе.

Остальные треки мини-альбома Scary Hours 2 (“Wants and Needs” и “Lemon Pepper Freestyle”) заняли второе и третье места соответственно. Дрейк стал первым исполнителем в истории за 60 лет существования чарта, чьи треки одновременно заняли первые три места.

В общем, Дриззи в очередной раз говорит, что быть известной личностью с большим количеством поклонников, не так уж просто. Музыкант отдаёт своим фанатам всего себя, выкладываясь на полную, но стоит ему один раз оступиться (или высказаться о чём-то в негативном свете) и люди сразу начнут его критиковать и втаптывать в грязь.

What’s NextЧто дальше
Ayy, woahЭй, вау
Ayy, ayyАу, ау
YeahДа…
I’m makin’ a change todayСегодня настало время перемен
The liquor been takin’ the pain awayАлкоголь хорошо снимает боль
I heard you was givin’ your chain awayЯ слышал, ты отдал кому-то свою цепь
That’s kinda like givin’ your fame awayЭто все равно что расстаться со своей славой
What’s wrong with you?Что с тобой не так?
I sit in a box where the owners doЯ сижу в ложе, рядом с владельцами клуба
A boss is a role that I’ve grown intoБосс — это роль, которая стала моей
I love you to death but I told you the truthЯ люблю тебя до смерти, но я должен сказать тебе правду
I can’t just be with you and only youЯ не могу быть лишь с тобой и только с тобой
Yeah, I got one, Virgil got one and that there is the only twoДа, у меня есть один экземпляр, у Вирджила есть один, и нас таких только двое
Man, how many times have I shown improvement?Чувак, сколько раз я демонстрировал свое превосходство?
How many nights I been (Woah)Сколько ночей я… (вау)
Swervin’ them potholesЕздил по этим дорожным ямам
Not tryna fuck up the wheels on the road, okayПытаясь не испортить колеса на дороге, окей
Funny how life goesЗабавно, как идет жизнь
He thought he was sick, now he wipin’ his nose, okayОн думал, что стал крутым, а в результате остался с носом, окей
Soon as you give ’em your soulКак только ты откроешь им свою душу
You blow up and they say you’re sеlling your soul, okayСтоит разозлиться и они сразу кричат, что ты продал душу, окей
They want my life exposеdОни хотят видеть всю мою жизнь
They wanna know about the highs and lowsОни хотят знать о всех взлетах и падениях
Well, summer, all I did was rest, okay?Ну что ж, летом я только и делал, что отдыхал, окей?
And New Year’s, all I did was stretch, okay?И на Новый Год я только и делал, что развлекался, окей?
And Valentine’s Day, I had sex, okay?И в День Святого Валентина у меня был секс, окей?
We’ll see what’s ’bout to happen nextПосмотрим, что будет дальше
Okay? Okay? Okay?Окей? Окей? Окей?
We’ll see what’s ’bout to happen nextПосмотрим, что будет дальше
Okay? Okay? Okay?Окей? Окей? Окей?
We’ll see what’s ’bout to happen, ayy, ayyПосмотрим, что будет, эй
We’ll see what’s ’bout to happen, ayyПосмотрим, что будет, эй
We’ll see what’s ’bout to happenПосмотрим, что будет
I’m makin’ a change todayСегодня настало время перемен
The liquor been takin’ the pain awayАлкоголь хорошо снимает боль
I heard you was givin’ your chain awayЯ слышал, ты отдал кому-то свою цепь
That’s kinda like givin’ your fame awayЭто все равно что расстаться со своей славой
What’s wrong with you?Что с тобой не так?
I sit in a box where the owners doЯ сижу в ложе, рядом с владельцами клуба
A boss is a role that I’ve grown intoБосс — это роль, которая стала моей
I love you to death but I told you the truthЯ люблю тебя до смерти, но я должен сказать тебе правду
I–Я…
Ayy, yeahЭй, да
I got one, Laurie got one and that there is the only twoДа, у меня есть один экземпляр, у Лори есть один, и нас таких только двое
Man, how many times have I told you the truth?Чувак, сколько раз я говорил тебе правду?
Man, how many nights I been (Woah)Чувак, знаешь, сколько ночей я… (вау)
Swervin’ them potholesЕздил по этим дорожным ямам
Not tryna fuck up the wheels or fuck up the dealsПытаясь не испортить колеса и не облажаться в делах
I’m posted in StockholmЯ работал в Стокгольме
It’s me, the owls and the twins, it’s only the realЭто я, совы и близняшки, здесь всё по настоящему
I’m movin’ way too humbleЯ двигаюсь слишком скромно
Weezy had handed it off, I still got no fumblesУизи поверил в меня, и я до сих пор не облажался
I’m on the hot one hundo, numero unoЯ пишу горячие хиты, залетаю на первые строчки
This one ain’t come with a bundleЭто не зависит от связей
I’m in the Wynn, a million in chocolate chipsЯ в отеле Wynn, у меня миллион шоколадных фишек
And that’s just how my cookie crumbleТак и надо тратить деньги
I put a skirt on a whip and a crown on the sixЯ ставлю обвес на машину, надеваю корону на шестёрку
But there’s no need to dress up the numbersНо мне нет необходимости приукрашивать цифры
Ayy, ayy, yeahЭй, эй, эй
But I guess they must have they reasonsНо кажется, у них на это должны быть свои причины
They wanna know how I’m livin’ my day-to-day life in the regular seasonОни хотят знать, как я живу своей повседневной, обычной жизнью
Well, summer, all I did was rest, okay?Ну что ж, летом я только и делал, что отдыхал, окей?
And New Year’s, all I did was stretch, okay?И на Новый Год я только и делал, что развлекался, окей?
And Valentine’s Day, I had sex, okay?И в День Святого Валентина у меня был секс, окей?
We’ll see what’s ’bout to happen nextПосмотрим, что будет дальше
Okay? Okay? Okay?Окей? Окей? Окей?
We’ll see what’s ’bout to happen nextПосмотрим, что будет дальше
Okay? Okay? Okay?Окей? Окей? Окей?
We’ll see what’s ’bout to happen, ayy, ayyПосмотрим, что будет, эй
We’ll see what’s ’bout to happen, ayyПосмотрим, что будет, эй
We’ll see what’s ’bout to happenПосмотрим, что будет
I’m makin’ a change todayСегодня настало время перемен
The liquor been takin’ the pain awayАлкоголь хорошо снимает боль
I heard you was givin’ your chain awayЯ слышал, ты отдал кому-то свою цепь
That’s kinda like givin’ your fame awayЭто все равно что расстаться со своей славой
What’s wrong with you?Что с тобой не так?
I sit in a box where the owners doЯ сижу в ложе, рядом с владельцами клуба
A boss is a role that I’ve grown intoБосс — это роль, которая стала моей
I love you to death but I told you the truthЯ люблю тебя до смерти, но я должен сказать тебе правду
I–Я…

следующий будет — английский перевод – Linguee

Als wij het hebben over water en het grote internationale belang daarvan, wordt vaak teruggegrepen op een beroemd citaat van de directeur van de Wereldbank uit de jaren ’90. En dat luidt

[…]

как volgt: Если войны за этот век

[. ..]
велись из-за нефти война s o f следующие C E NTU R y будет F O F O F O .

europarl.europa.eu

europarl.europa.eu

(NL) Господин Президент, когда мы обсуждаем воду и ее большое международное значение, люди часто прибегают к известной цитате директора Всемирного банка в

[…]

1990-х годов, который сказал: «Если войны

[…]
this centu ry were fo ught over oil, the wars o f the next ce ntury w ill be fou gh t over water .

europarl.europa.eu

europarl.europa.eu

Следующий q u es tio n t o be a n al ysed является ли мера [. ..]

выборочный, т. е. благоприятствует «определенным» предприятиям или производству определенных товаров.

eur-lex.europa.eu

eur-lex.europa.eu

The next ques ti on to be analysis is whe th er the me as действительно […]

выборочный, т. е. благоприятствует «определенным» предприятиям или производству определенных товаров.

eur-lex.europa.eu

eur-lex.europa.eu

Установка нового двустороннего или многостороннего

[…]
Предел должен на L Y BE E F FE Ctive FR O M M M M M M M M M M M M M M M M FR O M FR o FR o M F. 0014 следующий б у си день.

eur-lex.europa.eu

eur-lex.europa.eu

Сетин г новый двусторонний или многосторонний

[…]
ограничение действует только ct ive f rom nex t автобус в ess день.

eur-lex.europa.eu

eur-lex.europa.eu

H o w will the i n st ru me n t be i m pl и влияние на […]

практика контролируется и оценивается?

eur-lex.europa.eu

eur-lex.europa.eu

Как w больные инструменты tr ument будут реализованы a nd im pa ct в [. ..]

практика контролируется и оценивается?

eur-lex.europa.eu

eur-lex.europa.eu

(2) 17 декабря 2007 г. власти Великобритании

[…]

предоставлена ​​неофициальная справочная информация

[…]
о продлении гарантийного соглашения s t o be a n no unce d o n the next d a у .

eur-lex.europa.eu

eur-lex.europa.eu

(2) 17 декабря 2007 г. власти Великобритании

[…]

предоставил неофициальную справочную информацию

[…]
о продлении гарантийных обязательств будет объявлено d на следующий d ау .

eur-lex. europa.eu

eur-lex.europa.eu

Within three years, decisions m a y be t a ken o n the next с т эп в развитии двусторонних отношений, в том числе возможность новых договорных связей.

eur-lex.europa.eu

eur-lex.europa.eu

В течение трех лет приняты решения ma y be t о следующем шаге в развитии двусторонних отношений, включая возможность новых договорных связей.

eur-lex.europa.eu

eur-lex.europa.eu

The next s t eps t o be t a ke n hav e t o be t o i увеличить [. ..]

ориентированы на международное сотрудничество за пределами ЕС.

europarl.europa.eu

europarl.europa.eu

Следующий шаг s до be ta ken должен быть увеличен se […]

fo cus по международному сотрудничеству за пределами ЕС.

europarl.europa.eu

europarl.europa.eu

В последние годы было подробно изучено множество различных последствий изменения климата, и

[…]

продемонстрировать, что если не решить проблему изменения климата, экономический ущерб будет

[…]
дальнейшее увеличение e a s приведет к r i sk необратимого повреждения.

eur-lex.europa.eu

eur-lex.europa.eu

Многие различные последствия изменения климата были подробно изучены в последние годы, и

[. ..]

продемонстрируют, что если не решить проблему изменения климата, экономический ущерб будет увеличиваться

[…]
увеличение как wi ll ri sk ir re обратимое повреждение.

eur-lex.europa.eu

eur-lex.europa.eu

На графике 2 видно, что зависимость от старости составляет g t o be A GL OBAL Challenge OV E R Следующий T ARESH .

eur-lex.europa.eu

eur-lex.europa.eu

На диаграмме 2 показано, что зависимость в пожилом возрасте станет глобальной проблемой в течение следующих трех десятилетий, за исключением Африки.

eur-lex.europa.eu

eur-lex.europa.eu

It is assumed that the more closed the system, the mo r e will the c o nt ent of such bel ie f s быть t o t эффект, что мы живем одинокими, изолированными и беспомощными в мире, лишенном друзей; что мы живем в мире, где будущее неопределенно; что самость принципиально недостойна и неадекватна тому, чтобы в одиночку справляться с этим лишенным друзей миром; и что способ преодоления таких чувств — это самовозвеличивание и самодовольная идентификация с делом, забота о власти и статусе и навязчивая самопрозелитизация справедливости такого дела.

m2p.be

m2p.be

Предполагается, что чем более замкнута система, тем больше содержание таких верований будет сводиться к тому, что мы живем одинокими, изолированными и беспомощными в мире, лишенном друзей; что мы живем в мире, где будущее неопределенно; что самость принципиально недостойна и неадекватна тому, чтобы в одиночку справляться с этим лишенным друзей миром; и что способ преодолеть такие чувства — это самовозвеличивание и самодовольная идентификация с делом, забота о власти и статусе, а также навязчивая самопрозелитизация справедливости такого дела.

m2p.be

m2p.be

H e затем a p po новый премьер-министр и правительство, представляющее все партии.

europarl.europa.eu

europarl.europa.eu

Затем он назначит нового премьер-министра и правительство, представляющее все партии.

europarl.europa.eu

europarl.europa.eu

Deze ‘deltascenario s next w orden eind 2012/begin 2013 opgeleverd.

deltacommissaris.nl

deltacommissaris.nl

Эти «следующие дельта-сценарии» будут представлены в конце 2012/начале 2013 года.

Then touch to select one in the PTY menu, The un i t will a u to se e k the next a v ai метка PTY путем увеличения частоты настройки до тех пор, пока тип программы не будет соответствовать PTY.

sevic.com

sevic.com

Затем нажмите, чтобы выбрать один из них в меню PTY. uni t будет a u, чтобы искать следующий доступный PTY, увеличивая частоту настройки до тех пор, пока тип программы не будет соответствовать PTY. оригинальное радио, и отображается «Нет».

shop.sevic.com

shop.sevic.com

Тенсл от t e willen w e o nze aandeelhouders […]

bedanken voor het ondersteunen van de Raad van Bestuur en van het Management aangezien

[…]

мы ernaar streven om de leider te zijn in deze industrie.

jensen-group.com

jensen-group.com

Последний бу т № минимум, мы т га нк […]

акционеров за их поддержку совета директоров и руководства, поскольку мы стремимся быть лидером в этой отрасли.

jensen-group. com

jensen-group.com

De relatie met de klant staat centraal, waarbij we de belangrijkste

[…]
Bank voor de k la n t willen z i jn .

rabobank.com

rabobank.com

Наши отношения с клиентом занимают

[…]
центр-ст аг е; мы хотим, чтобы было т он ведущий […]

банка для клиента.

rabobank.com

rabobank.com

Het дивиденды zal worden uitgekeerd in gewone aandelen ten laste van de belastingvrije agioreserve of de overige резервы, tenzij een aandeelhouder aangeeft een uitkering in contante n t e willen o n tv angen.

боскалис.nl

боскалис. nl

Дивиденды будут выплачиваться обыкновенными акциями с отнесением на необлагаемый налогом эмиссионный доход или на нераспределенную прибыль, если только акционер прямо не потребует выплаты наличными.

boskalis.com

boskalis.com

3 Индийский номер

[…]
derde eerst door middel van een factuur kennis heeft kunnen krijgen van het feit dat het aangesloten bedrijf uitsluitend handelt onder toepasselijkheid van de Algemene Handelsvoorwaarden, heeft hij het recht om binnen drie werkdagen na factuurdatum alsnog schriftelijk aan het aangesloten bedrijf mede te delen de overeenkoms t т е виллен а n nu leren, in welk geval hij ervoor dient te zorgen dat de geleverde zaken binnen drie werkdagen na bedoelde mededeling in goede staat zijn teruggeleverd; bij gebreke daarvan wordt de derde geacht de toepasselijkheid van deze voorwaarden te erkennen.

vergeerkaas.nl

vergeerkaas.nl

3 Если третья сторона узнает о том, что аффилированная компания действует исключительно в соответствии с Общими условиями ведения бизнеса, когда она получает счет, третья сторона будет иметь право уведомить аффилированную компанию в течение трех рабочих дней после даты выставления счета, что он намеревается расторгнуть соглашение, и в этом случае он соглашается обеспечить, чтобы любой поставленный товар был возвращен в надлежащем состоянии в течение трех рабочих дней после указанного уведомления; в противном случае будет считаться, что третья сторона приняла применимость этих условий.

vergeerkaas.nl

vergeerkaas.nl

Многоязычный перевод в масштабе: 10 000 языковых пар и более

Корпорация Майкрософт находится в поиске ИИ в масштабе с большими амбициями, чтобы обеспечить возможности ИИ следующего поколения. Команда Microsoft Translator ZCode работает вместе с Microsoft Project Turing и Microsoft Research Asia над улучшением языковой и многоязычной поддержки в основе этой инициативы. Мы продолжаем расширять границы с многоязычными моделями для поддержки различных языковых сценариев в Microsoft. Прошлым летом мы анонсировали нашу крупномасштабную модель Multi-Lingual Mixture of Expert с DeepSpeed, которая может превзойти отдельные крупномасштабные двуязычные модели. Недавно последняя модель универсального языкового представления Тьюринга (T-ULRv5), созданная Microsoft, снова стала передовой и в то время возглавляла общедоступную таблицу лидеров Google XTREME. Совсем недавно Microsoft анонсировала самую большую по параметрам модель Megatron-Turing NLG 530B.

Ежегодная конференция по машинному переводу (также известная как WMT 2021) завершилась на прошлой неделе в прекрасной Пунта-Кане, Доминиканская Республика. WMT объединяет исследователей со всей области машинного перевода, как отраслевых, так и академических, для участия в серии общих задач, каждая из которых определяет эталон в важной области машинного перевода, чтобы вывести эту область на новые рубежи.

Команда Microsoft Translator ZCode, работающая вместе с командой Тьюринга и Microsoft Research Asia, соревновалась в треке «Крупномасштабный многоязычный перевод», который состоял из полного задания по переводу между всеми 10 000 направлений на 101 языке и двух небольших заданий. : Один был посвящен 5 языкам Центральной и Южной Европы, а другой – 5 языкам Юго-Восточной Азии. Модель Microsoft ZCode-DeltaLM выиграла все три задачи с огромным отрывом, включая невероятный прирост на 10+ баллов по сравнению с моделью M2M100 в большой задаче, оцениваемой на 10 000 языковых пар. (Результаты совместной задачи WMT 2021 по крупномасштабному многоязычному машинному переводу, Wenzek et al, WMT 2021).

Рис. 1. Официальные результаты (баллы BLEU) по полной задаче и небольшой задаче1 на WMT 2021. Общая задача крупномасштабного многоязычного перевода

Подход ZCode-DeltaLM

загляните под капот победившей модели Microsoft ZCode-DeltaLM. Нашей отправной точкой был DeltaLM (DeltaLM: Pre-training Encoder-Decoder Pre-training for Language Generation and Translation by Augmenting Pretrained Multilingual Encoders), последний из все более мощной серии многоязычных предварительно обученных языковых моделей от Microsoft.

DeltaLM — это модель кодер-декодер, но вместо обучения с нуля она инициализируется из предварительно обученной современной модели только для кодировщика, в частности (TULRv3). В то время как инициализация кодировщика проста, декодер менее прост, поскольку он добавляет перекрестное внимание к самому вниманию кодировщика. DeltaLM решает эту проблему с помощью новой чередующейся архитектуры, в которой само-внимание и перекрестное внимание чередуются между уровнями, при этом само-внимание используется в нечетных слоях, а перекрестное внимание — в четных. При таком чередовании структура декодера соответствует кодировщику, поэтому его также можно инициализировать таким же образом из TULRv3.

DeltaLM дополнен мощным многозадачным обучением ZCode: многозадачное обучение для многоязычного нейронного машинного перевода. Наши модели показывают, что сочетание многозадачности и многоязычного обучения может значительно улучшить обучение крупномасштабным предварительно обученным языковым моделям. Такая парадигма многозадачного многоязычного обучения использует индуктивную предвзятость и регуляризацию нескольких задач и языков одновременно, чтобы лучше выполнять различные последующие задачи. Мы используем задачу перевода, задачу автоматического шумоподавления и задачу повреждения диапазона трансляции, как показано на рисунке ниже.

Победа в массовом многоязычном переводе

Чтобы создать нашу выигрышную многоязычную систему перевода (многоязычные системы машинного перевода от Microsoft для общей задачи WMT21), мы начали с zCode-DeltaLM и добавили несколько приемов.

Мы применяем прогрессивное обучение, сначала обучая модель с 24 слоями кодировщика и 12 слоями декодера, затем продолжаем обучение с 12 добавленными слоями кодировщика, в результате чего получается глубокий 36-слойный кодировщик. Чтобы охватить все языковые пары, мы генерируем двойные псевдопараллельные данные, где обе стороны параллельных данных являются синтетическими, переведенными моделью с английского языка. Мы также применяем итеративный обратный перевод для создания синтетических данных. Мы применяем обучение по учебной программе, начиная со всех зашумленных данных обучения, а затем уменьшая их до чистого подмножества. Мы повторно взвешиваем цель перевода, чтобы предпочесть параллельные данные обратному переводу и двойным псевдопараллельным данным. Мы применяем температурную выборку, чтобы сбалансировать языковые пары. Для каждой языковой пары мы выбираем, основываясь на наборе разработчиков, предпочесть ли прямой перевод или сводной перевод через английский язык.

Собрав все вместе, мы знали, что у нас потрясающая многоязычная система, но официальные результаты слепого теста превзошли наши ожидания. Мы набрали от 2,5 до 9 баллов BLEU, опередив следующего конкурента, и от 10 до 21 балла BLEU, опередив базовую модель M2M-175. В тесте разработки мы сравнили его с более крупной моделью M2M-615, которую мы также опередили на 10–18 баллов.

Beyond Translation: Universal Language Generation

Хотя мы очень рады большой победе на WMT 2021, еще более захватывающим является то, что, в отличие от других конкурентов, наша модель ZCode-DeltaLM — это не просто модель перевода, а скорее общая предварительно обученная языковая модель кодер-декодер, пригодная для всех видов задач генерации, помимо перевода. Это действительно позволяет нашим моделям достаточно хорошо выполнять различные задачи генерации многоязычного естественного языка.

Мы достигли нового SOTA во многих популярных задачах генерации от GEM Benchmark, включая Wikilingua (обобщение), упрощение текста (WikiAuto) и преобразование структуры в текст (WebNLG). Модель DeltaLM-ZCode значительно превосходит гораздо более крупные модели, такие как mT5 XL (3,7B), которая также обучается на гораздо больших данных. Это продемонстрировало эффективность и универсальность моделей, что привело к высокой производительности во многих задачах.

Рисунок 2. Производительность (баллы RL) ZCode-DeltaLM в задачах суммирования и упрощения текста в тесте GEM

Глядя в будущее

Многоязычный машинный перевод достиг точки, когда он работает очень хорошо, превосходя двуязычные системы, как на языках с низким, так и на высоких ресурсах. Было показано, что смешанные модели экспертов (MoE) очень хорошо подходят для масштабирования таких моделей, как это было показано в GShard.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *