Вставить артикль где необходимо английский

Посмотрите это видео, чтобы получить базовое представление об артиклях в английском языке перед прочтением статьи.

Мы меняем ударение и порядок слов, чтобы придать фразе оттенок, а в английском порядок слов строго фиксирован.

Чувствуете подвох? В первом случае непонятно о какой машине идет речь, а во втором речь идет о конкретной машине.

В английском языке нельзя менять слова местами, поэтому чтобы придать нужный оттенок фразе используются артикли AAn и The.

Понятие артикля в грамматике английского языке связано с категорией определенности. Упрощенно, правило артиклей звучит так:

Если говорим о неизвестном предмете, то неопределенный артикль A / An. Если речь идет о чем-то определенном, то перед ним ставится артикль The.

Артикль The произошел от This (это) — можно пальцем указать.
A / An произошел от One (один).

      Существительное во множественном числе?
      Существительное исчисляемое?
      Слышали раньше о нем? (неопределенный или определенный артикль)
      Речь идет о чем-то общем?

Повторим!
Неопределенный артикль A / An (который произошел от one) ставим только перед исчисляемыми существительными в единственном числе!

Артикль A ставится перед словами, которые начинаются с согласных звуков (a cat, a house, a yard), а An – перед словами, которые начинаются с гласных звуков (an apple, an hour). 

В отличие от неопределенного, определенный артикль может ставится перед любыми существительными в любом числе. Но когда?

Пройдите интерактивное упражнение на английские артикли, чтобы закрепить материал.

Выбор артикля в английском языке во многом зависит от контекста. В этих упражнениях подобраны случаи, когда выбор более-менее однозначен. Пройдите упражнения на артикли, чтобы закрепить знание темы.

Выбор между вариантами неопределенного артикля a и an зависит от первого звука следующего слова. Перед согласным используем a, перед гласным an – это позволяет артиклю не сливаться со словом.

Выбор между артиклями the и a\an в большинстве случаев зависит от контекста. В этом упражнении приведены случаи, когда из контекста понятно, какой именно нужен артикль.

В этом упражнении вам нужно выбрать между артиклем the, артиклем a\an и нулевым артиклем. Если артикль нулевой – просто оставьте пропуск в тексте пустым.

  В английском языке есть служебная часть речи, которой нет в русском. Это артикль. Артикли стоят перед именами существительными, те есть словами, обозначающими предметы.

Английские существительные, как и в русском языке, могут обозначать одушевленные ( a dog -собака, a boy — мальчик) и  неодушевленные предметы (a table — стол, water — вода).

Некоторые из них можно пересчитать (исчисляемые существительные), другие нельзя (неисчисляемые существительные).

a book (книга), a cat (кошка) — исчисляемые существительные, а названия различных веществ  или явлений природы — неисчисляемые ( sugar — сахар, milk — молоко, snow -снег).

Различать исчисляемые и неисчисляемые существительные нужно уметь для того, чтобы правильно употреблять английские артикли.

Неопределенный артикль A употребляется только с исчисляемыми существительными в единственном числе. Этот артикль показывает, что  предмет — один из многих таких же или подобных ему. Во множественном числе в этом случае артикль не употребляется совсем.

          A dog (какая-то собака) — dogs (какие-то собаки), a table (какой-то стол) — tables( какие-то столы).

Неопределенный артикль а перед словами, начинающимися с гласного звука, имеет форму an исключительно для удобства произношения.
Например, очень неудобно произносить a apple (яблоко), поэтому форма артикля меняется an apple.   Но перед буквой Y артикль свою форму не меняет, так как звук, обозначаемый гласной буквой Y — согласный [j] (й).

Неопределенный артикль стоит перед существительным, если предмет упоминается в первый раз.

Когда же об этом предмете мы продолжаем говорить, то заменяем неопределенный артикль на определенный THE, так как знаем, о каком предмете идет речь.

Неопределенный артикль А(Аn) не может стоять перед неисчисляемыми существительными, такими как air (воздух), water (вода), juice (сок).

Произношение определенного артикля THE тоже зависит от того, с какого звука начинается существительное. Если с согласного, мы  его произносим [ðə], а перед гласным звуком — [ðɪ].

Определенный артикль употребляется с существительными как в единственном, так и во множественном числе.

Определенный артикль употребляется как с исчисляемыми, так и с неисчисляемыми существительными.

Во втором предложении вставляем неопределенный артикль а, так  шляпка (hat) упоминается в первый раз.

А в третьем предложении нужен определенный артикль The, так как речь идет уже о конкретной шляпке (the hat)

               The Browns live in Great Britain. — Брауны живут в Великобритании.

Упражнения «Артикли» (с ответами) — Английский язык по Скайпу

1. Поставьте артикли a или an.

1. … elephant   2. … English dictionary   3. … butterfly   4. … German car    5. … Italian bag 6. … American college   7. … Russian city   8. … French designer   9. … Indian river   10. … egg   11. … notebook   12. … elegant lady   13. … ice-cream   14. … Japanese phone

2. Поставьте артикли a/an или the там, где необходимо.

  1. I’d like … chicken sandwich and … glass of … mineral water. (Я бы хотел сэндвич с курицей и стакан минеральной воды.)
  2. Would you like … banana or … strawberries? (Ты хочешь банан или клубнику?)
  3. She always has … apple, … toast and … cup of … coffee for … breakfast. (Она всегда съедает яблоко, тост и пьет чашку кофе на завтрак.)
  4. The fly is on … ceiling in … kitchen. (Муха – на потолке на кухне.)
  5. My mother is … accountant and my father is … lawyer. They work in … same company in … centre of … our town. (Моя мама – бухгалтер, а папа – юрист. Они работают в одной компании в центре нашего города.)
  6. How much are … her Italian lessons? – Ten dollars … hour. (Сколько стоят ее занятия по итальянскому языку? – Десять долларов в час.)
  7. Where are … dogs? – They are in … garden. (Где собаки? – Они в саду.)
  8. … cats like eating … fish.  … cows like eating … grass.  … birds like eating … insects. (Кошки любят есть рыбу. Коровы любят есть траву. Птицы любят есть насекомых. )
  9. My favourite subjects are … chemistry and … biology. (Мои любимые предметы – химия и биология.)
  10. There is … parrot in … cage. And there are … pieces of … fruit in it. (В клетке попугай. И в ней есть кусочки фруктов.)
  11. My granny lives in … small village in … country. (Моя бабушка живет в маленькой деревушке в сельской местности.)
  12. Your baby shouldn’t sit in … sun on … hot day. (Вашему малышу не следует сидеть на солнце в жаркий день.)
  13. Please open … book.  … exercise is on … page 68. (Пожалуйста, откройте книгу. Упражнение находится на странице 68.)
  14. Ann has been looking for … job for … long time. (Аня ищет работу долгое время.)
  15. What’s … matter? — I missed … 6 o’clock train. (Что случилось? – Я не успел на 6-часовой поезд.)
  16. Do you like … vegetables? (Ты любишь овощи?)
  17. … mother has got … terrible headache today. (У мамы сегодня ужасная головная боль.)
  18. There were … tears in … her eyes. (В ее глазах были слезы.)
  19. She is … very nice woman but her sons are … bad boys. (Она очень хорошая женщина, но ее сыновья – плохие парни.)
  20. Look at … woman. She is … neighbor I told you about. (Посмотри на женщину. Это соседка, о которой я тебе говорил.)

3. Поставьте артикли a/an или the, где необходимо.

  1. Yesterday I bought … pair of … shoes. Unfortunately … shoes are too tight. (Вчера я купила пару туфель. К сожалению, туфли слишком узкие.)
  2. We had … dinner in … restaurant … last night. – What is … name of … restaurant? (Вчера ночью мы ужинали в ресторане. – Как называется ресторан?)
  3. Tony has two children: … boy and … girl. They are … twins.  … girl is in … France now. (У Тони двое детей: мальчик и девочка. Они близнецы. Девочка находится сейчас во Франции.)
  4. Would you like another piece of … cake? – No, … cake is too fat for me. (Хотите еще один кусок торта? – Нет, для меня торт слишком жирный. )
  5. His office is on … Floor 5. And I live on … tenth floor. (Его офис находится на этаже 5. А я живу на десятом этаже.)
  6. Little Mike leaves for … school very early because … school is quite far from … his home. (Маленький Майк уходит в школу очень рано, потому что школа довольно далеко от его дома.)
  7. Lara saw … letter under … door. She read … letter and started crying. (Лара увидела под дверью письмо. Она прочитала письмо и начала плакать.)
  8. Did you enjoy … food at … party … last Friday? (Тебе понравилась еда на вечере в прошлую пятницу?)
  9. Roger is … scientist, he works for … government. (Роджер – ученый, он работает на правительство.)
  10. We go to … gym twice … week. (Мы ходим в спортзал дважды в неделю.)

4. Поставьте артикли там, где необходимо.

  1. I come to … work by … bus. Today … bus was a bit late. (Я езжу на работу на автобусе. Сегодня автобус немного опоздал.)
  2. … Jack is … youngest but … cleverest boy at … school. (Джэк – самый младший, но самый умный мальчик в школе.)
  3. It rained, so I stayed at … home in … evening. But today … sun is shining brightly in … sky. (Шел дождь, поэтому я остался дома вечером. Но сегодня ярко светит солнце в небе.)
  4. On … Monday … kids were tired and they went to … bed very early. (В понедельник дети устали и пошли спать очень рано.)
  5. My wife is … best woman in … world and I’m … happiest husband! (Моя жена – лучшая женщина на свете, а я самый счастливый муж!)
  6. They are having … test on … third of December. (У них будет тест третьего декабря.)
  7. What … beautiful painting! … artist is such … talented person. (Какая красивая картина! Художник – такой талантливый человек.)
  8. Robin Hood robbed … rich and helped … poor. (Робин Гуд грабил богатых и помогал бедным.)
  9. David is … old friend of mine. He plays … guitar perfectly. His sister has been playing … tennis since … age of ten. (Давид — мой старый друг. Он отлично играет на гитаре. Его сестра играет в теннис с 10 лет.)
  10. … Jacksons live in that lovely cottage with … fantastic garden. (Семья Джэксонов живет в том милом коттедже с фантастическим садом.)
  11. Sam used … drugs and was sent to … prison in … August. What … shame! (Сэм применял наркотики и был отправлен в тюрьму в августе. Какой позор!)
  12. … Harrisons are not religious and they never go to … church. (Семья Гаррисонов не религиозна, и они никогда не ходят в церковь.)
  13. He has been in … hospital for … month. (Он лежит в больнице в течение месяца.)
  14. … English are very fond of … gardening. (Англичане очень увлекаются садоводством.)
  15. I’ve tried to learn … Japanese many times. (Я пробовал изучать японский язык много раз.)
  16. She is … famous actress and she often appears on … TV. (Она – известная актриса и часто появляется на телевидении.)
  17. It’s such … original idea! Besides you’ve got … good sense of humour. (Это такая оригинальная идея! Кроме того, у тебя хорошее чувство юмора.)
  18. On … rainy day … castle looks like … prison. (В дождливый день замок выглядит как тюрьма.)

 

5. Поставьте артикли с именами собственными, если это необходимо.

  1. … Cairo is … capital of … Egypt. (Каир – столица Египта.)
  2. It was so picturesque in … Crimea … last summer. (В Крыму было так живописно прошлым летом.)
  3. … London stands on … Thames. (Лондон стоит на Темзе.)
  4. I had … my holiday in … northern Italy … last year but I’m going to cross … Atlantic ocean and visit … USA … next year. (Я провел отпуск в северной Италии в прошлом году, но в следующем году я собираюсь пересечь Атлантический океан и посетить США.)
  5. … Moon moves round … Earth. (Луна движется вокруг Земли.)
  6. … Great Patriotic war started in 1941. (Великая Отечественная война началась в 1941 году.)
  7. … Volga is … longest river in … Russia. (Волга – самая длинная река в России.)
  8. … Ukraine and … Turkey are separated by … Black sea. (Украину и Турцию разделяет Черное море.)
  9. My friend usually goes to … Alps in … spring by … plane. (Мой друг обычно ездит в Альпы весной на самолете.)
  10. … Urals are lower than … Caucasus. (Уральские горы ниже Кавказа.)
  11. … Great Britain is situated on … two large islands. (Великобритания расположена на двух больших островах.)
  12. … Christmas and … Easter are my favourite holidays. (Рождество и Пасха – мои любимые праздники.)
  13. It takes about … hour to get from … Domodedovo airport to … Lenin street. (Требуется около часа, чтобы добраться от аэропорта Домодедово до улицы Ленина.)
  14. What’s … weather like today in … Australia? (Какая сегодня погода в Австралии?)
  15. … Colorado river flows through … Grand Canyon. (Река Колорадо протекает через Большой Каньон.)
  16. My English friend took me to see … National gallery, … Houses of … Parliament and … Tower bridge. (Мой английский друг взял меня посмотреть Национальную галерею, Здания Парламента и Тауэрский мост.)
  17. … Statue of … Liberty was … present from … French people. (Статуя свободы была подарком от французского народа.)
  18. … Galaxy where we live is called … Milky Way. (Галактика, в которой мы живем, называется Млечным путем.)

Также разобрать упражнения индивидуально можно с репетиторами английского по скайпу. Пробное занятие бесплатное.

Ответы:

1.

1. an  2. an  3. a  4. a  5. an  6. an  7. a  8. a  9. an  10. an  11. a  12. an  13. an  14. a

2.

1. a, a. — .  2. a, — .  3. an, a, a, — , — .  4. the, the.  5. an, a, the, the, — .  6. — , an.  7. the, the.  8. — , — , — , — , — , — . 9. — , — .  10. a, the, — , — .  11. a, the.  12. the, a.  13. the, the, — .  14. a, a.  15. the, the.  16. — .  17. — , a.  18. — , — .  19. a, — .  20. the, the.

3.

1. a, — , the.  2. — , a, — , the, the.  3. a, a, — , the, — .  4. — , the.  5. — , the.  6. — , the, — .  7. a, the, the.  8. the, the, — .  9. a, the.  10. the, a.

4.

1. — , — , the.  2. — , the, the, — .  3. — , the, the, the.  4. — , the, — .  5. the, the, the.  6. a, the.  7. a, the, a.  8. the, the.  9. an, the, — , the.  10. the, a.  11. — , — , — , a.  12. the, — .  13. — , a.  14. the, — .  15. — .  16. a, — .  17. an, a.  18. a, the, a.

5.

1. — , the, — .  2. the, — .  3. — , the.  4. — , — , — , the, the, — .  5. the, the.  6. the.  7. the, the, — .  8. -, — , the.  9. the, — , — .  10. the, the.  11. — , — .  12. — , — .  13. an, — , — .  14. the, — .  15. the, the.  16. the, the, — , — .  17. the, — , a, the.  18. the, the.

Упражнения «Артикли» (с ответами) — 4.7 out of
5
based on
289 votes

Рейтинг:  5 / 5

Пожалуйста, оцените
Оценка 1Оценка 2Оценка 3Оценка 4Оценка 5
 

Добавить комментарий

Если необходимо, вставьте соответствующий артикль: Нам очень не повезло.

Нам не повезло ______.(A) a(B) an(C) the(D)нет статьи

Ответ

Подтверждено

238.2k+ просмотров

Подсказка: Статьи — это такие слова, как «the» и » a» & «an», которые в сочетании с существительным образуют именное словосочетание. «The» — определенный артикль, а «a» и «an» — неопределенный. Здесь (плохая) удача — абстрактное существительное, поэтому необходимо применить правило, относящееся к ней.

Полный ответ
Теперь давайте посмотрим на данные варианты
>Вариант А не правильный ответ, артикль не ставится перед неисчисляемыми/абстрактными существительными в общем смысле. (Плохо) Удача — абстрактное существительное. Следовательно, артикль «а» не может быть использован.
>Вариант Б — неверный ответ. Как гласит правило, артикль не употребляется перед неисчисляемыми/абстрактными существительными, употребляемыми в общем смысле. (Плохо) Удача — абстрактное существительное. Следовательно, артикль «an» не может быть использован. «an» обычно используется с существительными, начинающимися и звучащими как гласные (a, e, i, o, u).
>Вариант C не является правильным ответом. Артикль «the» — это определенное существительное, и он обычно ставится с местоимением, указывающим на конкретное существительное, упомянутое ранее, «the» также ставится с несколькими конкретными именами собственными, которые представляют собой совокупность, например. «Соединенные Штаты Америки»
>Вариант D является правильным ответом, поскольку мы знаем, что «удача» — абстрактное существительное, точно так же, как любовь, честность, храбрость и т. д. неисчисляемый по своей природе, как правило, перед ним не ставится артикль.

Следовательно, вариант D «без статьи» является правильным ответом.

Примечание: Существительные в широком смысле понимаются как исчисляемые и неисчисляемые существительные, когда рядом с ними ставится артикль или глагол. Как только тип существительного определен, задача упрощается.

Недавно обновленные страницы

Значения электроотрицательности Полингса для элементов относятся к классу 11 химии CBSE

Для частицы, совершающей простое гармоническое движение, класс 11 физики CBSE

Дальнозоркий человек, потерявший очки, читает 10 класс физики JEE_Main

Имеет ли нихром высокое сопротивление 12 класс физики CBSE

Если альфа и бета альфа и гамма альфа и дельта 10 класс математики JEE_Main

Значение p для где оба корня уравнения класса 10 по математике JEE_Main

Значения электроотрицательности Полингса для элементов относятся к классу 11 по химии CBSE

Для частицы, совершающей простое гармоническое движение, класс 11 по физике CBSE

Дальнозоркий человек, потерявший очки, читает 10 класс по физике JEE_Main

Имеет ли нихром высокое сопротивление 12 класс по физике CBSE

Если альфа и бета альфа и гамма альфа и дельта 10 класс по математике JEE_Main

Значение p для оба корня уравнения class 10 maths JEE_Main

Тенденции сомнений

Студенты также читают

Определенный артикль

Написание статьи

Пропуск статьи

Статья 370 Эссе

Вместе мы стоим, разделенные, мы падаем Эссе

Дождь на крыше Резюме

Речь о Махатме Ганди для учителей

Краткое изложение Ветра

Активный и пассивный голос — Долгий визит на холм

A 9003 900 и краткое эссе

Вставка статьи на английском языке

Вставка статьи на английском языке

Эвристический алгоритм вставки статьи

Джейсон Болдридж

Декабрь 1996 г.

Из-за существования многих языков, в которых отсутствует один или несколько артиклей,
проблема, с которой сталкиваются многие системы машинного перевода (MT), заключается в том, чтобы решить,
как правильно вставлять артикли при переводе с языка, который
не имеет их в тот, который делает. В настоящее время задача вставки
обрабатывается постредакторами-людьми, которые трансформируют «плохой английский»
машинного перевода текста на «хороший английский»; Тем не менее
тот факт, что английские статьи часто появляются в контекстах с высокой степенью предиктивности, предполагает
что проблема может поддаться статистическим методам. Важность
правильного вставки статьи становится очевидным, если учесть
напряжение при чтении английского текста, в котором отсутствуют артикли. Несмотря на то
одни только статистические методы не могут вставлять статьи с человеческой точностью, они
может сэкономить много времени, предсказывая большинство вставок
правильно. Затем человек-постредактор может создать полностью исправленную версию.
с меньшими усилиями и временем.

Автоматическая вставка статей может осуществляться двумя способами. Один из них
построить алгоритм в рамках конкретной системы машинного перевода (например, такой, который
переводится с японского на английский). Другой должен иметь автономный,
средство вставки статей после перевода, которое видит только английский текст.
Преимущество первого метода состоит в том, что он, возможно, использует подсказки в
исходный язык и, возможно, доступ к дискурсивной модели. А
модель дискурса, основанная на исходном языке, предположительно будет более точной
чем один, созданный для английского текста без артикля, потому что специалист по моделированию дискурса
для английского языка, как правило, в значительной степени зависит от размещения статей для
его решения.

Несмотря на это, автоматический постредактор, предложенный Найтом и Чандером
(1994) будет иметь несколько важных преимуществ, главным из которых является портативность.
тот же модуль может использоваться любой системой MT, потому что он работает только с английским языком
и, таким образом, не зависит от исходного языка. Кроме того, относительно высокая точность
может быть достигнуто без дискурсивных соображений, а статистические расчеты
локальных контекстов довольно быстро и эффективно. В очень ограниченном эксперименте
Найт и Чандер (K&C) обнаружили, что люди, которым давали
главное существительное плюс четыре слова в местном контексте смогли предсказать
выбор статьи автором в 83-88% случаев. Это говорит о том, что статьи
фактически не передают много информации в большинстве случаев (на
наоборот, рассмотрите попытку предсказать существительные, глаголы и т. д.), и этот грубый
статистика должна быть очень эффективной.

В этой статье используется постредакторский подход к вставке статей. У меня есть
выполнил задачу вставки с тем же большим упрощением, что и K&C
предполагают в их реализации, а именно, что мы знаем, где принять решение
вставка и что решение только между и а/ .
Обрабатываемый текст был создан из оригинального документа с
за исключением того, что и , и , и заменены на
по маркеру. Мой алгоритм ищет только два слова по обе стороны от определителя;
K&C смотрит на заглавное существительное, любые слова между заглавным существительным и
определитель и до двух слов слева от определителя. K&C
люди в вышеупомянутом эксперименте столкнулись с той же задачей, достигнув
точность 83-88%. Используя подход дерева решений, K&C сообщает о
вероятность успеха 78%. Эти цифры являются хорошим эталоном, и, кроме того,
хорошая мотивация для настоящего эксперимента. Конечно, ограничения
предполагается, в конечном итоге придется ослабить, чтобы маркер больше не
необходимо и так, чтобы ноль артикул и некоторые/любые можно
учитывать при принятии решения о включении. Только тогда автоматизированная статья
Inserter может иметь какое-либо практическое применение.

Тем не менее, упрощенная задача важна для определения того, что может
быть лучшим способом для достижения высшей цели. K&C построила деревья решений
которые моделируют взаимодействие главных существительных и окружающих признаков при предсказании
артикль, где признаками являются лексические признаки (слова, встречающиеся в
данная позиция более одного раза) или абстрактные признаки, такие как часть речи,
маркировка множественного числа, время и подкатегория. Для каждого существительного строится дерево; Однако,
их конструкция требует больших вычислительных затрат. Из-за этого K&C
построили деревья только для 1600 наиболее употребительных главных существительных, которые, тем не менее,
удается покрыть 77% всех вхождений существительных. Они достигли 81% точности
для вставки на эти, а на остальные существительные просто угадывают
и , что дает общую точность 78%.

Сначала можно подумать, что слепое угадывание приведет к
больший хаос, чем это на общей точности. Причина, по которой это не
заключается в том, что по статистике и встречаются в 67% случаев. Конечно, как
K&C, это обеспечивает четкую нижнюю границу для автоматической статьи.
производительность инсерта. Чтобы определить верхнюю границу, K&C также
провел небольшой эксперимент, в котором испытуемым давали полный текст с
фиктивные маркеры, заменяющие артикли. Возможность включить свой дискурс
знания повысили успеваемость испытуемых до 94-96%.

Подход, который я избрал, сильно отличается от подхода K&C. Основа
Идея состоит в том, чтобы посмотреть на контексты, непосредственно окружающие статьи, чтобы
определить вероятности для каждого отдельного контекста, совпадающего с и
или a/an (здесь и далее я буду называть a/an только a ).
Программа вставки обучается на наборе данных из интерактивной стены.
Street Journal пометил корпус, создавая базы данных, в которых хранятся вероятности
для каждого конкретного контекста в классе контекстов. Контексты нарисованы
из слов и тегов, расположенных в пределах двух позиций статьи.
Другими словами, для каждой статьи программа ищет следующее:

    W/T W/T ART W/T W/T

Здесь «W» относится к слову, «T» — к тегу, а
«АРТ» к статье. Отсюда используются десять контекстных классов:

    Одно слово: W _ ART _ W ART ART W _ ART _ W
    Два слова: W W ART W ART W ART W W
    Две метки: Т Т АРТ Т АРТ Т АРТ Т Т

«_» указывает позицию, которая игнорируется. Так, например,
«годом ранее» — это особый контекст в классе контекстов
«следующие два слова справа» (ART W W).

Распределение «годом ранее» в корпусе Wall Street
составляет от 365 a/an до 20 , что примерно соответствует той же статистике.
программа выведет в процессе его обучения.

Собрав статистику для различных контекстов, программа
затем переходит к процессу вставки. После прочтения в текстовом файле
для тестирования он создает непомеченный (т. е. читаемый) текстовый файл, по которому
текстовый файл с повторно вставленными статьями будет сравнен позже. Текст
файл не является частью обучающего набора. Далее программа маскирует статьи
в массиве, содержащем файл, заменив их маркером «##».
Затем программа начинает процесс повторной вставки статей. Как это
сканирует файл, он должен принимать решение каждый раз, когда встречается
маркер.

При рассмотрении конкретной вставки статьи программа смотрит на
каждый из десяти вышеупомянутых контекстных классов. Вероятность на
происходящее в этом контексте вычисляется (помните, что это бинарное решение,
так что вероятность на не нужно явно вычислять), и
это значение отправляется подпрограмме, которая увеличивает или уменьшает неизвестное
«Оценка» статьи, которая имеет начальное значение, равное нулю. Секция
показанного ниже псевдокода дает пример этого эвристического процесса.

    сумма = (число a
    + номер -х)
    если ( сумма > 1 ) { вероятность
    a = (количество a s / сумма)
    если ( вероятность a >=
    .9) {счет += 12}
    если ( .7 <= вероятность < 0,9) { оценка += 7 }
    если ( .5 <= вероятность < 0,7 ) { оценка += 3 }
    если ( .2 <= вероятность < 0,3) { оценка += -2 }
    если ( .05 <= вероятность < .2 ) { оценка += -3 }
    если ( вероятность a < .05 ) { оценка += -7 }}
    * x += 1 эквивалентно
    х = х+1

Таким образом, оценка увеличивается, если контекст благоприятствует и , и снижается
если он предпочитает , то . Обратите внимание, что оценка перекошена в пользу
и . Не только более высокие абсолютные значения присвоены a — в пользу
контекстах, они также не должны соответствовать строгим требованиям вероятности
как -благоприятные контексты. Это компенсирует естественную склонность к
, отмеченный ранее. Действительно, в большинстве контекстов предпочтение отдается , поэтому, когда
учитывая десять различных контекстов, каждый из которых имеет свой собственный голос, восемь из них
которые слегка поддерживают , может заглушить два, которые сильно поддерживают и
правильно предсказать . Решение использовать показанные значения было просто
на основе запуска программы с разными значениями, чтобы увидеть, что произведет
высочайшая точность. Дополнительные настройки, вероятно, принесут более высокие результаты.

На самом деле существует два набора оценок, один для контекстов слов.
и один для контекстов тегов. Из-за еще большего уклона в сторону
выставленные контекстами тегов, они не могут влиять на общую оценку
столько же, сколько контексты слов. Тем не менее, это не принципиально. Важнее,
представляется более важным даже не рассматривать контексты с одним тегом, поскольку они
обычно не очень предсказуемы. Ход, который я не сделал здесь, но
что может быть продуктивным, заключается в рассмотрении смешанных контекстов слов/тегов.

После того, как каждый контекст повлиял на партитуру, точка вставки передается
к фильтру, который проверяет, соответствует ли что-либо какому-либо высоко предсказуемому
элементы, такие как идиомы и определенные контексты, такие как «два слова
после статьи «год назад» (предсказывая почти
всегда). Если совпадение найдено, счет увеличивается или уменьшается на
определенную (обычно большую) сумму.

Затем точка вставки отправляется в единственную часть программы, которая
выходит за рамки местного контекста. Этот очень минимальный вклад в дискурс
поддерживает файл последних пяти встреченных существительных. Если статья в
после вопроса стоит какое-либо из этих существительных, его оценка уменьшается до
отражать вероятность второго упоминания существительного, встречающегося вместе с .
Эта часть программы была бы намного эффективнее, если бы знала, что
голова существительное была.

Последняя подпрограмма, через которую проходит точка вставки, вычисляет
средняя вероятность всех контекстов вместе. Он также отмечает максимальную
вероятность. В этот момент принимается решение, выбрать ли или .
или . и вставляются, если выполняется одно из следующих условий:

  1. счет больше десяти
  2. счет больше нуля, средняя вероятность больше
    0,3, а максимальная вероятность больше 0,6

Невыполнение одного или обоих этих критериев приводит к тому, что
вставлен.

Несмотря на то, что программа может показаться немного произвольной, она набрала 82,1%
точность по 3016 решениям о вставке из текстов, которые не использовались ни
ни тренировать, ни развивать. Это лучший подход к дереву решений K&C.
на несколько процентных пунктов и равняется их средней эффективности для прогнозирования
артикли существительных, для которых у них построено дерево. Мой метод может
уподобить демократическому решению, принятому гражданами с неравным весом
привязаны к своим голосам. Это неравенство компенсируется тем, что те
чьи голоса учитываются меньше, с большей вероятностью смогут отдать свои голоса.
И иногда (например, с идиомами) власть, которая должна подать голос, имеет преимущественную силу.
Все остальные.

Каждая из подпрограмм вносит небольшой вклад в целое. Принимая
вне фильтра снизил точность до 81,73%. Эта подпрограмма будет
гораздо более влиятельным, если бы оно знало, что такое главное существительное, и действительно имело
серьезная база данных для работы — на данный момент она не очень полная. Удаление
трекер недавних существительных дал 82,06%. Это еще менее существенно, т.
но эта подпрограмма была бы значительно усовершенствована, если бы знала, что такое головка
существительное было и если оно отслеживало все головных существительных, а не только те
в котором была статья. Без статистики вероятностей точность
снизился до 81,60%. Используя только статистику вероятностей, без
балл, выход 79,41%. И, наконец, удаление всех этих подпрограмм
и простое использование оценок, полученных в прямом контексте, дало точность
81,23%. Хотя отличия не велики, учитывая, что эти подпрограммы
не полностью разработаны, и все же удается повысить точность,
Я чувствую, что они могли бы быть очень важными, когда более широкая задача вставки
любая статья в любом месте предпринята попытка.

Следует сказать несколько слов о том, как учитывать вероятность успеха, такую ​​как
как «82,1%». Следует иметь в виду, что программа тренирует
и тестирует себя в Wall Street Journal. Попытка вставить статьи
в другие виды текстов, вероятно, приведет к значительному снижению точности.
иметь дело. Кроме того, несмотря на то, что влияние тегов на самом деле незначительно
в настоящее время, я думаю, их можно лучше использовать. Однако, предположительно
конечная цель состоит в том, чтобы иметь возможность обрабатывать необработанный текст, поэтому постредактор такой
так как этому придется ехать на задней части POS-теггера или, возможно, отказаться
роскошь тегов. Хороший базовый детектор словосочетаний был бы даже лучше.
полезно, и я подозреваю, что сброс тегов и использование словосочетаний с существительными
быть в конечном итоге более продуктивным.

Следует помнить еще о двух вещах. Во-первых, сообщается о точности
здесь немного неумолимо — вставка считается правильной, только если она
соответствует выбору автора. Тем не менее, во многих случаях это не имеет большого значения
используется ли тот или иной артикль. Это отражено в эксперименте
в котором люди набрали только 94-96% даже при получении полного текста.
Во-вторых, есть также много случаев, когда статья действительно важна.
в определении информации, передаваемой предложением. Учитывайте разницу
между

    Вчера я сел на автобус, и мы попали в аварию, потому что
    водитель был пьян.

    Вчера я сел на автобус, и мы попали в аварию, потому что и
    водитель был пьян.

В первом предложении мы знаем, что за рулем был водитель.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *