Рефераты Дослідники автоматичного перекладу...

Вернуться в Кибернетика

Дослідники автоматичного перекладу...
Дослідники автоматичного перекладу...


Зміст:

Обчислювальні машини і переклад. В.Інгве 3

Модель синтаксичної структури російської фрази та алгоритм синтезу англійської при автоматичному перекладі. Д.М.Йєйтс. 7

“Мультістор” – система кореляційного аналізу для англійської мови. Е. фон Глаузерсфельд 12

Полуавтоматичний переклад з англійської на французьку мови: система “Людина – машинний тезаурус”. М.Мастерман 17

Обчислювальні машини і переклад. В.Інгве

Німецікий дослідник автоматичного перекладу Віктор Інгве вважав, що для подолання труднощів при перекладі треба ретельно вивчати морфологію та синтаксис відповідних мов, а також розробляти повний перелік елементарних одиниць кожної мови.

Опис мови повинен бути статичним, а програма для обчислювальної машини – динамічною. Тому В.Інгве пропонував, щоб дані про мовні факти вводилися в машину у вигляді переліків або таблиць – окремо від програми, що орієнтована на обробку цих даних. Такий розподіл є вдалим тому, що вже існують створені лінгвістами описи різних мов.

В своїй роботі по генерації англійських речень, він використовував традиційні методи опису мови. Зокрема для описів синтаксису була застосована модель безпосередньо складових (речення послідовно ділиться на все менші частини: спочатку виділяється група підмета та присудка, кожна з яких, в свою чергу, складається з двох або більше частин; ділення продовжується поки не дійдемо до слів або морфем).

В даній роботі опис мови подається в чотирьох таблицях і орієнтований на породження англійських фраз за допомогою універсальної обчислювальної машини. Машина породжує фразу, рухаючись від вузла до вузла. На кожному кроці є робочий вузол, який визначає наступний крок. Якщо робочий вузол зображений у вигляді кола, то це означає наявність декількох рівноправних альтернатив, і машина робить вибір за допомогою таблиці випадкових чисел. Якщо робочий вузол зображений у вигляді ромба, то наступний крок визначається однозначно. Якщо робочий вузол поданий у вигляді квадрату, то за наступний робочий вузол вибирається вузол, що розташований зліва під ним, а той, що справа – запам’ятовується. Якщо робочий вузол – трикутник, то принцип дії той же, що і з квадратом, але вузол, що запам’ятовується, використовується в більш пізніх перетвореннях. Кожне слово в прямокутнику – це слово фрази; після розміщення цього слова у тексті вибирається новий робочий вузол.

Багато фраз, які породжуються цією програмою безглузді, оскільки дана програма породжує тільки граматично, а не семантично правильні фрази. Проте вона є зручним засобом для перевірки точності лінгвістичного опису мови. Якщо деякі породжені фрази – граматично невірні, таблиці можна змінювати та виправляти. Якби ця програма була пристосована для перекладу, то вибір слів залежав би від перекладного тексту.

За допомогою цієї програми можна отримувати фрази будь-якої довжини. Це можливо тому, що вибір вузла може здійснюватися рекурсивно.

Починаючи породжувати яку-небудь двучленну конструкцію, програма повинна запам’ятовувати один вузол, для того щоб після породження першого члена конструкції, породити також і друкий. При цьому можуть бути отримані фрази великої довжини, і виникають значні вимоги до оперативної пам’яті комп’ютера.

Існують дві структури породження запам’ятованих вузлів. При регресивній структурі машина іде вниз по дереву, розгортаючи вузли, наприклад 1, 2, 3, 4 і запам’ятовуючи певну кількість вузлів; потім вона повинна повернутися, щоб розгорнути запам’ятовані вузли. Глибина регресивної структури дорівнює кількості запам’ятованих вузлів. При прогресивній структурі машина іде вниз по дереву, не повертаючись назад і записуючи на кожному кроці в оперативну пам’ять лише один вузол. Машина обробляє вузол на основній гілці дерева, потім приймається за запам’ятований вузол, а потім знову повертається до основної гілки. Отже, зростання глибини регресивної структури призводить до необхідності використання більшого об’єму пам’яті, тоді як прогресивна структура може мати довільний розмір і не вимагати при цьому збільшення об’єму пам’яті

10 
Добавить в Одноклассники    

 

Rambler's Top100