Традиційні системи перекладу нездатні зберегти природність розмовної мови, — експертка

Завдяки розвитку інтернету та технологіям, які не стоять на місці, під час активного онлайн-спілкування питання якісного машинного перекладу стає дедалі актуальнішим. Особливо гостро це стосується слов'янських мов, де традиційні системи перекладу часто дають незадовільні результати.

ВІДЕО ДНЯ

Найпопулярніші сьогодні системи перекладу — Google Translate, DeepL та Microsoft Translator — гарно справляються з формальними текстами, але часто «спотикаються» на розмовній мові.

«Головна проблема традиційних систем перекладу — це нездатність зберегти природність розмовної мови та культурний контекст», — говорить Senior Data Scientist Олена Сокол, яка представила інноваційне рішення, що кардинально змінює ситуацію в галузі машинного перекладу.

Зокрема, Сокол у своїй статті «Переклад слов’янських мов у розмовному стилі за допомогою великих мовних моделей» для журналу про інформтехнології та комп’ютерну інженерію пише, що нова система демонструє точність 95% при перекладі розмовних текстів, тоді як, наприклад, Google Translate досягає лише 85%, а DeepL — 88%. При цьому, у Microsoft Translator та Amazon Translate результати нижче 85%

«Наприклад, англійський вираз „it’s a piece of cake“ часто перекладається буквально як „це шматок торту“, втрачаючи справжній сенс — „це дуже просто“. Наша система вирішує це завдання завдяки використанню великих мовних моделей та спеціально розробленим методам prompt engineering», — пояснює Сокол, яка має 7-річний досвід у сфері машинного навчання та обробки природної мови (NLP).

РЕКЛАМА

Інноваційний підхід

За словами розробниці, цей метод базується на використанні великих мовних моделей (ChatGPT, Claude та Llama) для перекладу неформальних розмов слов'янськими мовами, оскільки вони, на відміну від традиційних перекладачів, краще розуміють природний потік розмови та контекст.

«Тестування проводиться на базі даних OpenSubtitles, який містить тексти сімох слов'янських мов та їхній правильний англійській переклад. Якість перекладу оцінюється за п'ятьма метриками (Text Correlation, Comet, TER, CHRF та TER metrics), а для оптимізації результатів використовуються спеціальні стратегії формування запитів (prompt engineering)», — пояснює розробниця.

РЕКЛАМА

Наразі система вже тестується в реальних умовах, демонструючи високу ефективність.

Зокрема, швидкість обробки повідомлень становить 4 секунди, що ідеально для перекладу в режимі реального часу. Точність збереження емоційного тону досягає 94%, переклад сленгу — 91%, а розуміння контексту — 89%. Ідея цього методу була успішно застосована у фінтех-компанії Paysera, де після налаштування під особливості фінансового спілкування допомогла на 40% швидше обробляти звернення клієнтів та втричі зменшити помилки через різниці в культурі та професійній лексиці.

«Система є практичним рішенням для бізнесу, яке допомагає покращити комунікацію в багатомовних середовищах», — говорить Сокол.

Впровадження такої системи надає бізнесу суттєві конкурентні переваги.

РЕКЛАМА

«По-перше, це значне скорочення витрат, адже дозволить зекономити на професійних перекладачах до 70%. По-друге, це прискорення бізнес-процесів, що скорочує час обробки звернень клієнтів у середньому на 40%. По-третє, це можливість розширити ринок, адже дає можливість ефективної комунікації з клієнтами з різних слов'янських країн без мовного бар'єру», — коментує розробниця.

За її словами, за допомогою цієї системи підвищиться якість обслуговування клієнтів, бо буде точне розуміння контексту (89%), коректний переклад сленгу (91%) та емоційного забарвлення повідомлень (94%).

«Система вже готова до інтеграції в бізнес-процеси та потребує мінімальних налаштувань для роботи з різними галузями», — додала розробниця.

Джерело

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *