Единствената БГ система за превод между 7 езика работи офлайн на GSM-и



Единствената българска система за машинен превод между 7 езика работи и офлайн на мобилни телефони, като заема само около 100MB от паметта на апарата, благодарение на езиковите технологии. Системата превежда между български, английски, френски, немски, италиански, испански и турски и има свои приложение за мобилни устройства за водещите платформи: Android, iOS и Windows Phone. Тя функционира на базата на над 10 000 езикови правила и не се нуждае от огромни по обем паралелни корпуси за статистически анализ, на каквито разчита например Google Translate, чиято офлайн версия се нуждае от около 10 пъти повече свободно място на телефона. Това обясни нейният създател Лъчезар Джаков, който е докторант в Секцията по компютърна лингвистика в Института за български език при БАН и участва в проекта „Интегриране на нови практики и знания в обучението по компютърна лингвистика“ по Оперативна програма „Развитие на човешките ресурси“, съфинансирана от Европейския социален фонд.

Системата може да се тества онлайн на адрес http://offline-translator.com/ 

В рамките на проекта днес се проведе първата международна научна конференция „Компютърната лингвистика в България“. Във форума взеха участие учени от Норвегия, Румъния, Сърбия, Словакия, Украйна, Франция и Чехия, които дискутираха с българските специалисти проблемите на практическото приложение на компютърната лингвистика в сферата на методите за обработка на езиците, машинния превод, създаването на електронни речници, изграждането на системи за поддръжка на електронни езикови ресурси и др. По време на конференцията се състоя и изложението „Езикови технологии“, на което български компании, разработващи софтуерни решения и приложения с помощта на компютърната лингвистика, показаха свои разработки, сред които онлайн система за опростяване на текстове в помощ на хора с аутизъм, системи за поддръжка на съдържание в интернет, интелигентно търсене в карти, оптимално пълнотекстово търсене, автоматичен анализ на мнението на потребителите за различни продукти и услуги и др.

В проекта „Интегриране на нови практики и знания в обучението по компютърна лингвистика“, който се изпълнява от Института за български език, участват над 25 изследователи – докторанти, постдокторанти, специализанти и млади учени. Младите учени получават възможност да разширят своите теоретични и практически познания, да участват в разрешаването на научни задачи и създаването на ресурси, които са изключително приложими в обучението по компютърна лингвистика, например интернет карта на българските диалекти с илюстрация на диалектните особености, система за автоматично разделяне на сложни изречения на прости изречения в български и английски, оптимизация и усъвършенстване на системата за търсене в корпуси и др. Членове и експерти по проекта участват и при подготовката и провеждането на Олимпиадите по лингвистика, част от които традиционно са и задачи по компютърна лингвистика.



Източник: 24 часа





Коментари

горе