Общество 
28.01.2015

«Если язык не вошел в iPad и iPhonе, он обречен»

На программу, которая будет автоматом переводить с русского на татарский, выделят 7 млн. рублей, 5 лет и 40 лингвистов

В Татарстане вскоре начнут разрабатывать систему машинного перевода с русского языка на татарский и наоборот (аналог Google Translate). Об этом вчера сообщил директор НИИ «Прикладная семиотика» Академии наук РТ Джавдет Сулейманов на круглом столе, посвященном современным лингвистическим технологиям. Проект будет реализовываться с новым резидентом казанского IT-парка ABBYY Language Services. Авторы проекта обещают, что в итоге производительность работы переводчиков повысится в 2 - 2,5 раза. Эксперты, опрошенные «БИЗНЕС Online», отметили, что о ценности проекта можно будет говорить после его завершения, по тому, насколько он будет качественно сделан.

КАК НАКОПИТЬ 100 МЛН. СЛОВОФОРМ

В Татарстане вскоре начнут разрабатывать систему машинного перевода с русского языка на татарский, и наоборот (аналог Google Тranslate). Об этом вчера сообщил директор НИИ «Прикладная семиотика» Академии наук РТ Джавдет Сулейманов на круглом столе, посвященном современным лингвистическим технологиям.

— Правительственный документооборот должен вестись на двух языках, поэтому нам необходимо максимально оптимизировать процесс перевода, — заявил Сулейманов.

Согласно идее проекта, до 2020 года будет собираться необходимая для запуска грамотного машинного перевода словарная база из 100 млн. словоформ. Пополнять базу будут переводчики министерств и ведомств путем «общего накапливания материала». Таким образом, на протяжении пяти лет лингвисты выступят в роли разработчиков проекта.

Для внедрения машинного татарско-русского перевода была выбрана российская лингвистическая компания ABBYY Language Services, с которой, по словам Сулейманова, у Академии наук РТ очень давние связи. ABBYY обеспечила поддержку многоязычного центра на Универсиаде в 2013 году, а также участвовала в создании одного из русско-татарских словарей. В январе этого года компания стала еще и резидентом казанского IT-парка.

— Машинный перевод никогда не заменит переводчика, человеческий ресурс никогда не уступит электронному переводу. Но эта программа призвана оптимизировать работу и сделать ее более качественной, — сказала руководитель отдела продаж технологий компании ABBYY Алсу Бикбаева.

Скорость работы при обращении к программе увеличивается в 1,5 - 2 раза, на 99% происходит предотвращение терминологических ошибок, в целом же производительность работы повышается в 2 - 2,5 раза, привела подсчеты Бикбаева. Для запуска системы машинного перевода потребуется около 4 - 5 лет и около 40 профессиональных лингвистов-переводчиков из Татарстана, которые станут активными пользователями программы, накапливая базу и получая преимущества в своей работе.

Генеральный директор ABBYY Language Services Иван Смольников не стал раскрывать стоимость затрат на создание программы. Сулейманов сообщил, что предварительно планируется потратить на работу в этом году около 7 млн. рублей. Проект реализуется в рамках госпрограммы «Сохранение, изучение и развитие государственных языков РТ», которая также включает в себя внедрение татарско-английских словарей, увеличение количества поддерживающих татарский язык платформ, разработку мобильных приложений и др.

— Если язык не станет языком мобильных разработок и не будет использоваться на iPad и iPhonе или других мобильных устройствах, он, каким бы красивым ни был, обречен, — с долей юмора заявил Сулеймманов.

Бикбаева уточнила, что у каждого ведомства, участвующего в проекте, будет создана своя собственная, отдельная база накопления. Это необходимо для того, чтобы терминология, использованная тем или иным ведомством, была систематизирована и не путала остальных пользователей. Еще важный момент — программа накопления базы является сетевой, то есть в процессе работы над документом переводчик может обратиться не только к своему словарю, но и к словарю, например, своего руководителя. Кроме того, при обнаружении в тексте идентичных словосочетаний, программа переводит их автоматически, что актуально для отчетов, где меняются только цифры. Также в процессе формирования базы будут использоваться архивные документы, которые были сделаны ранее.

ЭТОТ ПРОДУКТ СПЛОТИТ НАШЕ СООБЩЕСТВО

Эксперты, опрошенные «БИЗНЕС Online», отметили, что о ценности проекта можно будет говорить после его завершения, насколько он будет качественно сделан.

Сергей Щиголев — заведующий сектором переводов управления государственного протокола президента РТ:

— Если говорить о программе, я считаю, что она будет очень полезной, хотя аналогичные проекты уже разрабатывались. Эта программа хоть и интересная, но больших особенностей я у нее не заметил. Правда, что здесь можно придумать нового? Лишь бы хорошо и качественно работало. Для меня очень важно, чтобы база была богатой, содержала все необходимые слова и словосочетания, имела ссылки на примеры, в которых данные слова могут использоваться. Но самое главное, чтобы в ней работали именно носители языка, так называемые «окончательные корректоры».

Алсу Галимова — переводчик:

— На протяжении пяти лет я занималась переводом официальных документов и новостной ленты. И могу сказать, что это очень-очень хороший продукт, он еще больше сплотит наше сообщество переводчиков, работающих как в области перевода официальных документов, так и перевода в целом. Мы, наконец-то, сможем обмениваться опытом, аккумулируя его в одном месте. Вообще, машинный перевод — это огромный шаг в автоматизации русско-татарского перевода, аналогов такой системы у нас нет. Это будет первый такой продукт. Разумеется, я буду обращаться к машинному переводу, но в первую очередь мне бы очень хотелось поучаствовать в разработке этого продукта.

Печать
Нашли ошибку в тексте?
Выделите ее и нажмите Ctrl + Enter
Комментарии (46) Обновить комментарииОбновить комментарии
  • Анонимно
    28.01.2015 08:39

    единственный Институт, который мог бы выполнить эту задачу дешевле и в годичный срок - это Институт информатики АН РТ, но Академия наук Республики Татарстан сама разгромила его: началось с "легкой" руки Мазгарова (незаконно, уволив директора Аблаева Ф.М. и назначив и.о.директора Назмеева М.М., который уволил 50 человек из 60 работающих сотрудников) и добила рукой Салахова...

    • Анонимно
      29.01.2015 21:41

      Согласен с Вами, Дж.Сулейманов лет 30 уже осваивает различные государственные деньги в миллионных суммах, но никаких видимых результатов не предъявляет. Вот и сейчас обещает результат через 5 лет. Он давно уже практикует принцип Хаджи Насретдина: "через пять лет либо падишах умрет, либо ишак окочурится". Деструктивная деятельность Мазгарова на посту президента АНТ просто ужасает, окружив себя кумовьями, друзьями-приятелями, он уничтожал успешные научные структуры и создавал синекуры своим фаворитам вроде "Института семиотики". Похоже, и Салахов не намерен менять сложившуюся ситуацию, пока он демонстрирует только имитацию деятельности. Что касается переводческой практики в сфере татарского языка, то о ее качестве можно судить по многочисленным ошибкам и корявым оборотам на вывесках, в объявлениях на транспорте и т.д. На днях в Минкульте РТ обсуждали "Государственную программу сохранения идентичности татарского народа", ну хоть бы кто-нибудь выступил на татарском языке. Вот так у нас сохраняют национальную идентичность.

  • Анонимно
    28.01.2015 08:53

    нет других забот...татарский виндоуз уже проходили...

    • Анонимно
      28.01.2015 09:01

      Не нравится, не пользуйся. А нам это надо.

      • Анонимно
        28.01.2015 15:32

        если вы с русского на татарский без айфона перевести не умеете, вам учиться надо, а не кнопки тыкать.

  • Анонимно
    28.01.2015 09:06

    Зачем в кризис тратить деньги и переводить на татарский язык? Понятно что татарский язык государственный язык РТ, но все-равно в деловой сфере все будут работать с русскоязычными версиями. Постоянно придется проверять нет ли ошибок в переводе.

  • Анонимно
    28.01.2015 09:16

    Ну не появиться от этого татарская кибернетика и космическая промышленность! Зачем такие потуги?

  • Анонимно
    28.01.2015 09:25

    А не повторит ли этот проект судьбу проекта Татар иле? Помните? Соцсеть, энциклопедии и т.п. А в итоге не один миллион в никуда. Зачем что-то изобретать? Google по любому скоро разработает и для татарского языка переводчик.

    • Анонимно
      28.01.2015 10:37

      Азат Д

      Правильно. Надо в целом уровень поднимать, чтобы к нам тянулись. Например делать высококлассные самолёты востребованные во всем мире, а документацию к нему на татарском. Быстро выучат кому надо и переводчик сами сделают. А то мы только со своим туземным сабантуем по всему муру как затычка лезем, повеселили как цыгане и давайдосвиданья.

    • Анонимно
      29.01.2015 21:47

      \\А не повторит ли этот проект судьбу проекта Татар иле?\\ - Монопольным правом правом на проект "Татар иле" завладел мошенник от IT-технологий (он зарегистрировал проект на свое частное имя). При этом чувак умудряется безостановочно сосать бюджетные деньги. Ловкач, на его век государственных лохов хватит.

  • Анонимно
    28.01.2015 09:26

    Проект, который просто хочет ОСВОИТЬ деньги якобы для сохранения языка. Ну ну!

  • Анонимно
    28.01.2015 09:29

    да кому он нужен? татарский для татарстана, никогда он не станет пупом земли.Просто переовдят деньги. Потратили бы на что нибудь хорошее.

  • Анонимно
    28.01.2015 09:45

    Ежегодно Россия тратит на русский язык миллиарды рублей налогоплательщиков, в т.ч. татарских и других народов России. Поэтому непонятны здесь какие-то вбросы в комментариях.

    • Анонимно
      28.01.2015 14:57

      Недостаточно этих средств к сожалению! Посмотрите на текст своего комментария и посчитайте свои ошибки.

      • Анонимно
        28.01.2015 20:23

        Обязательно надо увеличивать присутствие татарского языка в Казани. Почему нет рекламы на татарском?

  • florit
    28.01.2015 09:52

    Совсем маленькое финансирование для такого нужного проекта.

  • Анонимно
    28.01.2015 09:55

    Когда случшего МИНИСТРА образования РТ на русском языке понимаешь что такие проекты нужны!!

  • sfcpress
    28.01.2015 10:03

    не легче ли заплатить гуглу за татарские словари, деньги все равно в Татарстан вернутся, вряд ли индусы смогут быстро разобраться в тат.яз. особенно синтез голоса. Смешно, что регион-лидер по IT до сих пор не сделал нормальных языковых инструментов для родного языка. Словари есть, но сделать дом. раб. по тат.яз по ним практически невозможно.

  • Анонимно
    28.01.2015 10:21

    При всем моем уважении к патриотам, татарский обречен на положение периферийного, вымирающего. Культурное пространство русского, а тем более английского языка больше. Как планета с большей массой притягивает в свою орбиту мелкие спутники, так и "крупные" языки (то есть те языки, на которых говорят бОльшие экономики) поглощают мелкие. В Венгрию приедешь, там повсюду немецкий язык, в Харькове - говорят по русски все без проблем, АББА пела по английски...Вы не кипятитесь, но приложение для айпада ничего не исправит. Прекратите распил бюджета, господа.А.Д. (этнический татарин)

    • Анонимно
      28.01.2015 11:26

      Когда-то о языках Средней Азии тоже также говорили. Теперь в Узбекистане молодежь почти не знает русский, в Казахстане - тоже стараются говорить на своем казахском.

      • Анонимно
        28.01.2015 15:48

        а вы не сравнивайте независимые страны с одним из заурядных российских регионов, где даже нефти нормальной нет, одна некондиция

        • Анонимно
          28.01.2015 19:53

          То есть регион донор для вас это заурядный регион. Что же тогда для вас не заурядный регион?

      • Анонимно
        28.01.2015 21:34

        да ладно, из этих регионов народ едет работать в РФ, они без русского языка денег заработать не смогут). тем более сейчас гастерам экзамен нужно сдавать по русскому языку, иначе их не пустят в РФ.

    • Анонимно
      28.01.2015 12:00

      Есть еще тюркоязычное пространство. В данном пространстве татарский язык совсем не в периферии. В союзе с турками мы создадим свое тюркоязычное пространство, к которой будут тянуться остальные тюркоязычные народы.

      • Анонимно
        28.01.2015 13:22

        Не забывайте еще о татарах Финляндии, Австралии, США, которые прекрасно знают свой язык.

  • Анонимно
    28.01.2015 10:25

    только не давайте школьникам - вообще облениться можно)))

  • Анонимно
    28.01.2015 10:48

    Один такой проект делает для сохранения и развития татарского языка больше, чем все Сабантуи и фестивали, проводимые черт знает где. Проникновение татарского языка в IT означает потенциальную возможность его развития. Не говоря уже о возможности сохранения огромного культурного наследия на татарском языке.7 млн. для подобного проекта - это чуть ли не смешно, когда вся программа по сохранению языков РТ, наверное стоит десятки или сотни миллионов.А тем, кто отводит татарскому языку затухание на периферии, отвечу так. Когда-то и английский и русский и немецкий были периферийными. История меряет веками, а "умные" комментаторы судят максимум по 25 годам. Аберрация близости, понимаешь ли... Ну еще и оправдать себя, не знающего родной язык, надо.Так что команда Сулейманова делает дело на века, утихомирьтесь и найдите способ помочь!

    • Анонимно
      29.01.2015 15:56

      7 миллионов планируется потрать только в этом году, программа рассчитана до 2020 года т.е. в итоге 7*5= 35 миллионов рублей это уже колоссальная сумма для проекта с сомнительным эффектом!!! Предлагаю на эту сумму распечатать качественные русско-татарские разговорники и раздавать их всем гостям нашей республики, эффект виден будет сразу тем более, что за 7 миллионов каждый год можно по 14 миллинов разговорников печатать!

  • Анонимно
    28.01.2015 11:13

    Давно пора надо было уже реализовать подобный проект. Есть примеры в мире, когда язык был в шаге от исчезновения, но в итоге энтузиазм представителей данного народа смог его возродить. Татары, не будьте манкуртами, будьте татарами не только этнически, но и по самосознанию. От нас во многом зависит будущее нации.

  • Анонимно
    28.01.2015 12:01

    Ура! Очень полезная штука! Вот бы реально еще татарский шрифт появился в яблочных устройствах!

  • Анонимно
    28.01.2015 13:00

    Надо татарский Гугл переводчик , остальное - периферия

  • Анонимно
    28.01.2015 14:32

    Идея хорошая, но боюсь Сулейманов снова все сэльет. Главное бюджет

    • Анонимно
      28.01.2015 14:46

      Уже столько словарей и переводчиков татарских делали за бюджетные деньги, а народ так ничего и не увидел. Есть только один общедоступный http://suzlek.tatarstan.ru/

      • Анонимно
        28.01.2015 15:36

        словарь и переводчик - это разные вещи.

      • Анонимно
        28.01.2015 23:00

        Вот татарский Словарь для iPhone https://appsto.re/ru/e4Mm1.i
        Сделали сами и бесплатно для народа. Более 10к скачиваний уже.

    • Анонимно
      28.01.2015 14:55

      отличная идея влезть в бюджет

      • Анонимно
        28.01.2015 16:23

        А как можно что-то сделать для поддержки тат.языка без влезания в бюджет?

        • Анонимно
          28.01.2015 21:36

          без влезания в гос.бюджет -это вообще ни кому не интересно)

  • Анонимно
    28.01.2015 22:59

    Татарский язык через два поколения вообще исчезнет.

  • Анонимно
    29.01.2015 08:11

    Пусть разрабатывают.Очень канительная работа. Когда ждать результат?

  • Анонимно
    29.01.2015 11:32

    Уверен, что этот проект окажется пустышкой. Не нужно вкладывать деньги народа на закрытые проекты, а необходимо развивать открытые проекты, где УЖЕ идет активная работа, например, проектыhttp://etatar.ru/top/41598http://wiki.apertium.org/wiki/Tatar

  • Анонимно
    29.01.2015 12:32

    Уже есть проект, развиваемый Google и Apertium: http://wiki.apertium.org/wiki/Tatar_and_Russianhttp://wiki.apertium.org/wiki/Tatar_and_Russian

  • smr
    29.01.2015 21:32

    Создайте терминологическую базу языка сначала.

Оставить комментарий
Анонимно
Все комментарии публикуются только после модерации с задержкой 2-10 минут. Редакция оставляет за собой право отказать в публикации вашего комментария. Правила модерирования
[ x ]

Зарегистрируйтесь на сайте БИЗНЕС Online!

Это даст возможность:

Регистрация

Помогите мне вспомнить пароль