Создание систем перевода с использованием возможностей искусственного интеллекта сегодня стало настоящим трендом. Такие компании как Google, Microsoft и Facebook проводят свои собственные разработки в этой области. Но пока машинный перевод не может сравниться с работой переводчика. Такие системы часто не учитывают контекст, не могут справиться с игрой слов и другими нюансами речи.
Решения для улучшения качества переводов предлагают многие разработчики. Одним из таких проектов стал онлайн-сервис переводов Flitto. Целью Flitto в настоящее время является предоставление другим компаниям языковых данных, необходимых им для обучения своих программ машинного перевода.
Основан проект был в 2012 году как платформа для краудсорсинга услуг перевода, штаб-квартира компании находится в Сеуле. Среди клиентов Flitto такие известные компании, как Baidu, Microsoft, Tencent, NTT DoCoMo и Научно-исследовательский институт электроники и телекоммуникаций Южной Кореи.
Основным источником дохода для проекта является продажа языковых данных. А именно корпусов текстов, которые уже были переведены людьми. За последние пять лет в проекте Flitto было накоплено более 100 миллионов образцов переведённых текстов. Покупатели заинтересованы в такого рода данных, так как собрать качественно переведённые тексты, содержащие сленг, отсылки к поп-культуре, диалектизмы и тому подобные детали достаточно трудоёмкое занятие.
Также разработчики могут воспользоваться и другими источниками корпусов текстов. Oxford University Press предоставляет доступ к корпусу английского языка Oxford English Corpus, а такие компании, как Microsoft и Google создали собственные корпуса текстов для обучения своих систем.
Создание корпусов текстов, которые обработаны профессиональными переводчиками, остаётся важной составляющей процесса разработки систем машинного перевода. На данный момент не придумано ещё способа, с помощью которого система могла бы самообучаться и развивать качество переводов без участия человека.
Читай также:
Смартфоны, планшеты и изучение иностранных языков
Будущее рынка систем машинного перевода
В 2021 году мы сможем переводить с языка дельфинов