Как оказалось, машинный перевод можно оценивать не только по критерию качества результата, но и по уровню экологичности отдельных языковых пар.
На самом деле, связь между загрязнением окружающей среды и машинным переводом прямая – данные технологии активно используют вычислительные системы, потребляющие немало электроэнергии, при выработке которой неизбежны выбросы СО2. На это обратила внимание команда учёных из Технологического института Манипала (MIT Manipal) в Индии. По их мнению, энергия, используемая для обучения систем МП, «возможно, прямо или косвенно оказывает влияние на изменение климата».
Интересно, что они не только рассмотрели проблему в целом, но и провели исследования, показывающие, что уровень загрязнения зависит от языковой пары. В данном материале мы не будем вдаваться в подробности, уточним лишь, что в эксперименте задействовали 3 языка (английский, немецкий и французский) и сравнили приблизительные уровни загрязнения для каждой из 6 возможных языковых пар.
Была подтверждена гипотеза, согласно которой «перевод на немецкий может быть более сложным с вычислительной точки зрения, чем на французский или английский. Наиболее же сложным оказался перевод с французского на немецкий. Что же касается переводов на английский, то обучение обеих возможных языковых пар оказалось наименее энергозатратными. Не слишком затратной оказалась также и пара английский-французский. Возможно, что влияние на результат оказал состав корпусов текстов, применявшихся при обучении, и при иных наборах данных показатели могут быть несколько иными. В любом случае, работы в данном направлении будут продолжаться.
Конечно же, уровень выбросов СО2 при машинном переводе не настолько высок, чтобы на него в ближайшее время обратили внимание экологи. Тем не менее, исследования дают возможность посмотреть на проблему загрязнения окружающей среды под новым углом. Ведь подобные технологии, можно сказать, ещё только начинают набирать популярность, а значит и оставляемый ими углеродный след будет только увеличиваться.
Учёные сами признают, что им предстоит ещё немало работы в данном направлении. И призывают уделять больше внимания созданию способов, позволяющих «сократить уровень выброса СО2 при обучении и развёртывании систем машинного перевода, которые интенсивно обучаются на больших наборах данных». Они также обещают, что их последующие исследования не будут ограничиваться только европейскими языками с латинским алфавитом.
Читай также:
Будущее рынка систем машинного перевода
В Microsoft Translator добавлены новые языки
Zoom покупает разработчика технологии мгновенных переводов
Comments are closed, but trackbacks and pingbacks are open.