Одной из интересных лингвистических разработок нашего времени является Watson — суперкомпьютер, созданный компанией IBM. Свое название проект получил в честь основателя компании Томаса Дж. Уотсона (Thomas J. Watson).
Толчком для создания Watson послужила идея, зародившаяся в IBM в начале 2000-х годов — создать компьютерную систему, которая сможет выиграть у человека в шоу Jeopardy. Основным заданием этого телешоу является быстрый ответ на разнообразные вопросы из разных областей. Выиграть шоу у опытных участников было своеобразным современным аналогом прохождения теста Тьюринга, способным привлечь внимание публики. И в 2011 году, после пяти лет разработок, Watson действительно становится победителем шоу и выигрывает 77147 долларов США.
Watson является частью проекта DeepQA, он был изначально разработан исследовательской командой, которой руководил Девид Феруччи (David Ferrucci). Для создания Watson применяется программное обеспечение IBM DeepQA и инфраструктура Apache UIMA. Для работы суперкомпьютера используется 90 серверов IBM Power 750, каждый из которых использует 3,5 ГГц восьмиядерный процессор POWER7. Компьютер может обрабатывать 500 гигабайт информации в секунду.
Если машинных переводчиков и систем обработки данных существует уже большое количество и многие и них показывают хорошие результаты, то понимать нюансы и контекст произнесенного или написанного текста задача для компьютерных систем практически невыполнимая. Также непреодолимую трудность для машинных систем составляют принятые в определённом обществе или местности отклонения от литературного языка. Использование жаргонизмов, кроме того «живая» речь может обогащаться интонациями, понижением или повышением тона, что придаёт ей дополнительные смыслы. Ни один из таких нюансов не улавливается и не может быть использован машинными системами.
Но создатели Watson поставили перед собой именно такую задачу. Они намерены не просто научить компьютер распознавать письменную и устную речь, но и понимать её на высоком уровне, а также уметь свободно общаться на определённом языке, понимая задаваемые вопросы, находя нужную информацию для ответа. Эта компьютерная система разработана для того чтобы понимать разговорный «живой» язык. В ней использует когнитивный, обучающий подход к обработке информации.
Первым языком, на котором был запущен Watson, был английским. На сегодняшний день Watson свободно владеет девятью языками: английским, японским, испанским, французским, немецким, итальянским, португальским, арабским, корейским, Что означает — около двух миллиардов жителей Земли, носителей этих языков, уже теоретически могут свободно общаться друг с другом, преодолевая языковой барьер.
Изучение компьютером языка происходит по следующей схеме — система запоминает тысячи слов из словарей, новостных лент, художественных произведений и т.д. и формирует из них предложения, которые затем корректируются экспертами. После чего, на основе проанализированных структур, добавляются дополнительные объёмы словарного запаса. Но основное отличие от большинства переводчиков заключается в том, что Watson разрабатывается с целью понимать структуру языка, уметь оценить и выбрать наиболее подходящий вариант ответа, а не механически повторять типичные схемы.
То, как работает Watson, больше похоже на работу человеческого мозга, чем на работу привычных нам компьютерных систем. Это достигается путём сочетания процессов обработки естественного языка, с опорой на грамматику языка, культурный и смысловой контекст, и машинного обучения. Важным методом для понимания контекста речи является последовательно изучение системой различных областей, в которых язык может применяться — Watson отдельно изучает сферу страхования, патентования, написания новостей и так далее.
Применяется Watson в различных областях. При погружении в финансовую сферу проводилось сотрудничество с банками CaixaBank в Испании, Softbank в Японии и Bradesco в Бразилии, Watson усваивал различные финансовые термины и учился искать ответы на вопросы заданные, например, на испанском среди информации, размещённой на других языках. В будущем система сможет сама «разговаривать» с клиентами без посредничества сотрудников банков.
Также Watson уже применяется в сфере медицины. Его программное обеспечение используется в нью-йоркском Memorial Sloan Kettering Cancer Center для принятие решений в сфере лечения рака лёгких.
Подобное взаимодействие с клиентами, покупателями, потребителями услуг планируется развивать не только в сфере финансов и медицинских и здравоохранительных организациях, но и при любом общении продавцов и клиентов, в колл-центрах, при обучении языкам и другим знаниям детей и взрослых. То есть во всех сферах, где требуется поиск, анализ и извлечение информации для получения ответов на конкретные вопросы.
В конечной точке развития Watson сможет свободно оперировать всей доступной информацией на всех языках мира в любой области общения, отвечая на вопросы в любой даже сложной отрасли, не просто отыскивая информацию по ключевым словам, а понимая, что именно хочет узнать пользователь и находя такие данные. А кроме того суперкомпьютер сможет анализировать информацию и находить в данных закономерности и решения для задач, которые невозможно было решить ранее.
Читай также:
8 причин изучать иностранные языки
Интересные факты о языках
В каком языке больше всего звуков