https://frosthead.com

Целующиеся языковые барьеры до свидания

В течение долгого времени универсальный переводчик был навязчивой идеей поп-культуры. Star Trek представляет его как портативный аппарат, напоминающий микрофон, который может сразу переводить большинство языков . Руководство Автостопом по Галактике может похвастаться вавилонской рыбой, существом, которое, застряв в ухе, предлагает мгновенный перевод любого языка в галактике.

Поэтому неудивительно, что современные люди пытаются создать устройство, которое работает так же хорошо. Существуют десятки переводческих приложений для смартфонов, но большинство переводит слова просто, один к одному; пользователь вводит или произносит слово, и приложение возвращается с переводом. Теперь цель и реальное денежное вознаграждение для инженеров и предпринимателей - дать возможность двум людям общаться на разных языках, в то время как небольшое устройство выплевывает переводы в режиме реального времени.

Существующие приложения для перевода

Во время поездки в Грецию англоязычный Эндрю Лаудер заболел.

«Я пошел в аптеку, и они не понимали по-английски, поэтому я не получил лекарств», - говорит Лаудер, генеральный директор Vocre Translate. Этикетки с наркотиками были для него буквально греческими. Языковые барьеры обычны для путешественников. В чужой стране мелкие сделки, такие как покупка лекарств или получение указаний - еще одна трудность, с которой столкнулся Лаудер, - становятся геркулесовыми задачами.

Когда он вернулся в США, Лаудер создал Vocre Translate, приложение для перевода голоса и текста. Он начинался как приложение для преобразования текста в текст (называемое MyLangauge), а затем первоначально трансформировалось в модель преобразования речи в текст, которая, как и другие приложения, в том числе SayHi Translate, использовала традиционную модель, в которой слово переводится непосредственно в другое слово. Скажите «Привет», и смартфон или планшет щебетает автоматическое «Привет». «До свидания» становится «Сайонара». И так далее, как переводчик текста.

Чтобы создать простой перевод аудио, создатели этих приложений нуждались в данных. Vocre извлек свою информацию из записей и документов общественного достояния, таких как старые фильмы или публичные слушания. «Мы в основном просили службу транскрипции голосовой почты, чтобы позволить нам использовать их облако для распознавания речи», - говорит генеральный директор SayHi Ли Боссье.

Получив аудио и текстовые данные, инженеры соединили аудио и текст слово в слово. Программа распознавания голоса распознает «сыр» и преобразует его в текст. Это переведено на французский язык, и приложение находит французское произношение «fromage».

Тем не менее, если пользователь дерзко называет что-то «глупым», переводчик работает не так хорошо, потому что разговорный язык не так статичен, как письменный язык. Каденция, сленг, интонация, произношение, диалект и разговорный поток могут изменить смысл

Однако со временем Лаудеру понадобилось более разговорное устройство. В электронном письме он говорит: «Основываясь на наших данных об использовании, мы обнаружили, что люди говорят совсем не так, как пишут. Произносимое слово гораздо более спонтанно, гораздо менее формально и буквально ». Поэтому он использовал статистический машинный перевод - подход, также используемый Google, который использует данные для поиска общего использования слова, отказываясь от традиционной модели перевода слова в слово. В основном, Vocre учится, как он используется. «Он учится на основе каждого разговора, каждой фразы, которая проходит через него. Это то, что со временем становится умнее », - говорит Лаудер.

Тем не менее, в настоящее время для перевода обоих приложений требуется несколько секунд, но они, без сомнения, эффективны, особенно в сочетании с языком тела, для транзакционных разговоров, таких как заказ еды. В конце концов, люди годами заказывают еду на не родных языках, и им всегда удается есть. Но они не смогли провести глубокие и сложные разговоры.

С Vocre и SayHi разговоры могут шататься, но это не то же самое, что общение на вашем родном языке. Google намерен полностью изменить это.

Подход Google (Статистический машинный перевод)

При изучении нового языка в школе мы начинаем с отдельных словарных терминов. Но язык более подвижный - слова нуждаются в контексте.

«Подход [Google] - это более общий подход», - говорит Джош Эстель, инженер-программист Google Translate. «Вместо того, чтобы пытаться жестко закодировать все эти правила, мы пытаемся изучить правила, глядя на данные».

Техническая компания избегает однозначного, дословного метода и вместо этого использует статистический машинный перевод, рассматривая не то, что означают слова, а то, как моделируется язык, который он изучает с помощью данных . Таким образом, он нацелен на лес, а не на деревья. Английский пример: мы знаем определения слов «разбить» и «вверх». Но фраза «разбить» не является буквальной комбинацией двух слов.

Статистический машинный перевод требует данных. Горы этого. Для того, чтобы метод работал, ему нужен не только тот факт, что «fromage» по-французски означает «сыр», но и 100 примеров использования «fromage» и сыра в реальных предложениях.

Эстель говорит, что если у говорящего на английском языке есть два меню, идентичных, за исключением того, что оно напечатано на английском, а другое на китайском, «вы, вероятно, можете выяснить, что означает китайский символ слова« суп ». Контекст - это король. Но для создания этого контекста вам необходим доступ к миллионам меню и любому другому документу, который только можно себе представить.

Что именно то, что есть у Google. Без веб-гиганта, собирающего кучу данных, настоящая вавилонская рыба не могла бы существовать. Он сканирует сеть и собирает все - текст и аудио. Затем он передает эти данные в алгоритмы, которые сравнивают все со всем остальным. Эти сравнения помогают понять, как работает язык.

«Одна вещь, которая удивляет людей, когда мы говорим о переводчике, это то, что в нашей команде нет лингвистов», - говорит Эстель. «Мы запустили 71 язык, и я бы сказал, что наша команда не знает, как говорить на подавляющем большинстве из них. Человек-переводчик не сможет выучить все эти термины и вещи так быстро, как наши [данные] могут узнать из Интернета ».

В чем смысл?

Как и Google, Facebook видит преимущества. Рассмотрим собственный набег сайта социальных сетей на перевод.

«Миссия Facebook заключалась в том, чтобы соединить весь мир, и одним из барьеров соединения мира является то, что не все говорят на одном языке», - говорит Том Стоки, технический директор Facebook. «Что касается перевода, я думаю, что действительно амбициозное видение будущего заключается в том, чтобы вы могли использовать Facebook на своем родном языке и взаимодействовать с любым другим языком».

В августе прошлого года Facebook приобрела Jibbigo, приложение для преобразования речи в речь, которое доступно для устройств Android и iOS.

Увлеченные пользователи Facebook заметят, что на социальном сайте уже есть какой-то перевод. Если у вас когда-нибудь был пост на испанском языке на вашей англоязычной странице, вам сразу же была предоставлена ​​возможность перевести его на ваш родной язык.

Но Стоки видит в голосовой составляющей потенциальный перелом в игре. Рост числа смартфонов и планшетов приветствует постоянно взаимосвязанный мир, а развитие программного обеспечения для распознавания речи приглашает новые средства веб-взаимодействия. Стоки предвидит будущее, в котором пользователи могут просто передавать команды своим смартфонам и взаимодействовать с другими пользователями, за исключением языковых различий.

«Вне всякого сомнения, это произойдет, потому что единственными ограничениями являются мощность языкового движка и, конечно, время обработки и вычислительная мощность», - говорит он.

Лаура Мерфи, профессор кафедры глобальных систем здравоохранения и развития в университете Тулэйн и признанный скептик-технолог, ставит под сомнение ценность универсального переводчика и не нуждается в знании более чем одного языка.

Она считает, что устройство может быть несколько полезным для путешествий, деловых и международных отношений, но не для новаторских. На определенном уровне у нас уже есть переводчики (люди), и большинство из тех, кто работает в сфере международных отношений, знают соответствующие языки. Устройство, считает Мерфи, может иметь негативные последствия.

«Я думаю, что это может сделать людей ленивыми», - говорит Мерфи. Перевод языков может быть сложным с умственной точки зрения, заставляя мозг, особенно тот, который знает более двух языков, работать по-другому, но, тем не менее, это полезно. Мозг тянет из места лингвистической эмпатии, которого никогда не сможет достичь даже самый лучший голосовой переводчик.

Хотя это универсальное общение может быть позитивным, признает Мерфи, «оно может привести к тому, что люди будут думать, что они общаются, когда они этого не делают». Культура не всегда полностью воплощена в языке (например, сарказм), а общение не является всегда о передаваемой информации.

Когда мы можем ожидать увидеть эту технологию?

«В 2005 году нам потребовалось 40 часов, чтобы перевести 1000 предложений», - говорит Эстель из Google. «Сегодня мы переводим эквивалент 1000 предложений каждые 10 миллисекунд».

Как сказал Ричард Андерсон в телесериале 1970-х годов « Человек за шесть миллионов долларов» : «У нас есть технологии». Теперь нам нужно дождаться сбора и анализа данных. По словам Эстель, сколько времени это займет, остается неизвестным. Но осторожные оценки дают такое устройство в наших руках в течение десятилетия.

Хотя создатели приложений, такие как Bossier, или такие гигантские компании, как Google и Facebook, не хотят создавать свои собственные версии Библейской Вавилонской башни, они хотят положить конец болтовне. Он представляет мир, в котором мы все общаемся, о медицине, о политике, об идеях.

И этот мир не может быть далеко.

Примечание редактора: мы обновили эту статью 4 апреля 2014 года, чтобы точно описать технологию Vocre Translate.

Целующиеся языковые барьеры до свидания