Понимание живого человеческого языка машиной, распознавание контекстов, объектов, субъектов и фактов отношений между ними — одна из главнейших задач современной науки и одна из главных перспектив практического применения машинного обучения. И в этой области все двигается довольно быстро вперед (впрочем, как и с сопредельными областями ML).

Вчера Google выкатила целый открытый фреймворк на базе своей же открытой ML-библиотеки TensorFlow для парсинга естественного языка — SyntaxNet, доступный любому и каждому. В задачи системы, построенной с применением глубоких нейронных сетей, входит понять, о чем идет речь в предложении и максимально, насколько это возможно, без фактического знания окружающего мира, а располагая лишь текстовой информацией, снять все неоднозначности. То есть, вот это вот «казнить нельзя помиловать».

Фреймворк поставляется с уже натренированной моделью с благородным именем Parsey McParseface, работающей пока только с английским языком. В Google заявляют, что на данный момент это самый точный парсер естественного языка в мире, способный дать точность распознавания на уровне 96-97%, что уже сопоставимо с обычным человеком, читающим текст. Правда, для этого обрабатываемый материал должен быть правильно написанным и оформленным. Комменты из интернета со всеми вытекающими жаргонизмами, пофигистичным подходом к структуре предложений и пунктуации (да еще и с кучей ошибок) будут парситься с куда более низкой точностю (но это, конечно, просто дело времени и техники).

Пользователи фреймворка вольны натренировать свою модель, а не использовать готовую. Для русского языка — это опция по умолчанию, без вариантов. Попробую сегодня поковырять, очень интересно, что выйдет.


В разделах будущее, наука и технологии
Андрей Баксаляр  :: 13 апр 2015, в 21:03

Дела идут полным ходом. Компьютеры (точнее, нейросети на традиционном компьютерном железе) с огромной скоростью совершенствуются в этом навыке. Они все точнее и точнее распознают котиков, да и любые другие образы, на статических изображениях и в видеоматериалах.

Компьютерное зрение, типа

Любопытная цитата с Venturebeat, рассказывает Джефф Дин — эксперт по машинной когнитивистике из Google (перевожу небольшой кусочек, но рекомендую прочесть всю статью):

«Эволюция в этой области протекает очень быстро.

Например, в области систем автоматической классификации изображений, нейронные сети совершили огромный скачок вперед. В 2011 году, в ежегодном соревновании ImageNet, лучшим результатом для компьютерной нейросети стал средний показатель ошибочных распознаваний в 25,7 %. Доля ошибок снизилась до 16,4 % всего за один год (в 2012-м), тогда как в 2013-м году нейросети показали результат в 11,7 % ошибочных срабатываний. В 2014-м году показатель точности распознавания образов увеличился до 83,3 % (тогда как уровень ошибок снизился до минимальных 6,7 %). И вот, в январе текущего года китайская Baidu демонстрирует уровень в 6 %, тогда как в феврале Microsoft достигает 4,9 % степени точности, а в марте Google заявляет о достижении степени точности в 4,8 %».

Другими словами, если вы возьмете любую фотографию и «скормите» ее нейросети, то уже сегодня с вероятностью как минимум 95 %, компьютер «осознает», что именно (и кто) изображено на этой фотографии. А с такими темпами уже в ближайшем светлом будущем машины легко смогут ориентироваться в окружающем мире по одному только стереоизображению (а-ля Kinect), прямо как люди.

Войти через...


Это даст читателю возможность голоса, комментария, создания закладки, и даже написания поста, не говоря о множестве других мелких ништяков.

Популярное


Who Is America? 12 ноя 2018, в 22:23

Соациализируемся


Также найти меня можно в других злачных местах:

Все еще использую электронную почту:
andreybaksalyar@ya.ru