10
дни
10
часы














Как работает искусственный интеллект? Часть 2

30.03.2018, Nota Bene
В прошлый раз мы писали о методах машинного обучения и принципе работы нейросетей. Продолжаем тему.
 
Какие бывают сети?

Сегодня существует несколько десятков нейросетей различной архитектуры. Они различаются по количеству и порядку слоев и взаимодействию нейронов, которые используются для разных задач. При анализе изображений используются так называемые сверточные нейросети: на каждом слое изображение уменьшается, и в итоге последние слои видят его целиком. В процессе обучения нейронная сеть с помощью подбора значений своих параметров пытается сформировать уникальное представление лица каждого человека, на которое не должны влиять ориентация его головы в пространстве, наличие или отсутствие бороды или макияжа, факторы освещения, возрастные изменения.

Для распознавания текста используются рекуррентные сети, способные возвращаться на предыдущий слой. Значение слова зависит от контекста. Такие же сети преобразовывают речь в текст – они должны запоминать, какие звуки были распознаны раньше, чтобы сложить их в слова. Для распознавания речи нейросеть должна обучиться на сотне часов разных дикторов, чтобы учитывать варианты произнесения одних и тех же звуков разными людьми и в разных условиях. Звук разбивается на кусочки по 10–20 миллисекунд, для каждого из которых составляется гипотеза, что это может быть за звук. Чем дольше фрагмент распознаваемой записи, тем больше вероятность учесть не только связи между звуками в слове, но и грамматические связи в предложении, тематику и стиль речи.

А вот синтез речи проще, поскольку на вход подаются «идеальные» данные без помех. Хотя задача в целом похожа – нейросеть должна подобрать лучшие сочетания звуков (фонем) между собой, чтобы речь была плавной. Похожим образом работает синтез музыкальных произведений: нейросеть обучается на примерах гармоничного звучания и различных стилях музыки, после чего может синтезировать мелодии в стиле Баха или Чайковского.

Для текстовой аналитики может использоваться несколько нейросетей. Например, в огромном количестве документов нужно выявить контракты, которые могут повлечь риски для компании. Одна сеть будет извлекать из текстов сущности, другая – связи между ними, третья – находить взаимосвязи, которые будут определять, какие из них несут риски для компании. Эти нейросети могут работать последовательно или параллельно, результаты работы одной сети могут становиться входными данными для другой, чтобы улучшать результат обучения.

Практика распознавания

Нейросети могут применяться как для решения бизнес-задач, так и для развлекательных целей, и ярким примером тому служит популярное приложение для обработки фотографий с помощью художественных стилей Prisma. Сейчас разработчик Prisma – стартап Prisma Labs – предлагает свои наработки в области нейросетей и компьютерного зрения корпоративным клиентам. Средняя стоимость годовой лицензии на использование технологий составляет 100 000 дол. Например, технологию портретной сегментации, которая отделяет изображение человека от фона в режиме реального времени, использует бразильская компания, производящая оборудование биометрической идентификации для правительственных структур и банков. Компания планирует продавать по 10 000 устройств в год, и технология должна затронуть миллионы человек в Бразилии.

Идентификация пользователей с помощью нейросетей сегодня активно используется в банковской сфере – например, банк «Открытие» в декабре прошлого года запустил переводы через приложение с идентификацией по фотографии, и ежемесячный оборот переводов увеличился примерно на четверть. Хотя таким образом клиенты переводят небольшие суммы в пределах 5000 руб. А распознавание клиентов по фотографии при обращении за кредитами позволило рынку за два года предотвратить выдачу более 4,5 млрд руб. потенциально мошеннических кредитов. К сервису «Эквифакс FPS.Bio» на базе решения VisionLabs подключены несколько десятков банков. Для выявления мошенников сервис использует фотографии из баз всех банков-участников.

Распознавание лиц применяется и в области безопасности. Благодаря решению Vocord (разработчик систем распознавания) на выставке Expo-2017 в Астане удалось за неделю поймать 12 человек, разыскивавшихся полицией. Совместное решение Vocord и стартапа Timebook (сервис учета рабочего времени) используется для контроля сотрудников в супермаркетах «Лента» и «М.видео». Система сочетает идентификацию по магнитной карточке и по привязанному к ней изображению сотрудника. Специальное оборудование фотографирует его в начале и в конце смены и подтверждает, что карточку приложил именно этот человек. Это решение позволяет бороться с опозданиями, прогулами, преждевременным уходом сотрудников и тем самым экономить до 3% от фонда оплаты труда ретейлеров.

Топливо для алгоритма

Одной из причин бурного развития нейросетей и машинного обучения является появление в свободном доступе огромного количества цифровых данных, доступных для обработки. Большие данные необходимы для обучения нейронных сетей – эту взаимосвязь можно сравнить с двигателем и топливом.

Рынок данных начал развиваться именно в интернете, где все данные изначально были цифровыми, но сейчас реальный взлет этого сектора завершился: интернет-данные собраны, и никто не собирается ими делиться. Но в других отраслях (промышленность, предсказательное техобслуживание, медицина, налоговая и бухгалтерская сфера) данные еще оцифровываются, и именно в них ожидаются прорывы. Например, недавно авиакомпания S7 сообщила, что разработала пилотную систему предиктивного техобслуживания для самолетов Airbus A319 и до конца года подключит к ней значительную часть парка. Система анализирует исторические данные по техобслуживанию и позволяет прогнозировать возможные дефекты каждого самолета заранее. Это должно снизить количество задержек вылетов по техническим причинам.

Основной эффект от применения этих технологий состоит в том, что процессы становятся быстрее, качественнее и дешевле, и клиент сразу замечает эти улучшения.
Vedomosti.ru
 
Поделиться


Статьи по теме

Как работает искусственный интеллект?

13.03.2018, Nota Bene
Искусственный интеллект не способен работать без больших данных.
 

О влиянии «умных» технологий на ретейл

28.02.2018, Nota Bene
Ретейлерам больше нельзя взаимодействовать с покупателем по-старому: им приходится постоянно инвестировать в инновационные технологии, при этом успеха никто не гарантирует, ибо все новое нуждается в обкатке.

Продукты придут к покупателю сами

13.10.2017, Nota Bene
Основатель проекта Maxitube Максим Зябкин придумал, как избавить москвичей от утомительных очередей и бесконечного созвона с плохо ориентирующимися на местности курьерами. 
Популярное

Объем сделок на рынке складов Московского региона вырос – Knight Frank

По итогам I квартала 2018 г. общий объем сделок по аренде и продаже качественных складских площадей вырос по сравнению с аналогичным периодом прошлого года на 65% и составил около 420 тыс. кв. м, говорится в исследовании компании Knight Frank.

Офисы Москвы: итоги I квартала от ILM

Эксперты компании ILM представили обзор рынка офисной недвижимости Москвы по итогам I квартала 2018 г.
 

Как сделать современные ТЦ безопасными?

Шимон Матковски, партнер и главный архитектор Blank Architects
 
 
Подписка на рассылки Impress Media

Введите, пожалуйста, свой e-mail

Email *
Ваше имя
Другие проекты издательского дома
© 1998—2018  Impress Media