Меню

Восемь подходов к ИИ обработке на основе естественного языка

человек, держащий смартфон
Содержание

Поделиться этой страницей

Mike McNamara
376

В современном мире системы ИИ с поддержкой естественного языка – это не просто «приятное дополнение», это необходимость. По данным Gartner, «к 2024 году до 80 % брендовых цифровых впечатлений будет предоставляться через виртуальных людей».

Виртуальный собеседник на основе ИИ выходит далеко за рамки чатботов. Системы ИИ, обрабатывающие естественный язык, могу поддерживать диалог, похожий на человеческий, понимают контекст и предлагают интеллектуальные ответы за несколько миллисекунд. Проще говоря, обработка естественного языка — это компьютерная программа, которая понимает язык человека при обычной речи. Естественная обработка языка постоянно меняется — новые разработки в области технологий и постоянно меняющиеся стратегии позволяют уточнить модели обработки языка.

По данным Gartner существует восемь подходов к обработке естественного языка, см. статью: Gartner 2021. Стратегический сценарий действий для корпоративных ИИ: архитектура естественного языка,Энтони Маллен,Магнус Реван,Стивен Эммотт,Эрик Бретену,Берн Эллиот,Джессика Экхольм, 15 декабря 2020 года:

№ 1 Общие языковые модели или модели трансформации

В 2020 году многие поставщики начали использовать это новое революционное решение для обработки языка. Эти модели используются системами Insight, текстовыми аналитическими системами, системами генерации естественного языка (NLG) и системами искусственного интеллекта для общения во всех областях технологического процесса. Эти обобщенные языковые модели часто используются при использования заранее созданных моделей глубокого обучения (с триллионами параметров) для создания специализированных пользовательских моделей для отдельных отраслей и организаций. Примерами таких моделей являются BERT/Meena и GPT2/3.

№ 2 Межплатформенное ПО для виртуальных собеседников

Межплатформенное ПО позволяет использовать гибкое сочетание речевых и разговорных механизмов. Отделение базового механизма от его данных для обучения, а также разработка и интеграция режима диалога. Типичными механизмами, которые используют эти поставщики межплатформенного ПО, являются Amazon Lex, Microsoft Bot Framework, Google Dialogflow, IBM Watson и Rasa. (См. раздел Использование межплатформенного ПО для создания ИИ виртуальных собеседников, чат-ботов и виртуальных помощников).

№ 3 Расширение систем поиска и ведения диалога для вычислительных запросов

Большинство инструментов бизнес-аналитики предлагают какой-то вариант интерфейса для естественного языка для своей работы. Однако подход, используемый в большинства таких инструментов, нельзя назвать полностью разговорным. При этом улучшение вычислительных запросов идет гораздо быстрее. Последним перспективным инструментом является Google TAPAS, который использует обобщенные языковые модели для работы с табличным данным. Узнайте больше об эволюции бизнес-аналитики и естественного языка в отчете Конфликт миров: расширенная аналитика поглощает аналитику, бизнес-аналитику и интеллектуальную обработку данных.

№ 4 Модульные системы глубокого обучения и модули от поставщиков систем естественного языка

Крупные поставщики, такие как Alibaba, Oracle, IBM и Microsoft, разрабатывают возможности для работы с документами, речью, переводами и разговорными данными из общего стека моделей естественного языка и общих компонентов.

№ 5 Демократизация распространение естественного языка среди разработчиков-любителей

Независимо от того, речь идет о поиске или общении, многие поставщики улучшили режим «что видишь, то и получаешь» в инструментах для разработчиков-любителей и сделали нетехнические интерфейсы более доступными. Малокодовые и бескодовые инструменты проектирования доступны не только для диалога. Виртуальный собеседник — это лишь одна из многих вещей, которую могут создавать разработчики-любители без технических знаний. Сегодня малокодовые и бескодовые платформы предлагают не только проектирование диалогов, но и разработку RPA и приложений поиска, а также более стандартные элементы дизайна Web 2.0.

№ 6 Поставщики, предлагающие мультимодальные предложения и расширенные языковые модели для использования машинного зрения и перевода

Языковые сервисы развиваются, становясь все более мультимодальными, что улучшает естественное общение между людьми и машинами. Например, OpenStream предоставляет возможность одновременного общения с приложениями для картографирования и взаимодействия с ними. И Baidu Translate принимает сигналы не только от произнесенных слов, но и от визуальных объектов в видеосцене.

№ 7 Эволюция доступа к данным, управления метаданными и системами на основе графиков

В настоящее время в сфере распределенного управления данными и их обогащения используется Data Fabric. Она позволяет многократно используемые сервисы данных, конвейеры, семантические уровни и API-интерфейсы благодаря сочетанию разных подходов к интеграции данных. Кроме того, можно улучшить Data Fabric, добавив динамическое распознавание схем или даже оптимизацию с учетом затрат (см. раздел Демистификация Data Fabric).

№ 8 Разрабатывается набор инструментов и сервисов для проектов с естественным языком

Компании, занимающиеся маркировкой данных и аннотациями, все чаще использует сервисы текстовых и речевых аннотаций, а также машинного зрения. Переводческие фирмы управляют рабочими нагрузками, используя переводческие центры, в которых задействованы как сотрудники, так и компьютерные модели.

Подробнее

NetApp упрощает управление данными, чтобы вы могли сосредоточиться на применении ИИ. Мы предлагаем большую мощность для большего объема данных, большего количества ИИ и большей скорости. Решения NetApp® позволяют снизить риски и обеспечить доступ к данным там, где это необходимо. Решения NetApp® NLP устраняют узкие места в системах хранения на периферии, в ЦОД и в облаке, обеспечивая более эффективный сбор данных, ускорение рабочих для обработки естественного языка и более плавную интеграцию с облаком. Чтобы узнать больше, посетите главную страницу, посвященную ИИ и прочитайте наш блог о ИИ виртуальных собеседниках.

Mike McNamara

Майк МакНамара — старший руководитель по маркетингу продуктов и решений NetApp. Опыт работы в маркетинге управление данными и СХД составляет более 25 лет. Он пришел в компанию NetApp 10 лет назад. До этого работал в таких компаниях, как Adaptec, EMC и HP. Майк стал одним из лидеров, осуществивших запуск первого в отрасли унифицированного горизонтально масштабируемого облачного решение для искусственного интеллекта и машинного обучения (NetApp), унифицированной горизонтально масштабируемой гибридной облачной СХД и программного обеспечения к ней (NetApp), системы хранения данных iSCSI и SAS и по (Adaptec), а также СХД Fibre Channel (EMC CLARiiON). Ранее занимал должность председателя по маркетингу ассоциации Fibre Channel Industry Association (FCIA), сейчас является членом совещательного совета конференции Ethernet Technology Summit, членом Ethernet Alliance, автором множества статей в отраслевых журналах и частым докладчиком на конференциях. Также Майк опубликовал в издательстве FriesenPress книгу с названием «Горизонтально масштабируемая СХД — новый рубеж в управлении корпоративными данными» и вошел в список 50 лучших маркетологов B2B-продуктов, с которым можно посмотреть в Kapos.

Просмотреть все сообщения Mike McNamara

Дальнейшие шаги