Menu

Otto approcci all'elaborazione dell'AI con riconoscimento del linguaggio naturale

Una persona con in mano uno smartphone
Table of Contents

Share this page

Mike McNamara
164

Nel mondo di oggi, l'AI con riconoscimento del linguaggio naturale non è un optional, ma una necessità. Secondo Gartner, "entro il 2024, fino al 80% delle esperienze digitali brandizzate verranno distribuite ai consumatori tramite persone virtuali".

L'intelligenza artificiale conversazionale va ben oltre i chatbot. I sistemi di intelligenza artificiale che elaborano il linguaggio naturale intrattengono dialoghi simili a quelli degli esseri umani, comprendono il contesto e offrono risposte intelligenti in millisecondi. In poche parole, l'elaborazione del linguaggio naturale è un programma per computer in grado di comprendere il linguaggio parlato dagli esseri umani. L'elaborazione del linguaggio naturale sta cambiando continuamente: i nuovi sviluppi tecnologici e le strategie in continua evoluzione perfezionano il modo in cui l'AI elabora il linguaggio.

Gartner ha elencato otto approcci all'elaborazione del linguaggio naturale nella sua Gartner 2021 Strategic Roadmap for Enterprise AI: Natural Language Architecture, Anthony Mullen, Magnus Revang, Stephen Emmott, Erick Brethenoux, Bern Elliot, Jessica Ekholm, 15 dicembre 2020:

N. 1 - Modelli linguistici o di trasformatori generici

Nel 2020, molti vendor hanno incorporato questo nuovo straordinario approccio all'elaborazione delle lingue. I modelli sono utilizzati per i motori di insight, l'analisi del testo, la generazione del linguaggio naturale (NLG - Natural Language Generation) e l'AI conversazionale in tutte le aree del workflow della tecnologia del linguaggio naturale. Questi modelli linguistici generici vengono spesso utilizzati con l'apprendimento del trasferimento per sfruttare modelli di deep learning precostruiti (con trilioni di parametri) allo scopo di creare modelli personalizzati per settori e organizzazioni. Esempi di questi modelli includono BERT/Meena e GPT2/3.

N. 2 - Middleware conversazionale

Questo middleware consente di utilizzare una combinazione flessibile di motori di riconoscimento vocale e di conversazione, separando il motore sottostante dai dati di training e dalla progettazione e integrazione dei dialoghi. I tipici motori utilizzati da questi vendor di middleware sono Amazon Lex, Microsoft Bot Framework, Google Dialogflow, IBM Watson e Rasa. (Vedere Using Conversational AI Middleware to Build Chatbots and Virtual Assistants).

Numero 3 - Estensione della ricerca e della conversazione alle query di calcolo

La maggior parte dei tool di business intelligence (BI) offre una sorta di interfaccia linguistica naturale per le operazioni che svolge. Ma l'approccio della maggior parte di essi non è completamente conversazionale. Tuttavia, le query di calcolo stanno migliorando rapidamente. L'ultimo tool promettente è Google TAPAS, che utilizza modelli di linguaggio generici per accedere ai dati tabulari. Scopri di più sull'evoluzione della BI e del linguaggio naturale in questo report: Worlds Collide as Augmented Analytics Draws Analytics, BI and Data Science Together.

N. 4 - Moduli e stack modulari di deep learning dei vendor NL

I vendor più prestigiosi come Alibaba, Oracle, IBM e Microsoft stanno sviluppando funzionalità per la documentazione, la voce, le traduzione e le conversazioni da uno stack condiviso di modelli NL e componenti comuni.

N. 5 - Democratizzazione dello sviluppo delle esperienze di linguaggio naturale per i non esperti

Che si tratti di ricerca o conversazione, molti vendor hanno migliorato il WYSIWYG dei propri strumenti per sviluppatori non esperti e reso le interfacce non tecniche più accessibili. Gli strumenti di progettazione a uso limitato di codice e senza codice offrono molto più di semplici dialoghi. Il dialogo conversazionale è solo una delle tante cose che gli sviluppatori non esperti possono progettare anche senza conoscenze tecniche. Oggi, le piattaforme a uso limitato di codice e senza codice spesso integrano non solo funzionalità di progettazione dei dialoghi, ma anche di sviluppo di applicazioni RPA e di ricerca, oltre a elementi di progettazione Web 2.0 standard.

N. 6 - Vendor con offerte multimodali che estendono i modelli linguistici per includere la computer vision e la traduzione

I servizi linguistici stanno diventando più multimodali e questo consente una comunicazione ricca e naturale tra persone e macchine. Ad esempio, Openstream offre la possibilità di parlare e interagire contemporaneamente con le applicazioni di mappatura. Baidu Translate prende spunto non solo dalle parole pronunciate, ma dagli oggetti visivi in una scena video.

N. 7 - Evoluzione dell'accesso ai dati, della gestione dei metadati e dei sistemi basati su grafici

Oggi lo stato dell'arte nella gestione e nell'arricchimento dei dati distribuiti è rappresentato dal data fabric. Il data fabric può fornire servizi dati riutilizzabili, pipeline, tier semantici e API grazie ad una combinazione di approcci di integrazione dei dati. È possibile migliorare ulteriormente i data fabric aggiungendo il riconoscimento dinamico degli schemi o persino l'ottimizzazione basata sui costi (vedere Demystifying the Data Fabric).

N.8 - Una pipeline emergente di strumenti e servizi per i progetti NL

Le aziende di annotazione ed etichettatura dei dati supportano sempre più servizi di annotazione di testo, voce e documenti, insieme alla loro computer vision. Le società di traduzione gestiscono i carichi di lavoro utilizzando hub di traduzione costituiti sia da modelli che da persone.

Scopri di più

NetApp semplifica la gestione dei dati in modo che tu possa concentrarti sulla scienza dell'AI. Offriamo più potenza, più dati, più AI, ad una velocità superiore. Con le soluzioni NetApp® corri meno rischi e accedi ai tuoi dati dove ne hai bisogno. Le soluzioni AI di NetApp eliminano i colli di bottiglia a livello di edge, core e cloud per consentire una raccolta dei dati più efficiente, carichi di lavoro AI accelerati e un'integrazione del cloud più fluida. Per saperne di più, visita la nostra home page dedicata all'AI e leggi il nostro blog sull'intelligenza artificiale conversazionale.

Mike McNamara

Mike McNamara è senior leader dell'area Product and Solution Marketing di NetApp, con oltre 25 anni di esperienza nel campo del marketing per la gestione dei dati e lo storage. Prima di entrare in NetApp più di 10 anni fa, Mike ha lavorato per Adaptec, EMC e HP. Mike è stato un team leader chiave per il lancio della prima soluzione AI/ML (NetApp) connessa al cloud del settore, del software e del sistema di cloud storage ibrido e scale-out unificato (NetApp), del software e del sistema di storage iSCSI e SAS (Adaptec) e del sistema di storage Fibre Channel (EMC CLARiiON). Oltre ad avere ricoperto in passato il ruolo di presidente marketing per la Fibre Channel Industry Association, è membro dell'Ethernet Technology Summit Conference Advisory Board, dell'Ethernet Alliance, è assiduo collaboratore di riviste del settore e relatore in occasione di eventi. Mike ha scritto anche un libro, pubblicato da FriesenPress, intitolato "Scale-out Storage - The Next Frontier in Enterprise Data Management" ed è stato inserito da Kapos tra i primi 50 marketer di prodotti B2B.

View all Posts by Mike McNamara