Traitement du langage naturel (NLP)
Le traitement du langage naturel (PNL) est un domaine de l’intelligence artificielle qui permet aux ordinateurs d’analyser et de comprendre le langage humain. Il a été formulé pour créer un logiciel qui génère et comprend des langages naturels afin qu’un utilisateur puisse avoir des conversations naturelles avec son ordinateur au lieu de passer par la programmation ou des langages artificiels comme Java ou C.
Décomposer le traitement du langage naturel (NLP)
Le traitement du langage naturel (PNL) est une étape dans une mission plus large pour le secteur de la technologie – à savoir, utiliser l’ intelligence artificielle (IA) pour simplifier la façon dont le monde fonctionne. Le monde numérique a changé la donne pour de nombreuses entreprises, car une population de plus en plus avertie en technologie trouve de nouvelles façons d’interagir en ligne entre elles et avec les entreprises. Les médias sociaux ont redéfini le sens de la communauté; la crypto-monnaie a changé la norme de paiement numérique; Le commerce électronique a créé une nouvelle signification du mot commodité, et le stockage en nuage a introduit un autre niveau de rétention des données pour les masses.
Grâce à l’IA, des domaines tels que l’apprentissage automatique et l’apprentissage profond ouvrent les yeux sur un monde de toutes les possibilités. L’apprentissage automatique est de plus en plus utilisé dans l’analyse de données pour donner un sens aux mégadonnées. Il est également utilisé pour programmer des chatbots pour simuler des conversations humaines avec les clients. Cependant, ces applications avancées de l’apprentissage automatique ne seraient pas possibles sans l’improvisation du traitement du langage naturel (PNL).
Comment fonctionne la PNL?
La PNL combine l’IA avec la linguistique informatique et l’informatique pour traiter les langues et la parole humaines ou naturelles. Le processus peut être divisé en trois parties. La première tâche de la PNL est de comprendre le langage naturel reçu par l’ordinateur. L’ordinateur utilise un modèle statistique intégré pour exécuter une routine de reconnaissance vocale qui convertit le langage naturel en langage de programmation. Pour ce faire, il décompose un discours récent qu’il entend en minuscules unités, puis compare ces unités aux unités précédentes d’un discours précédent. La sortie ou le résultat au format texte détermine statistiquement les mots et les phrases les plus vraisemblablement prononcés. Cette première tâche est appelée le processus de synthèse vocale.
La tâche suivante est appelée balisage de la partie du discours (POS) ou désambiguïsation des catégories de mots. Ce processus identifie de manière élémentaire les mots dans leurs formes grammaticales en tant que noms, verbes, adjectifs, passé, etc. en utilisant un ensemble de règles de lexique codées dans l’ordinateur. Après ces deux processus, l’ordinateur comprend probablement maintenant la signification du discours qui a été prononcé.
La troisième étape prise par un NLP est la conversion de texte en parole. A ce stade, le langage de programmation informatique est converti en un format audible ou textuel pour l’utilisateur. Un chatbot d’actualités financières, par exemple, à qui on pose une question du type « Comment va Google aujourd’hui? » analysera très probablement les sites de financement en ligne à la recherche d’actions Google et pourra décider de ne sélectionner que des informations telles que le prix et le volume comme réponse.
La PNL tente de rendre les ordinateurs intelligents en faisant croire aux humains qu’ils interagissent avec un autre humain. Le test de Turing, proposé par Alan Turing en 1950, déclare qu’un ordinateur peut être pleinement intelligent s’il peut penser et faire une conversation comme un humain sans que l’humain sache qu’il ou elle est en train de converser avec une machine. Jusqu’à présent, un seul ordinateur a réussi le test – un chatbot avec le personnage d’un garçon de 13 ans. Cela ne veut pas dire qu’une machine intelligente est impossible à construire, mais cela souligne les difficultés inhérentes à faire penser ou converser un ordinateur comme un humain. Étant donné que les mots peuvent être utilisés dans différents contextes et que les machines n’ont pas l’expérience de la vie réelle que les humains ont pour transmettre et décrire des entités avec des mots, cela peut prendre un peu plus de temps avant que le monde puisse complètement se débarrasser du langage de programmation informatique.