Le terme information structurée décrit les données contenues dans les champs. Les données non structurées sont des données qui ne suivent ni une typologie ni un format précis. C’est par leur utilisation que Google peut mieux déchiffrer et comprendre le sens du contenu de votre site web. Cette localisation implique en effet que les données présentes dans des documents, tant électroniques que physiques, soient numérisées, afin de permettre à une application de recherche d'en extraire par analyse des concepts en fonction de termes utilisés dans des contextes spécifiques.
Bon, c’est vrai que l’on a inventé les données semi-structurées mais cette précision se cantonne toujours au format technique de l’information et n’atteint pas le niveau de la gouvernance.Le point d’attention ici est que le problème ne relève pas de la nature “non structurée” de l’information mais de la négligence, de l’indiscipline ou simplement de l’insouciance des auteurs de ces informations: expéditeurs et réexpéditeurs de mails (dont quelques-uns sont effectivement du courrier), rédacteurs de notes (dont quelques-unes sont pertinentes), amateurs compulsifs d’appareils de prise de vues (dont quelques-unes sont effectivement des photographies), producteurs de foutoirs qui sont des foutoirs avant d’être des données non structurées!Mais ces efforts, éminemment louables, restent ténus face à la puissance des princes de la technologie qui s’attaquent à la question avec l’intelligence artificielle.L’enjeu, pour les maîtres du monde technologico-commercial qui est le nôtre, est de Un bon exemple est la démarche de Google qui crée des données structurées en analysant les vidéos.
La qualité des traductions automatiques a beaucoup progressé ces dernières années mais je ne crois pas qu’elle dépasse jamais la qualité humaine d’une traduction humaine (sauf si les humains deviennent des robots). Ces informations sont toujours destinée à des humains. Et des données non administrées peuvent parallèlement poser un problème de responsabilité, par exemple si les informations ne peuvent pas être localisées dans le cadre d'un audit de conformité ou d'une action en justice.Les informations que renferment les données non structurées ne sont pas toujours faciles à localiser. C’est que la littérature, même professionnelle, n’est pas comparable au jeu d’échecs qui n’a plus de mystère pour Il en va de même pour la “traduction” de données non structurées en données structurées.Tant qu’à avoir des maîtres, je préfère sans aucune hésitation les philosophes – de tous temps et de tous pays (je parle des vrais “amoureux de la sagesse”…) – aux GAFA et autres BATX.Mot, nombre, signal, chaîne de caractères, séquence de bits, morceau de matière ou tout autre élément brut enregistré dans un système d’information où il pourra être corrélé à d’autres objets et interprété pour constituer une information.On distingue les données structurées qui correspondent aux éléments calibrés saisis dans les différents champs des bases de données, et les données non structurées qui englobent toutes les autres informations enregistrées sous forme numérique ; ce sont principalement les fichiers bureautiques et la messagerie.
Données structurées, non structurées et semi-structurées : la différence. En réalité, très peu de données sont complètement non structurées. Les données non structurées non textuelles, quant à elles, sont générées via des supports tels que les images JPEG, les fichiers audio MP3, ou encore les fichiers vidéo Flash.Les données semi-structurées sont des données qui n’ont pas été organisées en référentiel spécialisé, comme c’est le cas dans une base de données, mais qui comportent néanmoins des informations associées, des métadonnées par exemple, qui les rendent plus faciles à traiter que des données brutes.Votre adresse e-mail ne sera pas publiée Champs requis marqués avec Ce site utilise Akismet pour réduire les indésirables.