Architecture de la connaissance

« Rien de ce qui vaut la peine d’être connu ne peut être enseigné »

Oscar Wilde

Objectif

Comme l’illustre le Symbolic Systems Program (SSP) de l’Université de Stanford, les progrès des technologies de l’informatique et de la communication regroupent les systèmes d’information et de connaissance sous un même toit fonctionnel, à savoir le traitement des représentations symboliques.

Information et Connaissances : Acquisition, Utilisation et Réutilisation (R. Doisneau)

Dans cette compréhension, on s’attend à ce que la gestion des connaissances fasse de l’ombre aux architectures et aux préoccupations des systèmes: contextes et objectifs commerciaux, organisation et opérations de l’entreprise, fonctionnalités et technologies des systèmes. D’autre part, la connaissance étant par nature une ressource partagée d’actifs réutilisables, son organisation devrait répondre aux besoins de ses différents utilisateurs indépendamment de l’origine et de la nature de l’information. La gestion des connaissances devrait donc lier la connaissance des architectures à l’architecture des connaissances.

Représentation des connaissances

Dans leur article pivot, Davis, Shrobe et Szolovits établissent cinq principes pour la représentation des connaissances:

  1. Surrogate: KR fournit une contrepartie symbolique d’objets, d’événements et de relations réels.
  2. Engagements ontologiques: un KR est un ensemble d’énoncés sur les catégories de choses qui peuvent exister dans le domaine considéré.
  3. Théorie fragmentaire du raisonnement intelligent: un KR est un modèle de ce que les choses peuvent faire ou peuvent être faites avec.
  4. Support pour un calcul efficace: rendre les connaissances compréhensibles par les ordinateurs est une étape nécessaire pour toute courbe d’apprentissage.
  5. Moyen d’expression humaine: l’un des prérequis du KR est d’améliorer la communication entre les experts de domaines spécifiques d’une part, les gestionnaires de connaissances génériques d’autre part.
Substituts sans Engagement ontologique

Qui place les systèmes d’information comme un cas particulier de connaissances, car ils remplissent les cinq principes, mais avec une qualification fonctionnelle:

  • À l’instar des systèmes de connaissances, les systèmes d’information gèrent des représentations symboliques d’objets, d’événements ou d’activités extérieurs censés être pertinents.
  • Les modèles système sont des assertions concernant des objets métier et des opérations légitimes.
  • De même, les systèmes d’information sont destinés à soutenir des calculs efficaces et des interactions conviviales.

La seule différence concerne le couplage: contrairement aux systèmes de connaissances, les systèmes d’information et de contrôle jouent un rôle dans leur contexte, et les opérations sur les substituts ne sont pas neutres.

Archéologie du savoir

Les constructions du savoir sont des boîtes vides qui doivent être correctement remplies de faits. Mais, comme le montrent notoirement les autres, les faits ne sont pas donnés mais doivent être observés, ce qui implique nécessairement un observateur, mis à la tâche sinon avec des intérêts acquis, et un appareil, naturel ou fait exprès. Et s’ils doivent être enregistrés, même les faits « purs » observés à l’œil nu d’enfants innocents devront être traduits en une représentation symbolique.

Prenant pour exemple le vent, les chaussettes à vent soutiennent l’observation immédiate des faits, dépourvues de toute signification symbolique. Afin de donner un sens à leurs comportements, des anémomètres et des anémomètres sont nécessaires, respectivement pour l’azimut et la vitesse; mais cela nécessite également des cadres symboliques pour les directions et les métriques. Enfin, des connaissances sur les risques de vents violents peuvent être ajoutées lorsque ces risques doivent être pris en compte.

Faits, Informations, Connaissances

En ce qui concerne les entreprises, les boîtes de connaissances doivent être remplies de faits sur leur contexte et leurs processus commerciaux, leur organisation et leurs applications, ainsi que leurs plates-formes techniques. Certains d’entre eux seront produits en interne, d’autres provenant de sources externes, mais tous devraient être gérés indépendamment d’objectifs spécifiques.

Quelle que soit leur nature (entreprise, organisation ou systèmes), les informations produites par les entreprises elles-mêmes sont, dès leur création, prêtes à l’emploi, i.e organisé autour d’objets ou de processus identifiés, avec des structures et une sémantique définies.

Ce n’est pas nécessairement le cas des données reflétant des contextes externes (marchés, réglementations, technologies, etc.) qui doivent être mappées aux préoccupations et objectifs de l’entreprise avant d’être utiles.

La traduction des données en informations peut être effectuée immédiatement en mappant la sémantique des données sur des objets et des processus identifiés; elle peut également être retardée, les données brutes étant gérées en tant que telles jusqu’à être utilisées ultérieurement pour construire des informations.

Des Données à la Connaissance

Des données à l’information

L’information est significative, les données ne l’sont pas. Même les « faits » ne sont pas de la manne venue du ciel, mais doivent être façonnés à partir de phénomènes en données, puis en informations, telles qu’elles sont incarnées par des données binaires, fragmentées ou « volumineuses ».

  • Les données binaires sont des enregistrements directs de phénomènes physiques, par exemple des sons ou des images ; même lorsqu’elles sont indexées avec des mots clés, elles restent inutiles jusqu’à ce qu’elles soient associées, en tant que caractéristiques non symboliques, à des objets ou activités identifiés.
  • Contrairement aux données binaires, les données fragmentées sont symboliques, mais sous forme de pépites flottantes avec une granularité de sous-niveau; et comme leur cousin binaire, ces descriptions à grain fin n’ont aucun sens tant qu’elles ne sont pas attachées à des objets ou activités identifiés.
  • Les « grandes » données sont généralement comprises en termes d’évolutivité, car elles font référence à des grumeaux trop volumineux pour être traités individuellement. Il peut également être défini comme une généralisation de données fragmentées, avec des cibles identifiées regroupées en agrégats plus significatifs, déplaçant la granularité ciblée jusqu’à un niveau « écrasant ».

Comme les connaissances ne peuvent être construites qu’à partir de descriptions symboliques, les données doivent d’abord être traduites en informations constituées d’unités identifiées et structurées avec une sémantique associée.

Face aux données « brutes » (c’est-à-dire non traitées), les gestionnaires de connaissances peuvent choisir entre deux politiques : l’information peut être « extraite » des données par des moyens statistiques, ou l’étape de l’information simplement contournée et les données directement utilisées (c’est-à-dire interprétées) par des agents « compétents » en fonction de leur contexte et de leurs préoccupations.

Les signaux sont des événements physiques avec des interprétations ouvertes

En fait, les deux politiques s’appuient sur des agents compétents, la question étant de savoir qui sont les « mineurs » et ce qu’ils devraient savoir. Théoriquement, les mineurs pourraient être des outils entièrement automatisés capables d’extraire des modèles d’informations pertinentes à partir de données brutes sans aucune information préalable; pratiquement, ces outils devront être alimentés avec une « intelligence » préalable concernant ce qui doit être recherché, par exemple des échantillons pour les réseaux neuronaux ou des variables pour la régression statistique. D’où la nécessité d’une sorte de formats, de plans ou de modèles qui aideront à encadrer les données brutes en informations.

Propriétés de l’information

Les connaissances doivent être construites à partir d’informations précises et à jour concernant l’état des affaires externes et internes, et à cette fin, les éléments d’information doivent être gérés en fonction de leur source, de leur nature, de leur cycle de vie et de leur pertinence:

  • Source: Gouvernement et administrations, ONG, médias d’entreprise, médias sociaux, entreprises, systèmes, etc.
  • Nature : événements, décisions, données, opinions, évaluations, etc.
  • Type d’ancre : individu, institution, temps, espace, etc.
  • Cycle de vie: instantané, lié au temps, final.
  • Pertinence : traçabilité en ce qui concerne les objectifs commerciaux, les opérations commerciales, l’organisation et la gestion des systèmes.
Les informations doivent être opportunes, compréhensibles et pertinentes

Sur cette base, la gestion des connaissances devra cartographier les connaissances à leur empreinte informationnelle en termes de fiabilité (source, précision, cohérence, obsolescence, etc.) et de risques.

De l’information à la connaissance

L’information est significative, la connaissance est également utile. En tant que modèles d’information, les représentations des connaissances doivent d’abord être ancrées dans des unités de persistance et d’exécution afin de soutenir la cohérence et la continuité des identités de substitution (principe #1).

Ces ancres sont à attribuer à des domaines gérés par des unités organisationnelles uniques en charge des engagements ontologiques, et enrichis de structures, de caractéristiques et d’associations (principe #2). Selon leur portée, leur structure ou leur fonctionnalité, la sémantique doit être gérée respectivement par des domaines persistants ou applicatifs.

De même, les ontologies peuvent cibler des objets ou des aspects, les premiers étant associés à des sous-types structurels, les seconds à des sous-types fonctionnels.

Les différences entre les modèles d’information et la représentation des connaissances apparaissent avec des règles et des contraintes. Alors que l’objectif des systèmes d’information et de contrôle est de gérer les objets et les activités de l’entreprise, le but des systèmes de connaissances est de gérer les contenus symboliques indépendamment de leurs homologues réels (principe #3).

Les règles standard utilisées dans la modélisation du système décrivent les opérations autorisées sur les objets, les activités et les informations associées ; elles peuvent être exprimées en avant ou en arrière:

  • Les règles Forward (aka push) sont des conditions sur quand et comment les opérations doivent être effectuées.Les règles
  • Backward (alias pull) sont des contraintes sur la cohérence des représentations symboliques ou sur l’exécution des opérations.
Règles standard

En supposant une continuité entre les représentations de l’information et de la connaissance, le point d’inflexion serait marqué par l’introduction de modalités utilisées pour des valeurs de vérité qualifiées, par exemple selon une logique temporelle et floue:

  • Les extensions temporelles mettront des horodatages sur les valeurs de vérité de l’information.
  • La logique floue place les niveaux de confiance sur les valeurs de vérité de l’information.

C’est là que les systèmes de connaissance s’écartent des systèmes d’information et de contrôle en introduisant une nouvelle théorie du raisonnement intelligent, basée sur la fluidité et la volatilité des connaissances.

Les significations sont entre les mains des spectateurs

Dans un contexte d’entreprise, les connaissances peuvent être comprises comme des informations encadrées par des contextes et motivées par des objectifs: comment gérer une entreprise, comment développer des applications, comment gérer des systèmes. D’où la double perspective: d’une part, l’information est régie par les préoccupations de l’entreprise, les fonctionnalités des systèmes et la technologie des plates-formes; d’autre part, les connaissances sont motivées par les processus métier, l’ingénierie des systèmes et la gestion des services.

Connaissance des Architectures, Architecture des Connaissances.

Cela fournit une taxonomie claire et complète des artefacts, à utiliser pour développer des connaissances à partir de couches inférieures d’informations et de données:

  • Les analystes commerciaux doivent connaître les domaines et activités de l’entreprise, l’organisation et les applications, ainsi que la qualité du service.
  • Les ingénieurs système doivent connaître les projets, les fonctionnalités des systèmes et les implémentations de plates-formes.
  • Les gestionnaires de système doivent connaître les emplacements et les opérations, les services et les déploiements de plates-formes.

La double perspective indique également la dynamique de la connaissance, l’information étant poussée par leurs sources et la connaissance tirée par leurs utilisateurs.

Un temps pour chaque but

Au sens de la cybernétique, les entreprises sont des systèmes viables dont le succès dépend de leur capacité à contrer l’entropie, i.e le déclassement progressif des informations utilisées pour régir les interactions à la fois au sein de l’organisation elle-même et avec son environnement.

Par rapport aux connaissances en architecture, qui sont organisées en fonction du contenu de l’information, l’architecture des connaissances est organisée en fonction des préoccupations fonctionnelles et de la durée de vie de l’information, et son objectif est de garder les informations internes et externes synchronisées:

  • Planification des objectifs commerciaux et des exigences (internes) par rapport à l’évolution des marchés et aux opportunités (externes).
  • Évaluation des unités organisationnelles et des procédures (internes) en conformité avec les environnements réglementaires et contractuels (externes).
  • Suivi des opérations et des projets (interne) ainsi que des chaînes de vente et d’approvisionnement (externe).
Architecture des connaissances et couches de cisaillement: stratégie à loisir, temps pour les plans, opérations en temps réel.

Cela a mis des significations (ce serait des connaissances) entre les mains des décideurs, respectivement pour la stratégie d’entreprise, l’organisation et les opérations. De plus, les entreprises étant des entités vivantes, leur durée de vie et leur durabilité fonctionnelle sont censées fusionner en couches cohérentes et homogènes:

  • Les échelles de temps d’entreprise (aka business, aka strategic) sont définies par des environnements, des objectifs et des décisions d’investissement.
  • Les échelles de temps d’organisation (aka fonctionnelles) sont définies par la disponibilité, la polyvalence et l’adaptabilité des ressources
  • Les échelles de temps opérationnelles sont déterminées par les caractéristiques et les contraintes du processus.

Une telle congruence des échelles de temps, des architectures et des objectifs en couches de cisaillement est sans doute un facteur de succès clé de la gestion des connaissances.

Rechercher et étirer

Comme nous l’avons déjà noté, les connaissances sont motivées par des objectifs, et les objectifs, qui ne sont pas confinés à des domaines ou à des réserves, sont tenus d’étendre les connaissances au-delà des contextes commerciaux et des frontières organisationnelles. Cela peut être réalisé par la recherche, la logique et la classification.

  • Les recherches recueillent les informations pertinentes aux préoccupations des utilisateurs (1). Cela peut satisfaire tous les besoins en connaissances ou fournir une colonne vertébrale pour une extension ultérieure.
  • Les recherches peuvent être combinées avec des ontologies (aka des classifications) qui placent les mêmes informations sous de nouveaux voyants (1b).
  • Des opérations de préservation de la vérité utilisant des mathématiques ou des langages formels peuvent être appliquées pour produire des informations dérivées (2).
  • Enfin, de nouvelles informations avec des niveaux de confiance réduits peuvent être produites par le traitement statistique (3,4).

Par exemple, le trafic observé sur les routes à péage (1) est utilisé à des fins comptables (2), pour prévoir l’évolution du trafic (3), pour analyser les tendances saisonnières (1b) et simuler les péages saisonniers et variables (4).

Faits observés (1), déductions (2), projections (3), transposition (1b) et hypothèse (4).

Ces opérations ont des conséquences claires pour la gestion des connaissances :

Dans la mesure où les distances de calcul n’affectent pas les niveaux de confiance, les opérations de préservation de la vérité sont neutres en ce qui concerne le KM.

Les classifications sont des outils symboliques conçus exprès ; par conséquent, toutes les connaissances associées à une classification doivent rester sous la responsabilité de son concepteur.

Des défis surviennent lorsque les niveaux de confiance sont affectés, directement ou par obsolescence. Et puisque la prise de décision concerne essentiellement la gestion des risques, il est impossible d’éviter de traiter des informations partielles ou peu fiables. D’où l’importance de gérer les connaissances le long des couches de cisaillement, chacune avec son propre cycle de vie de l’information, ses exigences de confiance et ses règles de prise de décision.

De l’Architecture des connaissances à la Capacité d’architecture

L’architecture des connaissances est le système nerveux central de l’entreprise et, en tant que tel, elle joue un rôle primordial dans le soutien des processus opérationnels et managériaux. Ce point est partiellement abordé par des frameworks comme Zachman dont la matrice organise l’architecture du Système d’Information (ISA) selon les capacités et les niveaux de conception. Pourtant, comme l’illustrent les niveaux de conception, l’accent reste mis sur les technologies de l’information sans aborder explicitement la distinction entre entreprise, systèmes et plates-formes.

Les capacités peuvent être définies à travers les couches d’architecture en ce qui concerne les processus métier, d’ingénierie et opérationnels

Cette distinction est essentielle car elle régit la distinction entre les processus correspondants, à savoir les processus métier, l’ingénierie des systèmes et la gestion des services. Et une fois que la distinction est correctement établie, l’architecture des connaissances peut être alignée sur l’évaluation des processus.

Pourtant, cela ne suffira pas maintenant que les environnements numériques envahissent les systèmes d’entreprise, brouillant la distinction entre les actifs d’information gérés et les flux continus de big data.

Comment combler le fossé entre le big Data et les modèles d’information d’entreprise.

Cela met l’accent sur deux défauts structurels des architectures d’entreprise:

  • La confusion entre données, informations et connaissances.
  • La divergence intrinsèque entre les systèmes et les architectures de connaissances.

Les deux peuvent être surmontés en fusionnant les architectures système et connaissance en appliquant le plan de pagode:

Le Plan d’architecture de pagode est dérivé des cadres de Zachman

L’alignement des plateformes, des fonctionnalités des systèmes et de l’organisation de l’entreprise respectivement avec les données (environnements), les informations (représentations symboliques) et les connaissances (business intelligence) améliorerait grandement la traçabilité des transformations induites par l’immersion des entreprises dans les environnements numériques.

Représentation des connaissances & Ontologies profilées

Face aux environnements commerciaux numériques, les entreprises doivent trier les informations pertinentes et précises des flux continus et massifs de données. Comme les méthodes de modélisation ne peuvent pas faire face à la gamme ouverte de contextes, de préoccupations, de sémantique et de formats, des schémas plus souples sont nécessaires, c’est précisément ce que les ontologies sont censées faire:

  • Thésaurus : ontologies couvrant les termes et concepts.
  • Documents : ontologies couvrant des documents par rapport à des sujets.
  • Affaires: ontologies de l’organisation d’entreprise pertinente et des objets et activités métier.
  • Ingénierie : représentation symbolique des objets et activités de l’organisation et de l’entreprise.
Ontologies : Objectifs & Cibles

Les ontologies profilées peuvent ensuite être conçues en combinant cette taxonomie de préoccupations avec des contextes, par exemple:

  • Institutionnel: Autorité de régulation, stable, changements soumis aux procédures établies.
  • Professionnel: Convenu entre les parties, stable, les changements sont soumis à des accords.
  • Corporate : Défini par les entreprises, les changements sont soumis à une prise de décision interne.
  • Social: Défini par l’usage, les changements volatils, continus et informels.
  • Personnel: Coutumier, défini par des personnes nommées (par exemple, document de recherche).

Enfin, des ontologies externes (réglementaires, métiers, businesses) et internes (architecture d’entreprise) pourraient être intégrées, par exemple avec le framework Zachman:

Les ontologies, les capacités (Qui, Quoi, Comment, Où, Quand) et les architectures (entreprise, systèmes, plates-formes).

L’utilisation d’ontologies profilées pour gérer l’architecture d’entreprise et les connaissances de l’entreprise aidera à aligner la gestion des connaissances sur la gouvernance de l’EE en distinguant les ontologies définies à l’extérieur (par exemple, les réglementations), de celles définies par la prise de décision, stratégiques (par exemple, plate-forme) ou tactiques (par exemple, partenariats).

Un noyau ontologique a été développé comme Preuve de Concept en utilisant Protégé/OWL 2 ; une version bêta est disponible pour commentaires sur le portail Stanford/Protégé avec le lien : Noyau ontologique Caminao (CaKe).

De l’analyse des données à l’apprentissage profond

Entre l’assaut tout compris des données d’un côté, les robots intelligents omniprésents de l’autre, les systèmes d’information pourraient perdre leur identité et leur raison d’être. Et il y a une bonne raison à cela, à savoir la confusion entre données, informations et connaissances.

La connaissance est la capacité de faire des différences

Comme cela s’est produit il y a des éons, les ontologies ont été explicitement à la hauteur de ce problème.

Lectures complémentaires

  • Systèmes, Informations, Connaissances
  • Ontologies & Modèles
  • Noyau Ontologique Caminao (Protégé/OWL 2)
  • Ontologies & Architecture d’entreprise
  • Les Ontologies comme Actifs Productifs
  • Gouvernance d’entreprise & Connaissance
  • Collaboration agile & Créativité sociale
  • Réinventer la roue
  • Faits alternatifs & Réalité augmentée
  • AlphaGo: De l’Apprentissage Intuitif à la Connaissance Holistique
  • AlphaGo & Concours à Somme Non Nulle
  • Nouvel An : 2016 est Celle à Apprendre
  • Gouvernance, Réglementation & Risques
  • Événements & Prise de décision
  • Intelligence opérationnelle & Prise de décision
  • Exploration de données & Analyse des besoins
  • EA: Antidote à l’entropie
  • Agilité métier vs Entropie systèmes

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.