Passer au contenu principal

Qu’est-ce que la portabilité des données (portage de données) ?

La portabilité des données est la capacité de déplacer à volonté des données entre deux systèmes. Les entreprises modernes ont des exigences différentes en matière de stockage et d’accès aux données en fonction du cas d’utilisation, de la situation géographique, des réglementations et des attentes des clients. La portabilité des données leur permet de transférer des données selon leurs besoins entre les fournisseurs de services cloud et les systèmes sur site, ce qui leur permet de répondre au mieux aux exigences.

Pourquoi la portabilité des données est-elle importante ?

Les systèmes hérités imposaient des formats de données exclusives et des obligations de licence aux clients, les bloquant dans des systèmes spécifiques. Des défis techniques complexes liés au transfert de données, à l’escalade des coûts et à des dépendances à l’égard d’un fournisseur. Sans portabilité des données, les données d’une organisation ne sont accessibles que via la plateforme sur laquelle elles sont stockées. Une telle approche cloisonnée peut entraîner l’inaccessibilité des données et des problèmes de qualité des données.

Les avantages de la portabilité des données incluent les éléments suivants :

Facilite l’accessibilité des données pour l’analytique

La portabilité des données élimine les silos de données, permettant aux données de circuler de manière fluide depuis plusieurs systèmes vers un référentiel central unique. En créant une source unique de vérité, les analystes commerciaux disposent d’un système plus accessible à partir duquel ils peuvent puiser leurs informations. En outre, les analystes peuvent utiliser un ensemble varié d’outils pour la BI, le ML et l’IA dans ce pool de données centralisé, en s’appuyant sur celui-ci pour fournir des informations en temps réel et des capacités de prise de décision aux autres départements.

Soutient la conformité réglementaire à la loi californienne sur la protection de la vie privée des consommateurs et au RGPD

L’article 20 du Règlement général sur la protection des données (RGPD) stipule que chaque individu a droit à la portabilité des données. En outre, la loi californienne sur la protection de la vie privée (California Consumer Privacy Act, CCPA) impose aux organisations de mettre en œuvre des systèmes leur permettant de transférer les données entre différents emplacements, de supprimer les silos de données inutiles et de promouvoir la démocratisation des données.

Ces lois sur la protection des données garantissent que les responsables du traitement des données mettent en œuvre la portabilité des données, en donnant aux personnes concernées et à toutes les parties concernées le contrôle de leurs informations.

Améliore la gestion de la qualité des données

La portabilité des données implique la création d’un système dans lequel toutes les données peuvent circuler librement dans votre entreprise, pour aboutir finalement à votre source unique de vérité. En collectant les données de cette manière, les entreprises peuvent mettre en œuvre des contrôles de gestion de la qualité des données pour contrôler la validation des données, la déduplication et le balisage des métadonnées. Ces pratiques supprimeront toutes les données dupliquées, non valides ou obsolètes afin de garantir que seules des données complètes et de haute qualité soient transmises à votre système de stockage de données centralisé.

Comment la portabilité des données est-elle mise en œuvre ?

Les entreprises utilisent plusieurs stratégies pour mettre en œuvre la portabilité des données.

Formats de données ouverts

Il existe plusieurs formats de données non exclusives qui facilitent la portabilité des données, tels que la JavaScript Object Notation (JSON), le langage XML (Extensible Markup Language), Parquet et les valeurs séparées par des virgules (CSV). Chacun de ces formats est largement pris en charge par les entrepôts de données et les plateformes d’informatique décisionnelle qui facilitent l’intégration de la portabilité des données et permet aux analystes d’interagir avec les jeux de données. Fournissez toujours des données personnelles et transmettez des données personnelles en réponse aux demandes de portabilité des données dans ces formats de données ouverts.

Choix du client

Les entreprises peuvent implémenter la portabilité des données dans leurs systèmes en utilisant des cadres qui offrent aux clients un contrôle total sur leurs données. Voici quelques cadres fondamentaux que les entreprises devraient suivre :

  • Les clients possèdent leurs propres données, y compris toutes les informations provenant des appareils IoT, les données de localisation, les données des appareils portables et les données générées lors de l’interaction avec une entreprise.
  • Les clients ont la possibilité de stocker le contenu dans le format de leur choix.
  • Les clients choisissent les emplacements géographiques dans lesquels stocker leurs données et ces emplacements ne changent que si le client demande à transmettre des données personnelles ailleurs.
  • Les clients peuvent télécharger ou supprimer leurs données à tout moment.

Le fait de donner aux clients le contrôle total de leurs données leur permet de changer de fournisseur et de relocaliser leurs données sans aucun problème.

Interopérabilité

L’utilisation de formats interopérables, dans lesquels les données peuvent facilement être déplacées entre des systèmes et des réseaux disparates sans qu’il soit nécessaire de les modifier, améliore la portabilité des données. Les systèmes interopérables devraient utiliser des interfaces de programmation d’application (API) et des connexions normalisées pour faciliter la circulation fluide des données.

En outre, la mise en œuvre de protocoles de transfert de données standard, tels que le protocole SMB (Server Message Block), le système de fichiers réseau (NFS), le protocole HTTPS (HyperText Transfer Protocol Secure) et le protocole SFTP (SSH File Transfer Protocol), favorisent tous une circulation fluide des données.

Quelles sont les meilleures pratiques pour maintenir la portabilité des données ?

Les entreprises peuvent utiliser de nombreuses stratégies pour maintenir la portabilité des données et s’assurer que les demandes de portabilité des données sont satisfaites.

Comprendre vos données

L’acquisition d’une compréhension approfondie des types et formats de données utilisés par votre entreprise, de leur provenance et de leur stockage, et de la manière dont elles sont traitées dans votre entreprise favorise l’utilisation de systèmes de transfert appropriés. Avec une visibilité complète sur toutes les données de votre système, vous serez mieux équipé pour mettre en œuvre la portabilité des données, et sa couverture reste complète.

Mettre en œuvre l’automatisation

En automatisant les méthodes de transfert de données utilisées par votre entreprise, cela oblige les développeurs à adopter des formats de données et des protocoles normalisés, facilitant ainsi ces processus automatiques sur différents systèmes. Un système automatisé signifie :

  • une réduction de l’effort de portabilité des données ;
  • une meilleure cohérence des données ;
  • une meilleure migration des données entre vos systèmes ;
  • de meilleurs systèmes de transfert de données.

Centraliser la gouvernance des données

Les cadres de gouvernance des données déterminent la manière dont votre organisation gère et utilise les données qu’elle stocke. En centralisant la gouvernance des données et en établissant des systèmes fiables à l’échelle de l’entreprise, vous pouvez normaliser la politique des données en matière de conservation, de suppression, d’audit et de gestion des accès. Une gouvernance des données efficace conduit à une portabilité des données efficace, garantissant ainsi la traçabilité, la mobilité et la conformité de vos données.

Assurer la gestion de la qualité des données

Étudiez tout problème de qualité des données pour en trouver la cause racine. Une erreur dans vos processus de validation ou de transformation des données peut entraîner des problèmes plus importants dans votre système de gestion des données. En résolvant ces problèmes de gestion de la qualité des données, vous pouvez préserver l’intégrité des données et vous assurer que l’ensemble de votre système de données reste mobile sans problème.

Comment AWS répond-elle à vos exigences en matière de portabilité des données ?

Offrir le choix et la liberté aux clients est un principe fondamental d’AWS. Nos clients conservent toujours la propriété et le contrôle de leurs données, y compris l’endroit où elles sont stockées, comment elles sont stockées et qui y a accès. AWS propose un large éventail de types de bases de données, chacun étant adapté à différents types de données. Il n’existe aucune obligation contractuelle pour les clients de conserver un seul type de base de données. Vous pouvez :

  • exécuter des bases de données d’autres fournisseurs sur AWS ;
  • modifier le type d’instance sur lequel vos bases de données s’exécutent à tout moment ;
  • exporter vos données hors d’AWS.

Tout ce que fait AWS donne aux clients la liberté de choisir les services cloud et les fonctionnalités disponibles les mieux adaptés.

AWS fournit de nombreux outils et techniques documentées pour faciliter à la fois la migration des données vers et depuis AWS. Nos services sont basés sur de nombreuses normes ouvertes telles que SQL, Linux et Xen. Par exemple, vous pouvez utiliser les solutions ci-dessous :

Les API Amazon Data Portability permettent aux utilisateurs d’accéder à leurs données personnelles et de les exporter depuis les services Amazon dans un format lisible par machine. Ils permettent aux développeurs de créer des outils qui facilitent la récupération et le transfert sécurisés des données des utilisateurs, tout en garantissant la transparence, le contrôle des utilisateurs et le respect des réglementations en matière de confidentialité des données.

Démarrez avec la portabilité des données sur AWS en créant un compte gratuit dès aujourd’hui.