AWS Public Sector Blog
How AWS can enable the Government of Canada’s 2023-2026 Data Strategy
The potential of open data to transform governance and public services is immense, but realizing this potential requires overcoming common obstacles. In this post, we will explore best practices and solutions for public sector organizations seeking to use the cloud for open data, specifically examining how Amazon Web Services (AWS) can enable open data success.
Key topics covered include addressing concerns around data sovereignty, security, lock-in risks and budget control while highlighting AWS capabilities and commitments in these areas. Additionally, the post discusses presence of and investments by AWS in Canada that facilitate partnerships in the national interest. For public sector IT leaders evaluating infrastructure strategies, this post offers an in-depth look at how AWS Cloud technology can unlock the possibilities of open data for the public good. Read on to learn how AWS is empowering customers to achieve their open data objectives.
The 2023-2026 data strategy of the Government of Canada (GC)
The GC’s data strategy describes how the Federal Public Service intends to utilize data over the next three years to deliver enhanced services and value to Canadians. Key areas of focus include:
- Incorporating data considerations into the initial design of initiatives and programs, to facilitate improved decision-making.
- Advancing data governance and stewardship practices to build trust and enable secure data sharing between departments, including safeguarding privacy.
- Employing data analytics and digital tools to customize government services, making them more responsive to people’s needs.
- Promoting data skills and literacy throughout the public service via training and capacity building. This will empower employees to use data effectively in their roles.
The goals are to help government address complex policy issues, adapt to changing demands, and provide insights that ultimately benefit the Canadian public. Trust and transparency will be prioritized as more data is collected and leveraged.
Upholding public trust in cloud partnerships: Guidance for Canadian public sector workers
As stewards of citizen data, public sector workers must uphold public trust when exploring cloud partnerships by proactively addressing concerns around data sovereignty, security, flexibility and budgets. This means seeking contractual guarantees on ongoing Canadian data control and ownership, including extraterritorial rights, along with stringent security assurances on encryption, access controls and exposure prevention from partners.
Workers should also mitigate vendor lock-in that could reduce future competitiveness for public sector deals, analyze total cost of ownership against multi-year budgets, and factor support for domestic innovation ecosystems into procurement decisions to balance globally leading solutions with national economic interests.
Overall, contractual guarantees, financial transparency, competitive choice and commitments to localized Canadian presence that nurture national talent are crucial to deliver taxpayer value through cloud partnerships while upholding public sector duties.
Getting the data strategy right is a prerequisite to unlocking the power of technologies such as AI
The GC requires a comprehensive data strategy to effectively manage information assets. In today’s data-rich environment, organizations collect ample raw data but need thoughtful plans to extract value. A coherent data strategy entails long-term vision and pragmatic details – integrating technology, processes, personnel and governance to enable data accessibility, coordinated analysis, and informed decision-making.
For the government, this strategy is imperative to optimize data usage across departments. It would delineate centralized protocols for organized data collection, storage, sharing and application. This streamlines data utilization for machine learning and AI modeling while institutionalizing best practices. Implemented judiciously, such strategy empowers evidence-based governance through democratized data. The key is designing enduring infrastructure to shepherd data from acquisition through analytics, to continuously learn and serve all Canadians efficiently.
Realizing the monumental opportunity of artificial intelligence (AI) to transform governance through data-driven insights requires establishing a robust data strategy first. Just as a shaky foundation undermines even the sturdiest house, flawed data diminishes the value of the most advanced algorithms. Adopting powerful technologies like generative AI must align with principles contained in the GC’s Responsible use of AI of lawful, ethical data usage and explainable outcomes to impacted individuals.
A cohesive data strategy entails consolidating information across department and agency silos into integrated data lakes as a crucial prerequisite. Extensive data preparation like cleaning inconsistent sets, resolving duplications, meticulously cataloging lineage, and mapping contextual meaning are also vital. Only through these processes can rich, reliable and well-understood data lead to meaningful analysis and predictive modeling to unlock AI’s full governance potential. The data foundation sets the stage for advanced analytics.
The GC possesses troves of data on climate science trapped in outdated formats like tape and paper. Digitizing and making this data available on the cloud would vastly improve access for researchers seeking to collaborate on pressing issues like climate change.
With robust data infrastructure in place, the functional possibilities of AI come into clearer focus. Hyper-accurate forecasting models can guide proactive policy, for instance predicting infrastructure needs based on population growth trajectories. Granular personalization also becomes achievable – AI algorithms can develop customized health alerts by assessing lifestyle factors of individuals. Additionally, continuously running anomaly detection on claims and grievances would curb fraud and corruption.
At its best, AI-optimization has the power to reshape government processes. Repetitive administrative tasks can be automated to radically improve efficiency. Bots and virtual assistants can provide citizens 24/7 support for seamless self-service. Even functions like revenue collection and license issuances can be streamlined.
The data deluge of our times offers invaluable grist for the AI mill. But unless intelligently aggregated, organized and understood, AI progress stalls. Much like construction requires processed material, not raw stone, a meticulous, holistic data strategy undergirds algorithmic advancement. Get that right, and the prospects for data-centric governance are breathtaking.
AWS can unlock the possibilities of open data for public good
AWS has addressed common concerns regarding its viability as an open data platform. Examining each objection enables us to demonstrate the steps AWS has taken to facilitate open data success. By tackling doubts on security, interoperability, governance and ecosystem vitality head-on, AWS shows it provides the infrastructure for customers to achieve their open data goals with confidence. Looking at apprehensions individually and mapping AWS strengths in turn illuminates AWS readiness to support the GC’s objectives, empowering seamless and responsible data sharing between disparate systems and partners.
Data sovereignty concerns
AWS published its Digital Sovereignty Pledge to make public our commitment to give customers more control over their data sovereignty and meet evolving regulatory requirements without compromising on AWS capabilities. Data sovereignty—having control over digital assets—is increasingly important to customers, especially as regulations evolve. Customers have expressed concern about having to choose between full AWS capabilities and limited sovereign cloud solutions.
AWS will continue to expand its existing data protection capabilities across four areas:
- Enhanced control over data location
- Verifiable control over data access
- Ability to encrypt everything everywhere
- Resilience through high availability and disaster recovery
Trust and transparency will remain central to the AWS approach. AWS will continue challenging inappropriate data requests and providing compliance evidence and contractual commitments. AWS will work closely with partners to help customers navigate changing regulations and meet digital sovereignty requirements on AWS without compromising capabilities. The key focus is allowing customers to meet evolving data regulations and sovereignty requirements while retaining the full innovation, scale, reliability, and performance of AWS.
Privacy and security concerns
At AWS, we are committed to providing continued assurance to our customers through assessments, certifications, and attestations that support the adoption of current and new AWS services and features. Public sector workers can use the AWS Artifact service to download the latest Canadian Centre for Cyber Security (CCCS) assessment summary report for AWS. As of the latest assessment, a total of 150 AWS services and features are assessed by CCCS for both AWS Canada regions (Montreal and Calgary). Public sector customers are able to take advantage of the 3,000-kilometre distance between the Canadian regions to implement highly resilient solutions for Canadians.
We know that customers care deeply about privacy and data security. AWS continually monitors the evolving privacy regulatory and legislative landscape to identify changes and determine what tools our customers might need to meet their compliance needs.
Lock-in concerns
AWS waived data transfer out (DTO) charges (when customers want to move data outside of AWS) starting March 5, 2024. This makes it easier for customers to switch cloud providers or move back on premises. More than 90 percent of AWS customers already incur no data transfer fees out of AWS due to the existing free tier. But for those needing more than 100 gigabytes (GB) per month while transitioning, they can contact AWS Support to request free DTO rates.
AWS will review DTO fee waiver requests at the account level. Once approved, credits will be provided for the data being migrated. Customers don’t need to close their accounts or change their relationship with AWS. This policy follows the direction of the European Data Act and is available to all AWS customers globally. It supports customer choice and freedom to move data out of AWS. This also aligns with AWS support for Fair Software Licensing Principles around using software with other providers. In summary, AWS is making it easier for customers to switch providers while maintaining their relationships, through waiving DTO fees during transitions.
The AWS Snow Family and AWS DataSync services have been used by the GC to enable portable data architectures spanning cloud and on premises. Snow Family transportable storage facilitates two-way, large-scale dataset migrations between environments. DataSync orchestrates easy hybrid data movement through its bi-directional sync. Both solutions allow keeping native data copies on-premise, integrating external infrastructure with AWS. By supporting open standards for storage and focusing on data workflow abstraction, they minimize lock-in risks. Ultimately, AWS provides not just a migration endpoint but an interoperable data bridge to avoid platform dependency.
You can use the boto3 python library to talk to both Amazon Simple Storage Service (Amazon S3) and other web object stores, including an on-premises web object store. This way if you ever decide that you need to move some of your data on premises, you can use the same code to manage both an on-premises web object store and your data in Amazon S3.
The Amazon S3 API, developed by AWS, provides a standardized and flexible solution for storing and accessing unstructured data across object storage systems. With its widespread adoption, many enterprise storage products used by the GC, whether on premises or from other cloud service providers, offer Amazon S3 API support for integration.
This compatibility allows for seamless data migration between locations using services like AWS DataSync. Amazon S3 compatible storage brings three significant advantages. First, application compatibility enables the use of existing Amazon S3 designed tools across different solutions, facilitating easy migration and avoiding vendor lock-in. Second, the extensively tested Amazon S3 API ensures consistent data management across platforms, providing robustness and reliability. And third, adherence to the standard reduces costs and efforts associated with vendor transitions when moving data, minimizing interoperability risks.
Cost and budget control concerns
The AWS Open Data Sponsorship Program covers the cost of storage for publicly available cloud-optimized datasets. To participate, you must:
- Make your data publicly available under a permissive license
- Optimize the data and tools for end users and the cloud
- Update the datasets regularly to keep them useful
- Provide documentation on how the community can use the dataset
To learn more about additional rules and requirements, visit the AWS Open Data Sponsorship Program website. The Communications Security Establishment hosts cybersecurity datasets on the Open Data Registry on AWS. Similarly, Natural Resources Canada makes earth observation data from RADARSAT-1 available on the same registry.
The Open Data Sponsorship program is likely not the place for your entire archive, so it’s best to consider how to combine the Open Data Sponsorship program with datasets that you may want to make public using Amazon S3. Amazon S3 used in Data Lake architectures on AWS offers different storage classes optimized for access frequency and cost. S3 Intelligent Tiering automatically moves data between tiers based on access patterns to reduce costs.
- For predictable access patterns, Amazon S3 Lifecycle policies can transition objects to lower cost tiers. S3 Storage Lens provides visibility into access metrics to identify transition opportunities.
- Amazon S3 Intelligent Tiering is best for unknown or changing access patterns, saving up to 95% on storage costs. Standard-IA has retrieval fees that can significantly increase costs if access patterns change.
The AWS Global Data Egress Waiver program waives data transfer out fees for eligible higher education, research institutions, and K-12 schools to make it easier to leverage AWS services. The maximum discount is 15% of total spending.
Canadian presence
Since 2010, Amazon has invested more than $40 billion in its Canadian operations, contributing more than $33 billion to Canada’s GDP and creating 45,000 jobs. AWS cloud computing has helped train 200,000 Canadians in technical skills since 2017.
Specifically in Alberta, AWS has invested more than CA$4 billion into the new Canada West Calgary Region data center, estimated to contribute CA$5.62 billion to Alberta’s GDP by 2037. This AWS presence is expected to support an average of 1,300 full-time local jobs annually.
AWS offers Alberta residents cloud training programs on topics like fiber optic installation through organizations like Momentum. A new $100,000 AWS community grant fund launched in 2023 supports Calgary sustainability initiatives.
Globally, AWS aims to power all operations with 100 percent renewable energy by 2025. Amazon has invested in four renewable energy projects in Alberta to supply AWS data centers sustainably. The AWS Cloud is 3.6 times more energy efficient than traditional data centers.
Through major investments in jobs, sustainability, and skills development across Canada, AWS drives innovation, productivity, and responsible technology growth.
What’s next?
If you would like to learn more about how AWS can enable the vision of open data, please contact your AWS account team or the AWS Public Sector team directly.
Comment AWS peut aider à la mise en œuvre de la Stratégie de données 2023-2026 du gouvernement du Canada
Le potentiel des données ouvertes de transformer la gouvernance et les services publics est immense, mais pour que ce potentiel se réalise, il est nécessaire de surmonter les obstacles courants. Dans cet article, nous explorons les meilleures pratiques et solutions qui s’offrent aux organisations du secteur public désireuses de mettre le nuage au service des données ouvertes, en examinant particulièrement comment Amazon Web Services (AWS) peut favoriser le succès des données ouvertes.
Les principaux sujets abordés comprennent la prise en compte des préoccupations relatives à la souveraineté des données, à la sécurité, aux risques en matière d’asservissement et au contrôle budgétaire, ainsi que les capacités et les engagements d’AWS dans ces domaines. De plus, l’article traite de la présence et des investissements d’AWS au Canada, qui facilitent la formation de partenariats dans l’intérêt national. Pour les responsables informatiques du secteur public qui évaluent les stratégies d’infrastructure, cet article décrit en détail la façon dont la technologie du Nuage AWS peut permettre d’exploiter les possibilités des données ouvertes pour le bien public. Lisez la suite pour découvrir comment AWS permet a ses clients d’atteindre leurs objectifs en matière de données ouvertes.
Stratégie de données 2023-2026 du gouvernement du Canada (GC)
La Stratégie de données du GC décrit la façon dont la fonction publique fédérale entend utiliser les données au cours des trois prochaines années pour offrir aux Canadiens des services améliorés et à valeur ajoutée. Les principaux domaines d’intérêt sont:
- La prise en compte des considérations relatives aux données dans la conception initiale des initiatives et des programmes, afin de faciliter l’amélioration de la prise de décision
- La progression des pratiques de gouvernance et d’intendance des données afin d’instaurer la confiance et de permettre le partage sécurisé des données entre les ministères, tout en assurant la protection de la confidentialité
- L’utilisation des outils numériques et d’analytique des données pour personnaliser les services gouvernementaux et les rendre plus adaptés aux besoins des populations
- La promotion des compétences et de la littératie en matière de données dans l’ensemble de la fonction publique au moyen de la formation et du développement des capacités, de façon à permettre aux employés d’utiliser efficacement les données dans le cadre de leurs fonctions
L’objectif poursuivi est d’aider le gouvernement à résoudre des questions stratégiques complexes, à s’adapter à l’évolution des demandes et à fournir des renseignements qui profiteront à terme aux citoyens canadiens. La confiance et la transparence seront prioritaires à mesure que davantage de données seront recueillies et exploitées.
Maintenir la confiance du public dans les partenariats en matière d’infonuagique : lignes directrices à l’intention des travailleurs du secteur public canadien
En tant qu’intendants des données des citoyens, les travailleurs du secteur public doivent préserver la confiance du public lorsqu’ils explorent les partenariats en matière d’infonuagique en répondant de façon proactive aux préoccupations soulevées en ce qui a trait à la souveraineté des données, à la sécurité, à la flexibilité et aux budgets. Cela suppose d’obtenir des garanties contractuelles sur le contrôle et la propriété continus des données canadiennes (y compris les droits extraterritoriaux) ainsi que des garanties de sécurité strictes de la part des partenaires quant au chiffrement, aux contrôles d’accès et à la prévention de l’exposition.
Les travailleurs doivent également veiller à atténuer le risque d’asservissement à un fournisseur qui pourrait réduire la compétitivité future des marchés du secteur public, analyser le coût total de possession par rapport aux budgets pluriannuels et tenir compte du soutien aux écosystèmes d’innovation nationaux dans les décisions en matière d’approvisionnement afin de trouver un équilibre entre les solutions de pointe à l’échelle mondiale et les intérêts économiques du pays.
Dans l’ensemble, les garanties contractuelles, la transparence financière, le choix concurrentiel et l’engagement envers une présence canadienne localisée qui favorise les talents nationaux sont essentiels pour que l’argent des contribuables soit utilisé de façon judicieuse dans le cadre des partenariats en matière d’infonuagique, tout en respectant les obligations du secteur public.
Une bonne stratégie de données est une condition préalable pour tirer parti de la puissance de technologies telles que l’intelligence artificielle (IA)
Le GC a besoin d’une stratégie globale de données pour gérer efficacement les ressources informationnelles. Dans l’environnement riche en données d’aujourd’hui, les organisations collectent de nombreuses données brutes, mais ont besoin de plans judicieux pour en extraire la valeur. Une stratégie de données cohérente implique une vision à long terme et des éléments concrets, mettant la technologie, les processus, le personnel et la gouvernance au service de l’accessibilité des données, d’une analyse coordonnée et d’une prise de décision éclairée.
Pour le gouvernement, cette stratégie est essentielle pour optimiser l’utilisation des données dans l’ensemble des ministères. Elle permet de définir des protocoles centralisés pour la collecte, le stockage, le partage et l’application des données de façon organisée. Cela simplifie l’utilisation des données pour l’apprentissage automatique et la modélisation de l’IA tout en institutionnalisant les meilleures pratiques. Mise en œuvre judicieusement, une telle stratégie permet la gouvernance fondée sur des éléments probants, grâce à la démocratisation des données. La clé consiste à concevoir une infrastructure durable pour gérer les données, de l’acquisition à l’analytique, afin d’en tirer constamment des informations et de fournir des services efficaces à tous les Canadiens.
Pour saisir l’occasion extraordinaire qu’offre l’intelligence artificielle pour transformer la gouvernance grâce à des informations basées sur les données, il faut d’abord mettre en place une stratégie de données solide. Tout comme une fondation instable fragilise même la maison la plus solide, des données erronées diminuent la valeur des algorithmes les plus avancés. L’adoption de technologies puissantes comme l’IA générative doit s’aligner sur les principes énoncés dans la ressource Utilisation responsable de l’intelligence artificielle (IA) du GC en ce qui concerne l’emploi licite et éthique des données et le caractère explicable des résultats pour les personnes concernées.
Une stratégie de données cohérente consiste à regrouper les informations contenues dans les silos des ministères et des organismes dans des lacs de données intégrés, ce qui constitue une condition préalable cruciale. Une préparation approfondie des données (comme le nettoyage des jeux de données incohérents, la résolution des doublons, le catalogage méticuleux de la lignée et le mappage de la signification contextuelle) est également essentielle. Seuls de tels processus peuvent générer les données riches, fiables et pertinentes nécessaires à une analyse et à une modélisation prédictive significatives permettant de tirer pleinement parti du potentiel d’aide à la gouvernance qu’offre l’IA. La fondation des données est gage d’analytique avancée.
Le GC possède d’importantes quantités de données sur la science du climat qui sont piégées dans des formats désuets comme les bandes et le papier. La numérisation et la mise à disposition de ces données dans le nuage amélioreraient considérablement l’accès à celles-ci pour les chercheurs désireux de coopérer sur des questions urgentes comme les changements climatiques.
Avec une solide infrastructure de données, les possibilités fonctionnelles de l’IA deviennent plus claires. Des modèles de prévision très précis peuvent guider des politiques proactives, par exemple en prédisant les besoins en infrastructure en fonction des projections de la croissance démographique. La personnalisation granulaire devient également possible : les algorithmes d’IA peuvent permettre de développer des alertes de santé personnalisées en évaluant les facteurs liés au mode de vie des individus. De plus, la détection continue des anomalies dans les demandes d’indemnisation et les réclamations permettrait de réduire la fraude et la corruption.
Dans l’idéal, l’optimisation de l’IA a le pouvoir de redéfinir les processus gouvernementaux. Les tâches administratives répétitives peuvent être automatisées pour améliorer considérablement l’efficacité. Les robots et les assistants virtuels peuvent fournir aux citoyens un soutien 24 heures sur 24, 7 jours sur 7 dans le cadre d’un libre-service harmonieux. Même des fonctions comme la perception des recettes et la délivrance de permis peuvent être simplifiées.
Le déluge de données de notre époque est un atout inestimable pour le secteur de l’IA. Mais à moins qu’elles ne soient intelligemment agrégées, organisées et comprises, l’IA ne peut progresser. Tout comme la construction nécessite des matériaux traités, et non bruts, une stratégie de données méticuleuse et holistique sous-tend l’avancement algorithmique. Sa mise en œuvre réussie ouvre la voie à des perspectives époustouflantes en matière de gouvernance centrée sur les données.
AWS peut aider à exploiter les possibilités des données ouvertes pour le bien public
AWS a apporté réponse aux préoccupations courantes concernant sa viabilité en tant que plateforme de données ouvertes. L’examen de chaque objection nous permet de faire état des mesures qu’AWS a prises pour faciliter le succès des données ouvertes. En répondant aux doutes sur la sécurité, l’interopérabilité, la gouvernance et la vitalité de l’écosystème, AWS montre qu’elle fournit aux clients l’infrastructure nécessaire pour atteindre en toute confiance leurs objectifs en matière de données ouvertes. L’examen individuel des appréhensions et, pour chacune d’elles, la mise en évidence des forces d’AWS démontre avec éloquence la capacité d’AWS à soutenir les objectifs du GC, ce qui permet un partage de données harmonieux et responsable entre systèmes et partenaires hétérogènes.
Préoccupations relatives à la souveraineté des données
AWS a publié l’engagement de souveraineté numérique d’AWS afin de rendre publique sa détermination à donner aux clients davantage de contrôle en ce qui a trait à leur souveraineté sur les données et à répondre à l’évolution des exigences réglementaires sans faire de compromis quant aux capacités AWS. La souveraineté des données, c’est-à-dire le contrôle des ressources numériques, est de plus en plus importante pour les clients, surtout à mesure que la réglementation évolue. Les clients se sont dits préoccupés par le fait d’avoir à choisir entre des fonctionnalités AWS complètes et des solutions infonuagiques souveraines limitées.
AWS continuera d’étendre ses capacités existantes de protection des données dans quatre sphères:
- Contrôle amélioré de l’emplacement des données
- Contrôle vérifiable de l’accès aux données
- Capacité de tout chiffrer partout
- Résilience grâce à la haute disponibilité et à la reprise après sinistre
La confiance et la transparence demeureront au cœur de l’approche d’AWS. AWS continuera de remettre en cause les demandes de données inappropriées et de fournir des preuves de conformité et des engagements contractuels. AWS travaille en étroite collaboration avec ses partenaires pour aider les clients à s’adapter à l’évolution de la réglementation et à satisfaire aux exigences en matière de souveraineté numérique sur AWS sans avoir à faire de compromis quant aux capacités AWS. L’objectif principal est de permettre aux clients de répondre à l’évolution de la réglementation des données et des exigences en matière de souveraineté tout en préservant intégralement les capacités d’innovation, l’échelle, la fiabilité et les performances qu’offre AWS.
Préoccupations relatives à la confidentialité et à la sécurité
Chez Amazon Web Services (AWS), nous nous engageons à fournir une assurance continue à nos clients par le biais d’évaluations, de certifications et d’attestations qui appuient l’adoption des services et fonctionnalités AWS actuels et nouveaux. Les travailleurs du secteur public peuvent utiliser le service AWS Artifact pour télécharger le dernier rapport sommaire d’évaluation du Centre canadien pour la cybersécurité (CCCS) en ce qui concerne AWS. Selon la dernière évaluation, un total de 150 services et fonctionnalités AWS ont été évalués par le CCCS pour les deux régions AWS au Canada (Montréal et Calgary). Les clients du secteur public peuvent profiter de la distance de 3 000 km entre les régions canadiennes pour mettre en œuvre des solutions hautement résilientes pour les Canadiens.
Nous savons que les clients se soucient beaucoup de la confidentialité et de la sécurité des données. AWS suit en permanence l’évolution du paysage réglementaire et législatif en matière de confidentialité afin d’identifier les changements intervenus et les outils dont ses clients pourraient avoir besoin pour répondre à leurs besoins en matière de conformité.
Préoccupations relatives à l’asservissement
À compter du 5 mars 2024, AWS exonère de frais de transfert de données sortantes les clients souhaitant transférer des données à l’extérieur d’AWS. Il est ainsi plus facile pour les clients de changer de fournisseur de services infonuagiques ou de revenir à un environnement sur site. Plus de 90 % des clients AWS n’encourent déjà aucuns frais de transfert de données à l’extérieur d’AWS en raison de l’offre gratuite existante. Mais les clients qui ont besoin de plus de 100 Go de capacité par mois pendant la transition peuvent contacter AWS Support pour demander des tarifs gratuits de transfert de données sortantes.
AWS examine les demandes d’exonération de frais de transfert de données sortantes au niveau du compte. Une fois les demandes approuvées, des crédits sont accordés pour les données en cours de migration. Les clients n’ont pas besoin de fermer leur compte ni de modifier leur relation avec AWS. Cette politique obéit aux directives du Règlement européen sur les données et est disponible pour tous les clients AWS dans le monde. Elle sous-tend le choix et la liberté du client de transférer des données à l’extérieur d’AWS. Cela s’aligne également sur l’adhésion d’AWS aux principes pour l’octroi de licences logicielles équitables en ce qui concerne l’utilisation de logiciels d’autres fournisseurs. En résumé, AWS permet aux clients de changer de fournisseur plus facilement tout en maintenant des relations avec elle, et ce, à travers l’exonération des frais de transfert de données sortantes pendant les transitions.
Les services AWS Snow Family et AWS DataSync ont été utilisés par le GC pour mettre en place des architectures de données portables couvrant les environnements infonuagiques et sur site. L’entreposage transportable de Snow Family facilite les migrations bidirectionnelles de jeux de données à grande échelle entre différents environnements. DataSync orchestre facilement le transfert hybride des données grâce à sa synchronisation bidirectionnelle. Les deux solutions permettent de conserver des copies de données natives sur site, en intégrant l’infrastructure externe à AWS. En soutenant des normes ouvertes pour le stockage et en se concentrant sur l’abstraction du flux de travail des données, elles minimisent les risques d’asservissement. En fin de compte, AWS fournit non seulement un point de terminaison de migration, mais aussi un pont de données interopérable pour éviter la dépendance à la plateforme.
Vous pouvez utiliser la bibliothèque Python boto3 pour communiquer à la fois avec Amazon S3 et avec d’autres magasins d’objets Web, y compris un magasin d’objets Web sur site. Ainsi, si vous décidez de transférer certaines de vos données sur site, vous pouvez utiliser le même code pour gérer à la fois un magasin d’objets Web sur site et vos données dans Amazon S3.
L’API Amazon S3, développée par AWS, offre une solution normalisée et flexible pour stocker les données non structurées dans des systèmes de stockage d’objets et y accéder. Grâce à son adoption généralisée, de nombreux produits de stockage d’entreprise utilisés par le GC, sur site ou faisant appel à d’autres fournisseurs de services infonuagiques, prennent en charge l’API Amazon S3 à des fins d’intégration.
Cette compatibilité permet une migration fluide des données entre les emplacements à l’aide de services tels qu’AWS DataSync. Le stockage compatible avec Amazon S3 offre trois avantages importants. Premièrement, la compatibilité des applications permet d’utiliser les outils existants conçus par Amazon S3 pour différentes solutions, ce qui facilite la migration et empêche l’asservissement à un fournisseur. Deuxièmement, l’API Amazon S3, largement testée, permet une gestion cohérente des données sur toutes les plateformes et garantit robustesse et fiabilité. Troisièmement, le respect des normes réduit les coûts et les efforts associés aux transitions de fournisseurs lors du transfert des données, ce qui minimise les risques en matière d’interopérabilité.
Préoccupations relatives au contrôle des coûts et du budget
Le Programme de parrainage des données ouvertes d’AWS couvre le coût de stockage des jeux de données accessibles au public optimisés pour le nuage. Voici les conditions à remplir pour y participer:
- Rendre vos données accessibles au public en vertu d’une licence permissive
- Optimiser les données et les outils pour les utilisateurs finaux et le nuage
- Mettre régulièrement à jour les jeux de données afin de préserver leur pertinence
- Fournir de la documentation sur la façon dont la communauté peut utiliser les jeux de données
Pour en savoir plus sur les règles et les exigences supplémentaires, consultez le site Web du Programme de parrainage des données ouvertes d’AWS. Le Centre de la sécurité des télécommunications héberge des jeux de données sur la cybersécurité dans le registre de données ouvertes sur AWS. De même, Ressources naturelles Canada rend disponibles dans le même registre les données d’observation de la Terre provenant de RADARSAT-1.
Le Programme de parrainage des données ouvertes n’est probablement pas l’emplacement idéal pour l’ensemble de vos archives. Par conséquent, il est préférable d’envisager comment utiliser le Programme avec des jeux de données que vous voudrez peut-être rendre publics à l’aide d’Amazon S3. Utilisé dans les architectures de lacs de données sur AWS, le service Amazon S3 offre différentes classes de stockage optimisées selon la fréquence d’accès et les coûts. S3 Intelligent Tiering transfère automatiquement les données entre les niveaux en fonction des schémas d’accès afin de réduire les coûts.
- Lorsque les schémas d’accès sont prévisibles, les politiques de cycle de vie Amazon S3 peuvent transférer les objets vers des niveaux dont les coûts sont inférieurs. S3 Storage Lens offre une visibilité sur les mesures d’accès afin d’identifier les possibilités de transition.
- Amazon S3 Intelligent-Tiering est la meilleure solution pour les schémas d’accès inconnus ou changeants, ce qui permet d’économiser jusqu’à 95 % sur les coûts de stockage. La catégorie Standard-IA comprend des frais de récupération qui peuvent augmenter considérablement les coûts en cas de changement dans les schémas d’accès.
Le Programme mondial de renonciation aux frais de transfert de données sortantes d’AWS exonère des frais de transfert de données sortantes les établissements d’enseignement supérieur, les établissements de recherche ainsi que les écoles primaires et secondaires et les établissements collégiaux (de la maternelle au cégep) admissibles afin de faciliter l’utilisation des services AWS. La remise maximale représente 15 % des dépenses totales.
Présence canadienne
Depuis 2010, Amazon a investi plus de 40 milliards USD dans ses activités au Canada, contribuant à hauteur de plus de 33 milliards USD au PIB du Canada et créant 45 000 emplois. L’infonuagique AWS a aidé quelque 200 000 Canadiens a acquérir des compétences techniques depuis 2017.
En Alberta, AWS a investi plus de 4 milliards CAD dans le nouveau centre de données de la région Canada Ouest (Calgary), ce qui devrait contribuer à hauteur de 5,62 milliards CAD au PIB de la province d’ici 2037. Cette présence d’AWS devrait représenter en moyenne annuelle 1 300 emplois locaux à temps plein.
AWS offre aux résidents de l’Alberta des programmes de formation en infonuagique sur des sujets tels que l’installation de fibres optiques par le biais d’organisations comme Momentum. Un nouveau fonds de subvention de la communauté AWS de 100 000 USD lancé en 2023 soutient les initiatives de développement durable à Calgary.
À l’échelle mondiale, AWS vise à ce que, dès 2025, toutes ses activités soient alimentées exclusivement par des énergies renouvelables. Amazon a investi dans quatre projets d’énergies renouvelables en Alberta afin d’alimenter de façon durable les centres de données AWS. Le Nuage AWS est 3,6 fois plus économe en énergie que les centres de données traditionnels.
Grâce à d’importants investissements dans l’emploi, la durabilité et le développement de compétences partout au Canada, AWS stimule l’innovation, la productivité et le développement technologique responsable.
Étapes suivantes
Si vous souhaitez en savoir plus sur la façon dont AWS peut mettre en œuvre la vision des données ouvertes, veuillez communiquer directement avec votre équipe de compte AWS ou l’équipe du secteur public AWS.