Amazon Web Services ブログ

AWS Japan Staff

Author: AWS Japan Staff

Amazon SageMaker Debugger – 機械学習モデルのデバッガ

2019年12月3日、機械学習(ML)学習時に起こる複雑な問題を自動的に識別する Amazon SageMaker の新しい機能、Amazon SageMaker Debugger を発表できて非常にうれしく思います。 機械学習モデルの構築と学習は、サイエンスと工芸の融合です(魔術と言う人もいます)。データセットの収集から準備、さまざまなアルゴリズムの実験、最適なトレーニングパラメーター(恐ろしいハイパーパラメーター)の探索まで、機械学習を実行する人は高性能のモデルを提供するために多くのハードルをクリアする必要があります。これがまさに、機械学習ワークフローを簡素化し高速化する、モジュール式のフルマネージドサービス Amazon SageMaker を構築する理由なのです。

Read More

AWS Transit Gatewayにマルチキャストとインターリージョンピアリング機能を追加

AWS Transit Gateway は、1 つのゲートウェイを使用して、数千の Amazon Virtual Private Cloud(VPC)とオンプレミスネットワークを接続できるサービスです。 お客様は、このサービスがもたらす運用コストの削減と全体的なシンプルさを享受しています。 さらに、本日(2019/12/03) AWS Transit Gateway インターリージョンピアリングと AWS Transit Gateway マルチキャストという 2 つの新機能がリリースされました。 ピアリング お客様がAWSでワークロードを拡張するときに、複数のアカウントやVPCにまたがってネットワークを拡張する必要があります。お客様は、VPCピアリングを使用して VPC のペアを接続するか、PrivateLink を使用して VPC 間でプライベートサービスエンドポイントを公開することができます。 しかし、この管理は複雑です。 AWS Transit Gateway インターリージョンピアリングでは、これに対処し、複数のAWSリージョンにまたがるセキュアでプライベートなグローバルネットワークを簡単に作成できます。 インターリージョンピアリングを使用すると、組織内の異なるネットワーク間で一元化されたルーティングポリシーを作成し、管理を簡素化し、コストを削減できます。 インターリージョンピアリングを流れるすべてのトラフィックは匿名化、暗号化され、AWS バックボーンによって伝送されるため、リージョン間の最適なパスが常に最も安全な方法で確保されます。 マルチキャスト AWS Transit Gateway Multicast を使用すると、クラウドでマルチキャストアプリケーションを構築し、接続された数千の仮想プライベートクラウドネットワークにデータを配信することが容易になります。 マルチキャストは、単一のデータストリームを多数のユーザーに同時に配信します。 これは、ニュース記事や株価などのマルチメディアコンテンツやサブスクリプションデータをサブスクライバーグループにストリーミングするための好ましいプロトコルです。 AWS は、お客様がアプリケーションをクラウドに移行し、AWS が提供する伸縮自在性と拡張性を活用できるようにするネイティブのマルチキャストソリューションを提供する最初のクラウドプロバイダーです。今回のリリースでは、Transit Gatewayにマルチキャストドメインが導入されました。 ルーティングドメインと同様に、マルチキャストドメインを使用すると、マルチキャストネットワークを異なるドメインにセグメント化し、Transit Gateway を複数のマルチキャストルーターとして動作させることができます。 今すぐ利用可能 これら2つの新機能は準備ができており、今日あなたが試すことを待っています。 インターリージョンピアリングは、米国東部 (バージニア北部)、米国東部 […]

Read More

Amazon Redshift の新機能 – データレイクエクスポートとフェデレーテッドクエリー

データウェアハウスは、トランザクション系システムや業務アプリケーションから届いたリレーショナルデータの分析に最適化されたデータベースです。Amazon Redshiftは高速でフルマネージドのデータウェアハウスであり、標準SQLや既存のビジネスインテリジェンス(BI)ツールを用いたデータ分析をシンプルかつ効率的に行うことを可能にします。 データウェアハウス内に格納されていないであろう非構造化データから情報を習得するためには、データレイクを構築するという手段があります。データレイクは、全ての構造化データと非構造化データをあらゆるスケールで格納可能な、一元化されたレポジトリです。Amazon Simple Storage Service (S3)上に構築されたデータレイクによって、ビッグデータ分析を行い、機械学習を用いて準構造化データセット(JSON、XMLなど)や非構造化データから知見を得ることが簡単に行えるようになります。

Read More

Amazon SageMaker Studio: 機械学習のための初の統合開発環境

2019年12月3日、Amazon SageMaker Studioという機械学習のための初の統合開発環境(IDE)を提供できることを非常に嬉しく思います。 2017年に Amazon SageMaker がリリースされてからしばらく経ち、このサービスをご利用いただいているお客様の数は増加しています。機械学習開発ワークフローには反復的なプロセスが必要ですが、機械学習ツールが成熟していないために開発者は大変な思いをしてきました。従来のソフトウェア開発時に開発者が当たり前に使用する多くのツール(デバッガ、プロジェクトマネジメントツール、コラボレーション機能、モニタリングツールなど)は、まだ機械学習用には存在していないのです。

Read More

Amazon SageMaker Experiments – 機械学習モデルの整理、追跡、比較、評価

2019年12月3日、機械学習(ML)実験とモデルバージョンの整理、追跡、比較、評価を可能にする Amazon SageMaker の新機能である、Amazon SageMaker Experiments を発表できて非常にうれしく思います。 機械学習では非常に多くの反復プロセスを含みます。1つのプロジェクトの過程で、データサイエンティストと 機械学習エンジニアは、最大限の精度を求めて数千の異なるモデルを定期的に学習を行います。実際、アルゴリズム、データセット、および学習パラメーター(別名ハイパーパラメーター)の組み合わせの数は無限に存在します。それはまさに「干し草の山の中にある1本の針を探す」ということわざのように無駄骨を折る苦労を伴います。

Read More

AWS Transit Gatewayの新機能– Network Managerを使用してグローバルネットワークを構築し、モニタリングを集中化

会社が成長し、クラウドベースのインフラストラクチャのメリットを享受するにつれて、オフィスや店舗などのオンプレミスサイトは、AWSや他のサイトへの高性能なプライベート接続を手頃なコストでますます必要としています。専用回線に基づく従来のブランチネットワークはコストがかかり、従来のデータセンターと同じ弾力性と俊敏性の欠如に悩まされているため、ネットワークの成長は困難です。 同時に、AWSリージョンとオンプレミスサイトに広がるグローバルネットワークの管理と監視がますます複雑になっています。これらのさまざまな場所からのデータをつなぎ合わせる必要があります。これにより、一貫性のない運用経験、コストと労力の増加、さまざまなテクノロジーにわたる可視性の欠如からの見落としが生じます。 現在、AWS Transit Gatewayの次の新機能により、グローバルネットワークの構築、管理、監視を簡単にしたいと考えています。 トランジットゲートウェイのリージョン間ピアリング 高速化されたサイト間VPN AWS Transit Gatewayネットワークマネージャー

Read More

Amazon Managed Apache Cassandraサービス(MCS)がアナウンスされました

大規模なデータベース管理は決して簡単ではありません。キーと値や表形式を含む大量の構造化データを保存、取得、管理するオプションの1つにApache Cassandraがあります。Cassandraでは、表現力豊かなCassandra Query Language(CQL)  を使用して、アプリケーションを迅速に構築できます。 ただし、大規模なCassandraクラスターの管理は困難な場合があり、多くの時間がかかります。基盤となるインフラストラクチャのセットアップ、構成、および保守には専門的な専門知識が必要であり、Apache Cassandraオープンソースソフトウェアを含むアプリケーションスタック全体を深く理解するひつようがります。ノードを手動で追加または削除し、パーティションを再調整する必要があります。必要なパフォーマンスでアプリケーションを使用可能に保ちながら、再調整を行うことも必要です。顧客と話をすると、スケールダウンが複雑であるため、ピーク負荷に合わせてクラスターをスケールアップし続けることが多いことがわかりました。Cassandraクラスターを最新の状態に保つには、ノードごとに実行する必要があります。更新中に問題が発生した場合、クラスターのバックアップと復元は難しく、パッチをスキップしたり、古いバージョンを実行したりする可能性があります。

Read More

Amazon Redshift の新機能 – 次世代コンピュートインスタンスと、マネージドで分析に最適化したストレージ

私たちはAmazon Redshiftを2012年にローンチしました(Amazon Redshift – The New AWS Data Warehouse)。数万ものお客様を抱え、今では世界で最も人気のあるデータウェアハウスとなっています。私たちのお客様は、業界を牽引するコストパフォーマンスで享受できる高速なパフォーマンス、複雑なクエリのサポート、トランザクション機能などに満足しています。 オリジナルのRedshiftのモデルは、計算能力とストレージのキャパシティが強固に結びついた形で規定されています。特定数のインスタンスからなるクラスターを作成すると、同時にインスタンスが搭載するローカルストレージの総量が約束されます(ときには総量によって容量が限定されます)。Concurrency Scaling(同時実行スケーリング)によって追加の処理能力を得ることもできますし、数分でクラスターのスケールアウトやスケールダウンが可能なElastic Resize(伸縮自在なサイズ変更)を使うことができるため、変化する処理能力やストレージの要求に適応することが可能です。 私たちはもっとうまくやれると思っています!今日、私たちはRedshiftに、処理能力とストレージをそれぞれ別々に最適化することができる新しいストレージ管理モデルで支えられている、Nitroベースの次世代コンピュートインスタンスをローンチします。このローンチは、ネットワークの広帯域化、Amazon Simple Storage Service (S3)を背後に持つSSDベースのローカルストレージを利用するマネージドストレージ、そしてS3との間で行き来するデータの動きを最適化するための複合的で高度なデータ管理技術といった、アーキテクチャの改良を利用しています。

Read More