Amazon Web Services ブログ

Amazon SageMaker で高解像度胸部 X 線医療画像を分類する

医療画像処理は、深層学習が大きな効果を発揮する重要な分野の 1 つです。一般的な処理としては、様々な医用画像モダリティを用いた分類、検出、セグメンテーションがあります。このブログ記事では、HIPAA 準拠サービスである Amazon SageMaker を使用して、Amazon SageMaker 画像分類アルゴリズムで胸部 X 線画像分類の深層学習モデルをトレーニングする方法を概説します。この画像分類アルゴリズムが、高解像度医療画像を分析するための有効なツールとなり得ることを示したいと考えています。マルチラベルサポートや混合精度トレーニングなどのアルゴリズムの新しい機能を使用して、 混合精度モードを使用する胸部 X 線画像分類モデルが Amazon EC2 P3 インスタンスで float32 データタイプを使用する場合より、トレーニングによって 33% 速くなることを示します。また、高解像度の画像で胸部 X 線画像をどのようにトレーニングすることができるかを示し、低解像度のモデルでもパフォーマンスを向上できることを示します。 高解像度胸部 X 線医療画像の分類 ディープニューラルネットワークベースのアプローチは、通常は、メモリの制約のために低解像度の画像で動作します。画像分類 (ResNet-152) で使用する一般的なディープネットワークでは、256×256 サイズの画像でも大きなメモリが必要です。また、メモリ要件は、トレーニングで使用するバッチサイズにも依存します。ただし、一部の疾患は、胸部 X 線画像の小さな領域にしか存在しないため、高解像度画像分類の恩恵を受ける可能性が高くなります。 胸部 X 線画像のデータセットは、アメリカ国立衛生研究所 (NIH) [1] から公表されており、https://nihcc.app.box.com/v/ChestXray-NIHCC から入手できます。このデータセットは、30,805 人の患者からの 112,120 件の正面図 X 線画像で構成されます。これらの画像は、自然言語処理を使用して、関連付けられた放射線レポートからマイニングされた最大 14 のテキストマイニング病気画像ラベルを含むことができます。これらの 14 のラベルのいずれも、それぞれの X 線に関連付けることができることが、マルチラベル画像分類の問題となります。疾患のラベルは、無気肺、浸潤影、浸潤、気胸、浮腫、気腫、線維症、滲出、肺炎、胸膜肥厚、小瘤、結節、腫瘤およびヘルニアです。 近年、胸部 X 線画像分類に深層学習アルゴリズムが適用されています [1]。ImageNet […]

Read More

IP アドレスで、Jupyter ノートブックインスタンスへのアクセスを制限する

セキュリティを強化するため、Amazon SageMaker のお客様は、ノートブックインスタンスへのアクセスを一定の範囲の IP アドレスに限定することができます。 IP アドレスによるフィルタリングは、トラフィックのサブセットのみがノートブックインスタンスにアクセスできるようにする必要がある場合に役立ちます。ノートブックのアクセスを制限するのは、以下のような場合です。 IP アドレスの特定のホワイトリストを除いてトラフィックをブロックすることにより、セキュリティとコンプライアンスの要件を満たす場合。 特定の地域や人口をテストする場合。 一群の人々にのみ実験中のアクセスを許可する場合。 ノートブックインスタンスへのアクセスを IP アドレスで制限するには、Amazon SageMaker ノートブックにアクセスするすべてのユーザーまたはグループの AWS Identity and Access Management (IAM) ロールに、IP アドレスの条件付き演算子があるポリシーをアタッチする必要があります。IAM は、AWS のリソースへのアクセスを安全にコントロールするのに役立つウェブサービスです。ポリシーとは、アイデンティティまたはリソースにアタッチして、そのアクセス許可を定義するエンティティです。 IP アドレスの条件付き演算子がある IAM ポリシーは、指定したリストにある IP アドレスからの呼び出しでない限り、 CreatePresignedNotebookInstanceUrl および AuthorizedUrl へのアクセスを拒否します。また、このポリシーは、Amazon SageMaker コンソールでノートブックインスタンスを開くアクセスも制限します。Effect を「Deny」と定義し、NotIpAddress 条件付き演算子を aws:SourceIP キーで使用することで、ノートブックインスタンスへのアクセス許可を付与したい IP アドレスのリスト以外のインターネットから来るすべてのトラフィックをブロックできます。 IP アドレスの条件は、キーを IPv4 または IPv6 のアドレスあるいは IP アドレスの範囲と比較することに基づいてアクセスを制限します。 値は、標準 CIDR 形式 (例、203.0.113.0/24 または 2001:DB8:1234:5678::/64) […]

Read More

Zhiyu の登場 — Amazon Polly による初の中国語 (北京語) 音声

 Amazon Polly は、テキストを生きた話し声に変換する完全に管理されたサービスです。Amazon Polly による中国語 (北京語) のサポートをお知らせします。Zhiyu は、明瞭、明るく、自然に聞こえる女性の声です。 Zhiyu の自己紹介をお聞きください。再生ボタンをクリックして、音声をお聞きください。 今すぐ再生 Amazon Pollyの音声 Zhiyu は中国語 (北京語) で「大家好,我叫知语,我是亚马逊 Polly 的中文女声,很高兴认识大家」と自己紹介しています。 日本語の翻訳は、「こんにちは、Zhiyu です。私は Amazon Polly の中国語 (北京語) 音声です。はじめまして」と言っています。 中国語 (北京語) は世界で最も話者の多い言語の 1 つです。世界中で 10 億人以上の話者がいると推定されます。この言語は Amazon Polly のお客様から最も要求の多かった言語の 1 つです。 すでにアプリケーションで Zhiyu を利用している複数のお客様がいます。Netvue Belle はホームセキュリティとスマートホーム支援の両方を提供する AI 対応のインターホンです。このインターホンは訪問者に休日ごとに異なる挨拶をして、宅配便にも対応できます。Zhiyu の生きた話し声を使用して、Netvue は中国語 (北京語) を話すお客様に、より自然で、個人的なやり取りを実現します。 AWS アカウントがあれば、Amazon Polly でサポートされている AWS […]

Read More

AWS – 次の嵐に備えて

以前触れたように (AWS – Ready to Weather the Storm)、ハリケーンや嵐などの自然災害に直面した場合でも AWS が確実に稼働し続けられるよう、私たちは幅広い予防策を講じています。ハリケーン「フローレンス」が米国東海岸に向かっていることから、これは過去記事の最も重要なポイントを振り返り、情報を最新のものにしておくのに最適なタイミングだと考えました。押さえておくべき事項は、以下のとおりです。 アベイラビリティゾーン – 高可用性を確保するため、AWS の必須コンポーネントについては複数のアベイラビリティゾーンをまたいでレプリケートしています。ジェネレーター、UPS ユニット、空調などの一般的な障害点については、アベイラビリティゾーンをまたぐ共有はされていません。電力系統は完全冗長設計で、運用に影響を与えることなく維持できます。AWS Well-Architected フレームワークでは、複数のアベイラビリティゾーンを適正に使用して信頼性と回復力の高いアプリケーションを構築するための手引きを提供しています。また、ホワイトペーパー AWS クラウドでの耐障害性のあるアプリケーションの設計でも情報を提供しています。 緊急時対応計画 – 緊急時対応計画を整備し、対応について定期的に予行演習を行っています。得られた教訓を盛り込んで新たな脅威に備えるべく、一連の事故対応計画を整備し、定期的に更新しています。ハリケーンなど、すでにわかっている出来事が起こるまでの数日間、燃料調達を増やし、人員の配置プランを更新し、サポートチームの健康と安全を確保するための備えを増強します。 データ転送 – デバイスあたり 100 TB のストレージ容量を備えているので、AWS Snowball Edge の設備を使用して迅速に大量のデータをクラウドに移動できます。 災害対応 – 災害の前後および最中に、コールスパイクが発生する場合、Amazon Connect でお客様の既存のコールセンター能力を補い、応答を改善させることが可能です。 サポート – こうした問題でお困りの場合には、AWS サポートに連絡してください。 — Jeff    

Read More

最新 – AWS Systems Manager セッションマネージャーで EC2 インスタンスへのシェルアクセスを実現

今は企業の IT 管理者となるのに、非常に興味深い時代です。その一方で、開発者たちは素晴らしい未来について話題にし、それを実行しています。そこではインフラストラクチャをコード化し、サーバーやその他のリソースをまるで家畜のように取り扱っています。また、一方ではレガシーシステムは依然としてペットとして取り扱い、人の手、もしくは一部制限のある自動化の助けを借りて設定および保守しなければなりません。私が日々やり取りをするお客様は、速いペースで未来へと変革を進めていますが、現状存在する世界と仕事をすることも避けられません。たとえば、時々、自社のサーバーにシェルレベルでアクセスする必要性が生じます。彼らがランウェイプロセスを中断すること、サーバーログを確認すること、設定を細かく調整すること、または一時的なパッチをインストールすることなど、これらを実行する一方で強いセキュリティプロファイルを維持しなくてはなりません。彼らは Bastion のホストを稼動させるうえで生じる手間と、インスタンス上の SSH ポートを開く際に起こるリスクを軽減したいと考えています。 私たちは既に、AWS Systems Manager ランコマンドを使い、シェルレベルのアクセスの必要性に既に対処しています。この AWS の能力により、管理者は EC2 インスタンスに安全にアクセスできるようになります。この製品により彼らはコマンドの文書を作成し、希望する EC2 インスタンスのセットに対し、それらを実行できるようになります。また、その両方で Linux と Microsoft Windows のサポートが確保されます。コマンドは非同期的に実行され、出力はレビュー用に取得されます。 新しいセッションマネージャー 本日、シェルレベルアクセスに新しいオプションを追加します。新しいセッションマネージャーにより AWS Systems Manager がこれまで以上にパワフルになります。これからはブラウザベースの新しいインタラクティブシェルとコマンドラインインターフェース (CLI) を使用し、Windows と Linux のインスタンスを管理できるようになります。サービスの詳細は以下のとおりです。 セキュアなアクセス – インスタンス上でユーザーアカウント、パスワード、または SSH キーを手でセットアップする必要はなく、インバウンドポートを開く必要もありません。セッションマネージャーはインスタンス上で開始される暗号化されたトンネル内で SSM エージェント経由でインスタンスと通信を行い、踏み台となるホストを必要としません。 アクセスコントロール – IAM ポリシーとユーザーを使用してインスタンスへのアクセスをコントロールし、SSH キーを配布する必要はありません。IAM の日付条件演算子を使用して希望の時間へのアクセスやメンテナンスの時間枠に制限を設けることができます。 監査能力 – コマンドと応答は Amazon CloudWatch と S3 バケットにログ記録可能です。新しいセッションが始まった時点で SNS […]

Read More

Amazon Athena を使用した SageMaker ノートブックからの SQL クエリの実行方法

インターネットの登場以来、データの肥大化、高速化、多様化が進んでいます。多くの企業は、この「ビッグデータ」の管理という問題を抱えており、「ビッグデータ」を解釈して、最適な結果を生み出すことに苦戦しています。データの収集、保存、共有、分析、可視化を難しくしている原因として、企業におけるデータのサイロ化、途切れることのない多種多様なフォーマットのデータ流入、テクノロジーを取り巻く環境の絶え間ない変化が挙げられます。それでは、データストアに接続する堅牢なデータパイプラインを構築し、データからインサイトを取得できるようなプラットフォームをデータサイエンティストやエンジニアに提供するにはどうすればよいでしょうか。 データストアの一元化に投資する企業が増えつつあります。また、 Amazon Simple Storage Service (S3) をデータレイクとして使用することのメリットが理解されるようになってきました。データレイクに接続するデータパイプラインを構築する場合、データディスカバリープロセスが必要になります。このプロセスには、データフォーマットおよびスキーマの識別、データのカタログ化、テーブル定義作成のためのメタデータの把握、データをクエリするための機能の提供が含まれます。 本ブログ記事では、データパイプライン構築に要する全ステップをご紹介します。Amazon S3 のデータを対象としたクローラーの作成、データディスカバリーおよびカタログ化のための AWS Glue の使用から、テーブルメタデータを保存および取得するための Amazon Athena の使用、Athena テーブルに対してクエリを実行するための Amazon SageMaker の使用まで、さまざまなステップをカバーします。 Amazon SageMaker はエンドツーエンドの機械学習 (ML) プラットフォームであり、AWS 上で機械学習モデルの構築、トレーニング、デプロイに使用できます。このサービスには高度なモジュール方式が採用されており、各コンポーネントは組み合わせても単体でも使用できるようになっています。Amazon SageMaker ノートブックモジュールを使用すれば、データをローカルに取り込む際に発生するレイテンシーを抑えて、データ操作の効率性を向上させることができます。それでは、Amazon SageMaker の Jupyter ノートブックコンポーネントを使用して、Athena との統合とデータフレームへの入力を行い、データ操作を実現する方法をご説明します。 本ブログ記事では例として、航空会社の定時運行に関する 2008 年のデータセットを使用します。このデータセットは、1987 年 10 月から 2008 年 4 月までの米国内の全民間航空便を対象としており、各フライトの発着に関する詳細な情報で構成されています。このデータはまず Amazon S3 にアップロードし、AWS Glue と Athena で使用できようにし、次に Amazon SageMaker で使用できるようにします。 AWS Glue […]

Read More

Mapillary が、Amazon Rekognition を使用して、米国の都市向けの駐車ソリューションを構築

Mapillary は、人々や組織がジオタグ付きの写真をアップロードできる協調型のストリートレベルの画像プラットフォームであり、これを使用してマッピングのシステムやアプリケーションを改善することができます。 Mapillary は、深層学習ベースの画像および動画分析サービスである Amazon Rekognition を使用してメタデータ抽出を強化しています。Amazon Rekognition の DetectText 操作を使用することにより、Mapillary は交通標識や駐車標識の画像からテキストを検出および抽出し、マッピングデータを充実させることができます。 「Amazon Rekognition でテキストを検出する際の精度が、一貫して正確であることが分かりました」と、Mapillary のコンピュータビジョン責任者である Yubin Kuang 氏は言います。「Mapillary は、既にストリートレベルの画像の世界で最も優れたコンピュータビジョンを構築しているため、Amazon Rekognition の DetectText API を統合すると、Mapillary の技術によって自動的に検出される交通標識や駐車標識からテキストを抽出できるようになります。このワークフローは開発サイクルを短縮し、駐車インフラの概要を大規模で把握することを可能にします。」 アーキテクチャ Mapillary は、Amazon S3 に何億もの画像を保存しています。こうした画像は、あらゆる場所の人々や組織によって Mapillary にアップロードされます。Mapillary の交通標識検出パイプラインで Amazon Rekognition の DetectText API 操作を使用すると、ストリートレベルの画像から抽出されたメタデータは、Elasticsearch クラスターを使用して検索可能になります。たとえば、次の例は、ユーザーが Mapillary にアップロードした画像を示しています。緑色のボックスは交通標識が Mapillary で検出されたことを、白色のボックスは Rekognition が検出、抽出し、機械で判読可能なテキストに変換したテキストであることを強調表示しています。 「Amazon Rekognition のこの作業により、米国の都市の駐車を改善するソリューションを開発できます」と、Mapillary の CEO 兼共同設立者である Jan Erik […]

Read More

SAP HANAを使用したAWSデータレイクに対するフェデレーテッドクエリの実行

この記事は、Amazon Web Services (AWS)でソリューション アーキテクトを務めるHarpreet Singhによるものです。 アバディーンの調査によると、データレイクを導入している組織は、類似企業に比べて有機的収益成長率が9%上回ることが明らかになっています。 データレイクは、これらの企業がデータから有意義な洞察をする能力を得て、競合他社と差別化を図るための行動を促進します。 耐久性とコスト効率を備えたAmazon Simple Storage Service (Amazon S3)は、AWSデータレイクのストレージ層として使用する魅力的な理由があります。これらのお客様の多くは、SAP HANAベースのアプリケーションをAWS上で導入しており、SAP HANAとAmazon S3ベースのデータレイクにあるデータを使用した分析基盤を構築して、分析実行には主にSAP HANAを使用したいと考えています。

Read More

Amazon AppStream 2.0 – 新しいアプリケーション設定のパーシステンス機能の紹介および 2018 年に追加された機能概括

Amazon AppStream 2.0 を使用すると、ウェブブラウザ経由で Windows のデスクトップアプリケーションにアクセスできるようになります。SOLIDWORKS、Siemens、MathWorks など、数千社にのぼる AWS のカスタマーがすでに AppStream 2.0 を使用してアプリケーションを客先に届けています。 今回は、AppStream 2.0 の直近の追加機能をいくつかまとめておさらいをしておきたいと思います。さらには、アプリケーションのカスタマイズ (環境設定、ブックマーク、ツールバー設定、接続プロファイルなど) およびユーザーのセッション間の Windows 設定を自動保存するまったく新しい機能を詳しくご紹介します。 AppStream 2.0 で最近追加された機能は、次の 4 つに分類できます。 ユーザー機能強化 – タイムゾーン、ロケール、言語入力のサポート、コピーアンドペースト操作の改善、新しいアプリケーションのパーシステンス機能。 管理者向けの改善点 – アプリケーションのデフォルト設定、一部のシステムリソースに対するアクセス権限の管理、複数の AWS リージョンにまたがるイメージのコピー、ブランディングのカスタマイズ、複数の AWS アカウント同士のイメージ共有。 ストレージの統合 – Microsoft OneDrive for Business および Google Drive for G Suite のサポート。 利用可能リージョンの拡大 – AppStream 2.0 を利用できる AWS リージョンが、欧州およびアジアで 3 […]

Read More

AWS のメディア解析ソリューションを使用して、メタデータの自動抽出を使い始める

 AWS でメディア解析ソリューションを使用して、メディアファイルから意味のあるメタデータを簡単に抽出することができます。 メディア解析ソリューションは、数分でメディアファイルから意味のあるメタデータの抽出を始めるために使用できる AWS CloudFormation テンプレートを提供します。ウェブベースのユーザーインターフェイスを使用すると、簡単にファイルをアップロードし、自動的に抽出されたメタデータを表示することができます。 このソリューションは、顔認識に Amazon Rekognition、文字起こしの作成に Amazon Transcribe、文字起こしでの感情分析に Amazon Comprehend を使用します。独自の画像を Amazon Rekognition コレクションにアップロードして、個人を認識できるようにソリューションをトレーニングすることもできます。 料金を支払うのは、このソリューションをテストするときに使用するサービスに対してのみです。1080p HD ビデオの場合、このソリューションを開始するのに必要なコストは、1 時間あたり 8 USD 以下です。このソリューションは、メディアライブラリにインデックス付けされるメタデータの量に基づいて、さまざまなサイズで利用できます。サイズに応じた価格の範囲は月額 300 – 1,000 USD で、主にメタデータのインデックス付け、検索、保存のための Amazon Elasticsearch Service のコンピューティングとストレージのコストで構成されています。 このブログ記事では、ソリューションを起動して画像やビデオをアップロードする方法を段階的に示します。メタデータがどのようにしてシームレスに抽出されるかを直接見ることができます。 注意: このソリューションは、現在は特定の AWS リージョンでのみ利用可能である Amazon Rekognition、Amazon Comprehend、Amazon Transcribe を使用しています。したがって、このソリューションは、これらのサービスが利用可能な AWS リージョンで起動する必要があります。最新のリージョン別の AWS のサービスの利用可用性については、リージョン別の AWS のサービス内容をご覧ください。 ステップ 1: メディア解析ソリューションのデプロイ ユーザー名とパスワードを使って、AWS マネジメントコンソールにサインインします。メディア解析ソリューションへ移動して、[Deploy […]

Read More