Amazon Web Services ブログ

がんの早期発見を促進するために Matrix Analytics が AWS でディープラーニングを使用

Matrix Analytics は人の命を救うために使われています。コロラド州のスタートアップ企業は肺結節と診断された患者の疾患の進行経過を追うために、アマゾン ウェブ サービス (AWS) でディープラーニングを使用しています。大方の場合、結節が良性でも慎重に監査したりフォローアップ治療を行うことは、結節が悪性腫瘍になった場合に重要な意味を持つことになります。 同社の設立者である Dr. Aki Alzubaidi 氏は、Glenwood Springs 病院に勤務していた時に見過ごされている患者が何人もいることに気付きました。患者の様子を把握するためのシステムは面倒な上にまとまりがなく、肺結節と診断された多くの患者が推奨されているフォローアップ治療を受けていないという、避けられるはずの粗末な結果を生み出していました。 がんリスクの予測と治療の管理 同社のフラッグシップアプリケーションである LungDirect は、初期のがん介入に二面性を持つアプローチを使用して悪性の危険性を予測したりフォローアップ治療を自動化しています。 まず、ディープラーニングのアルゴリズムを使用して構築した高度なコンピュータビジョン機能は、肺結節の悪性のリスクを結節の大きさや形、密度、容積、そして患者の喫煙年数、年齢、性別、人種などをもとに診断します。「放射線検査、臨床検査、個人的な臨床レベルでの変化など、臨床的な情報を考慮に入れ、病状について説明し次の対策に関する実用的な提案と管理方法を提供することが、ディープラーニングを利用する我々が目指すゴールです」と Dr. Alzubaidi 氏は述べています。 データに潜んでいるかもしれない非線形性クラスから成るがんリスクの診断を行うために、Machine Learning の 5 つのクラスを適用しています。こうした機能の 4 つのクラスは、一連のコンピュータビジョンアルゴリズムを使用してイメージから直接自動的に抽出されます。 がんの予測や診断を行うために、患者のスキャンを自動的に読み取れるツールを開発することは簡単ではありませんでした。けれども、Matrix Analytics は PoC (実証支援) を示すプロトタイプを素早く開発することができました。次に、当社のディープラーニングモデルを実装して、既存の論文で表示されている基準と比較しました。

Read More

Amazon ElastiCache の更新 – Redis クラスターのオンラインサイズ変更

Amazon ElastiCache では、高速なインメモリ型データストアおよびキャッシュを簡単にセットアップできます。ElastiCache は、最も人気のある 2 種類のオープンソースのソフトウェア (Redis および Memcached) をサポートしているため、要求の高いゲームのリーダーボードやインメモリアナリティクス、大規模なメッセージングのニーズに対応できます。 本日は、Amazon ElastiCache for Redis に追加された重要な機能についてご紹介します。最大 15 のシャードを作成して、それぞれに特定のスロットセットのキーと値を保存することができます (各クラスターの厳密なスロット数は 16,384 個)。1 つのクラスターで 3.55 テラバイトのインメモリデータを保存できると同時に、1 秒あたり 2,000 万回の読み取りと 450 万回の書き込みが可能です。 オンラインのサイズ変更 実行中の Redis 用 Amazon ElastiCache クラスターでシャード数を調整しながら、そのクラスターのオンライン状態を維持してリクエストに応答できるようになりました。これにより、クラスターをオフラインにしたり、空のキャッシュを使用しなくても、トラフィックやデータのボリュームの変更に対応することができます。また、シャード数を変更せずに、実行中のクラスターを再分散してスロットスペースを均一に再配置することもできます。 リシャーディングオペレーションまたは再分散オペレーションを開始すると、Redis 用 ElastiCache は、クラスターのシャード間でスロットが均等分散されるように計画の準備を開始します。その後、シャード全体にスロットを転送し、効率性を重視して並列的に多数のスロットを移動します。これは、クラスターでリクエストに応答する場合に行われ、送信時のスロットへ書き込む書き込みスループットが少し上がります。移行率は、インスタンスタイプ、ネットワーク速度、スロットへの読み込み/書き込みトラフィックによって異なり、通常 1 分あたり約 1 ギガバイトです。 リシャーディングオペレーションと再分散オペレーションは、クラスタモードを有効にして作成された Redis クラスターに適用されます。 クラスターのリシャーディング 一般的に、大幅なメモリプレッシャーの問題に直面したり、個々のノードがボトルネックになった場合は、リシャーディングでクラスターを拡張します。クラスターの CloudWatch メトリクスを監視すれば、以下のような状況を識別できます。 メモリプレッシャー – FreeableMemory、SwapUsage、BytesUsedForCache。 CPU ボトルネック […]

Read More

12 月の AWS Black Belt オンラインセミナーのご案内

こんにちは。プロフェッショナル サービスの宮本です。AWS Black Belt オンラインセミナー12月の配信についてご案内させて頂きます。サービスカットは、10/24 に Generally Available を迎えた Amazon Aurora with PostgreSQL Compatibility をはじめ、今月も様々なテーマを取り扱います。また、ソリューションカットは、「AWSサービスを利用したアプリケーション開発を始めよう」と題して、AWSにおけるアプリケーション開発に活用できる様々なサービスについてご紹介や、AWSにおけるIPv6のサポート状況についてご紹介します。                         12月の開催予定 サービスカット 12/6(水) 18:00-19:00 Amazon Elasticsearch Service 12/14(木) 18:00-19:00 Amazon ElastiCache ※ 通常の開催曜日と異なりますのでご注意ください。 12/20(水) 18:00-19:00 Aurora PostgreSQL ソリューションカット 12/1(金) 12:00-13:00 AWS re:Invent 2017 Report  ※ 通常の開催曜日と異なりますのでご注意ください。 12/5(火) 12:00-13:00 […]

Read More

SSML の新しい声道機能を使用して Amazon Polly の声の音色を変更

本日、Amazon Polly チームは、開発者がテキスト読み上げ (TTS) 音声の音色を変更できるようにする、新しい音声合成マークアップ言語 (SSML) 機能のリリースを発表します。これは、Amazon Polly ポートフォリオの既存の音をカスタマイズし、ユースケース用に探している特定のペルソナの音に近づけることを希望するお客様にとって魅力的な機能です。特に、多くの異なる音が関連するシナリオを持つお客様にとって有益です。音色機能により、利用可能な各 Amazon Polly の声から複数の音のペルソナを簡単にカスタマイズできるためです。 音色とは 音色は、ピッチや大きさとは独立した、音の知覚色または品質を表します。これは、よく音楽で金管楽器と弦楽器の違いを指摘したり、ビオラとバイオリンの微妙な区別を表したりする場合などに使用されます。音色は、各楽器が同じボリュームで同じ音符を演奏していても、それぞれを区別する知覚属性です。音声においても同様に、ピッチ (基本周波数) と大きさ (振幅) が同じでも、音色により 1 つの声が別の声から区別されます。 各個人の声の音は、その人物の生理機能や発声方法を含むさまざまな要素により、独自のものになります。個人の声帯、声道、そして体全体の大きさや形でさえも、その人物の標準的な音声品質を形作るうえで重要な役割を果たします。人の舌の位置、筋肉を緊張または弛緩させる方法、空気圧を加える方法は、声のピッチ、ボリューム、音色を変えるための技法の一部にすぎません。訓練を受けた物まね役者は、自分の声をまるで他人のように変えることができるレベルまで、これらの動きを制御する方法を会得しています。 声道とピッチ 音声の音色に貢献する重要な生理機能として、声道があります。これは声帯上部から唇の端までにおよぶ空気の通り道です。声道を長くしたり短くしたり、または広げたり狭めたりして、その形を変更できるようにするさまざまな筋肉があります。こうした変更の効果によって、音声が増幅または除去されて聞こえます。 ピッチは、音声を高く、または低く聞こえるようにする聴覚属性です。音声生成においては、ピッチは声帯の振動周波数によって決定されます。一般的に、女性の声帯は男性と比較して短く、より多く (1 秒あたり 180~200 回) 振動します。男性の声帯は平均的により長く、より少なく (1 秒あたり 最大 110 回) 振動します。同様に、平均的な声道の長さは、女性が男性よりも短くなっています (最大 14cm 対最大 17cm)。 声帯の長さと声道の長さとの間には自然な相関関係があり、どちらか 1 つが大きければ、もう一方も大きくなる傾向があります。音色機能では、開発者がピッチを制御する機能を維持しながら、声道の大きさを変更することができます。 声道と音声合成 vocal-tract-length SSML タグを使用して話者の声道の長さを変更することで、入力音声の音色を制御できるようになりました。これは話者の体の大きさを変更したかのように聞こえます。 vocal-tract-length を変更すると、話者の音声は体が大きくなったかのように聞こえます。このタグを小さくすると、小さい体のような音になります。このタグは Amazon Polly のテキスト読み上げポートフォリオのいずれの声にも使用できます。 話者の声道の長さを変更する方法は次のとおりです。 +n% または -n%: 現在の声で、相対割合 (%) […]

Read More

今すぐご利用可能 – Amazon EC2 コンピューティング最適化インスタンス C5

新しくコンピューティングに最適化されたC5インスタンスが、3つのAWSリージョン、6つのインスタンスサイズでリリースされ、今日から利用可能であることを発表することに興奮しています! これらのインスタンスは、バッチ処理、分散解析処理、高性能コンピューティング(HPC)、広告配信、スケーラブルなマルチプレーヤゲーミング、ビデオエンコーディングなどのコンピューティング重視のアプリケーション用に設計されています。 新しいインスタンスは、C4インスタンスに対して25%の価格/パフォーマンスの向上をもたらし、一部のワークロードでは50%を上回ります。 また、vCPUあたりの追加メモリ(新しいAVX-512命令を使用できるコードにおいて)は、2倍のベクターおよび浮動小数点演算のパフォーマンスを備えています。 AWSによって設計、構築された専用ハードウェアにさまざまな種類の作業をオフロードすることに長期的に視点を置き、最高のネットワーク、ストレージ、およびコンピューティングパフォーマンスを顧客に提供するために、私たちは長年にわたりノンストップで取り組んできました。 C5インスタンスタイプには、最新世代のハードウェアオフロードが組み込まれており、ハードウェアに手を加えて新しいハイパーバイザーを追加することで、さらに大きな前進を遂げています。新しいハイパーバイザーを使用すると、ホストハードウェアが提供するすべての処理能力にアクセスすることができます。同時に、パフォーマンスをより一貫して強化し、さらにセキュリティを強化します。 私たちはAWS re:Inventで、それに関する多くの技術的な詳細を共有します。 新しいインスタンス C5インスタンスは6つのサイズが利用可能です: Instance Name vCPUs RAM EBS Bandwidth Network Bandwidth c5.large 2 4 GiB Up to 2.25 Gbps Up to 10 Gbps c5.xlarge 4 8 GiB Up to 2.25 Gbps Up to 10 Gbps c5.2xlarge 8 16 GiB Up to 2.25 Gbps Up to 10 Gbps c5.4xlarge […]

Read More

AWS 料金表 API の更新 – 新しいクエリとメタデータ関数

新規 – AWS 料金表 API に記載されている元の AWS 料金表が、構造化された URL を使用して JSON 形式と CSV 形式で料金にアクセスできるようになりました。これはいくつかの種類のコスト管理ツールでうまく機能しましたが、そのファイルのサイズと複雑さのためダウンロードが困難で、解析が面倒でした。今回は API を更新し、新しい関数を追加して必要な料金だけを返すきめ細かな料金クエリを実行できるようにしました。これにより、モバイルおよびブラウザベースのアプリケーションで料金表を利用することができるようになります。 新しい関数 新しい関数は以下のとおりです。 DescribeServices – サービス内の製品を定義するために使用される属性キーのセットを返します。たとえば、EC2 に返されるキーには、physicalProcessor、memory、operatingSystem、location、tenancy があります。 GetAttributeValues – 指定された属性キーのすべての許容値を返します。たとえば、operatingSystem キーの値には、Windows、RHEL、Linux、SUSE があり、location キーの値には米国東部 (バージニア北部) とアジアパシフィック (ムンバイ) があります。 GetProducts – サービス名と属性値に基づくフィルタ式に一致する、すべての製品を公表価格とともに返します。 これらの関数には、AWS SDK からアクセスできます。それらを試してみるために、私は Python と AWS SDK for Python を使用しました。まず、SDK をインポートしてクライアントを作成するところから始めます。 import boto3 import json import pprint pricing = […]

Read More

EC2 コンバーティブルリザーブドインスタンスの更新 – 新しい 1 年間の CRI、マージ & 分割

当社は、ちょうど 1 年前に EC2 のコンバーティブルリザーブドインスタンスを開始しました。コンバーティブル RI は大幅な割引 (通常オンデマンドと比較して 54%) を提供し、必要に応じてインスタンスファミリーや RI に関連するその他のパラメータを変更することができます。 現在は、従来の 3 年の期間に加えて 1 年間のコンバーティブル RI を導入しています。また、RI の一部を交換したり、バルク交換を実行できるようにすることで、コンバーティブルリザーブドインスタンスモデルの柔軟性を高めています。 新しい 1 年間のコンバーティブル RI 1 年間のコンバーティブル予約済みインスタンスが利用可能になりました。これにより、より多くのオプションと柔軟性が得られます。お客様はニーズに合わせて、1 年と 3 年のコンバーティブルリザーブドインスタンス (CRI) を組み合わせて購入することができます。財務的な制約を受けるスタートアップ企業は、この選択肢が魅力的であると考えています。他のベンチャー企業は、1 年を超える継続の確約を行う立場にない可能性があります。 コンバーティブル RI のマージと分割 M4 インスタンスでウェブサーバーとアプリケーションサーバーの稼働を開始して、コンバーティブル RI で費用を節約したとします。次に、チューニングの後で、アプリケーションサーバーを C4 インスタンスに移動します。今日は、M4 コンバーティブル RI の一部を C4 コンバーティブル RI と交換することを発表しました。また、2 つ以上の CRI をマージし (おそらくはより小さなインスタンスのために)、より大きなインスタンスに対して 1 つの CRI […]

Read More

新しい Amazon S3 暗号化 & セキュリティ機能

S3 を発表した 2006 年に、私は「さらに、各ブロックは ACL (アクセスコントロールリスト) によって保護されているため、開発者はデータを非公開にしたり、共有したり、読み書きしたりすることができます。」と書きました。 最初のモデルから、プライベートバケットと ACL を使用してアクセスを許可することで、バケットポリシー、サーバーアクセスロギング、バージョニング、API ロギング、クロスリージョンレプリケーション、複数のクライアント側およびサーバー側の暗号化オプションのサポートが追加されました。これらはすべて、データを安全に保つために必要なツールを提供し、必要に応じてお客様やパートナーと共有できるようにすることを目的としています。私たちはまた、大規模なコンテンツの検索、分類、保護に役立つツールである Amazon Macie の開始によって、人工知能と機械学習の利点を取り込みました。 現在、S3 には 5 つの新しい暗号化とセキュリティ機能が追加されています。 デフォルト暗号化 – バケット内のすべてのオブジェクトを暗号化された形式で格納する必要性を指定できるようになりました。暗号化されていないオブジェクトを拒否するバケットポリシーを構築する必要はありません。 アクセス許可チェック – S3 コンソールには、一般にアクセス可能な各 S3 バケットの隣に目立つインジケータが表示されるようになりました。 クロスリージョンレプリケーション ACL の上書き – AWS アカウント間でオブジェクトをレプリケートするとき、オブジェクトが送信先アカウントへの完全なアクセス許可を与える新しい ACL を取得するように指定できるようになりました。 KMS によるクロスリージョンレプリケーション – AWS Key Management Service (KMS) によって管理されるキーで、暗号化されたオブジェクトをレプリケートできるようになりました。 詳細なインベントリレポート – S3 インベントリレポートに、各オブジェクトの暗号化ステータスが含まれるようになりました。レポート自体も暗号化することができます。 では詳しく見てみましょう。 デフォルト暗号化 S3 オブジェクトには、S3 によって管理されるキーを使用する SSE-S3、AWS KMS […]

Read More

AWS サービスの新しい AWS PrivateLink: VPC 内の Kinesis、Service Catalog、EC2 Systems Manager、Amazon EC2 API、ELB API

今回のブログは Colm MacCárthaigh 氏、Amazon Virtual Private Cloud のシニアエンジニアより寄稿頂きました。 2015 年に VPC エンドポイントをリリースして以来、エンドポイントの作成は、インターネットゲートウェイや NAT ゲートウェイまたはファイアウォールプロキシの必要なく、Amazon Virtual Private Cloud (VPC) から S3 や DynamoDB へ安全にアクセスする方法として人気を集めています。VPC エンドポイントを使用することで、VPC と AWS サービス間のルーティングは AWS ネットワークにより処理され、サービスリソースへのアクセス管理に IAM ポリシーを使用することができます。 そして本日、すべてのトラフィックを AWS ネットワーク内に維持しながら、可用性が高くスケーラブルな方法でユーザーが AWS サービスにアクセスできるように設計した新世代の VPC エンドポイント、AWS PrivateLink を発表しました。Kinesis、Service Catalog、Amazon EC2、EC2 Systems Manager (SSM)、Elastic Load Balancing (ELB) API を VPC 内で利用できるようになりました。また、Key Management Service (KMS) […]

Read More

Apache MXNet バージョン 0.12 で Extends Gluon 機能を拡大、最先端の研究をサポート

先週、Apache MXNet コミュニティが MXNet バージョン 0.12 をリリースしました。このバージョンの主な機能は NVIDIA Volta GPU と Sparse Tensor のサポートです。同リリースには Gluon プログラミングインターフェイスの新機能がいくつも含まれています。こうした機能は特にディープラーニングモデルにおける最先端のリサーチを実装しやすくします。 変分ドロップアウトは、オーバーフィッティングをリカレントニューラルネットワーク (RNN) に移行するために使うドロップアウト技術を効率的に適用できるようにします。 畳み込み RNN、Long short-term memory (LSTM)、Gated Recurrent Unit (GRU) セルは、時間ベースのシーケンスと空間ディメンションの両方を示すデータセットのモデリングを可能にします。 7 つの新しい損失関数、エクスポート機能、トレーナー機能の強化 変分ドロップアウト (VariationalDropoutCell) は最近のリサーチを足掛かりにして、RNN のオーバーフィッティングを移行させる新たなツールを提供しています。これは「リカレントニューラルネットワークのグランデッドアプリケーションの推論 (“A Theoretically Grounded Application of Recurrent Neural Networks”)」と「RNNDrop: ASR における RNN の新しいアプローチ (“RNNDrop: A Novel Approach for RNNs in ASR”)」を基盤にしています。オーバーフィッティングは、モデルがトレーニングデータセットに近すぎた状態でフィットしていることで発生するモデリングエラーです。そのため、新しいデータまたはテストデータセットが表れた場合に予測精度が低下してしまいます。ドロップアウトはランダムにモデルパラメータをゼロにするモデリング技術です。そのため、トレーニング中にモデルが必要以上に 1 […]

Read More