Amazon Web Services ブログ

AWS のリンクと更新 – 2019 年 12 月 9 日 (月)

re:Invent 2019 が終了し、今月のブログ業務はかなり少なくなりました。しかし、最新のニュースおよびリンクの数々を新鮮なうちに共有したいと思います。 12 月の AWS オンラインテックトーク – 今月の残りの期間に、18 のテックトークが予定されています。AWS Fargate での Kubernetes の実行、AWS IoT 関連のニュース、そして AI によるヘルスケアの変容などについて学ぶことができます ! AWS Outposts : 注文およびインストールの概要 – この動画では、Outposts ラックの注文およびインストールの手順について概要を説明します。物理的要件、電気要件、およびネットワーク要件について学び、実際のインストールを直接見ることができます。 NFL Digital Athlete – データおよび分析手法を用いて選手の安全およびケアを改善することを目的としたプラットフォームである Digital Athlete を共同開発し、怪我を予知して回避するために、NFL と提携しました。このツイートの動画で詳細をご覧ください。 AWS JPL Open Source Rover Challenge – エネルギー消費と損傷リスクを最小限に抑えつつ、シミュレートされた火星環境の特定の場所の間で JPL’s Open-Source Rover を自律的に駆動するため、AWS で強化学習 (RL) モデルを構築して、トレーニングを行いました。詳細は、ウェブサイトを閲覧するか、Launchpad Video をご覧ください。 AWS での機械学習のマッピング – […]

Read More

Amazon Sumerian および Amazon Lex を使用して AR/AI 車両マニュアルを作成する

自動車メーカーは、新しいコントロール、インターフェイス、インテリジェンスを車両に継続的に追加しています。これらの機能の使用方法を詳しく説明したマニュアルを公開していますが、これらのハンドブックは扱いにくいものです。それら数種類の言語の何百ものページで構成されているため、特定の機能に関する関連情報を検索することは困難です。紙ベースのマニュアルをビデオまたはモバイルアプリに置き換えようとしても、エクスペリエンスは向上していません。その結果、すべての所有者が自動車メーカーが提供するイノベーションすべてを知って利用できるわけではありません。 この投稿では、Amazon Sumerian およびその他の AWS のサービスを使用して、インタラクティブな自動マニュアルを作成する方法について説明します。このソリューションは、拡張現実、AI chatbot、および AWS IoT を通じて提供されるコネクテッドカーデータを使用します。これは包括的な段階的なチュートリアルではありませんが、論理コンポーネントの概要を提供します。 AWS のサービス このブログ投稿では、次の 6 つのサービスを使用しています。 Amazon Sumerianは、特別なプログラミングや3Dグラフィックの専門知識を必要とせずに、仮想現実 (VR)、拡張現実 (AR)、および 3D アプリケーションをすばやく簡単に作成および実行できます。作成された 3D シーンはワンクリックで公開し、Web、VR ヘッドセット、モバイルアプリケーションで配布できます。この投稿では、Sumerian を使用して、車両の内部と外部 (オプション) の両方の 3D モデルをレンダリングし、アニメーション化します。 Amazon Lex は、音声とテキストを使用して任意のアプリケーションに会話形式のインターフェースを構築するためのサービスです。Amazon Lex は、Amazon Alexaを強化するためのテクノロジーと同じテクノロジーを活用しています。Amazon Lex は、Alexaの パワーをすべての開発者が利用できるようにすることで、深層学習テクノロジーを普及させます。この投稿では、Amazon Lex を使用して音声コマンドを認識し、所有者から問い合わせられている機能を特定します。 Amazon Polly は、このテキスト読み上げサービスは、人の声のように聞こえる音声を合成するために、高度な深層学習テクノロジーを使用します。Amazon Polly を使用すると、まったく新しいカテゴリの音声対応製品を話し、構築するアプリケーションを作成できます。Amazon Polly は、さまざまな言語で多数の音声をサポートし、さまざまな国でアプリケーションを使用できるようにします。この投稿では、Amazon Polly を使用して Amazon Lex の回答をリアルな音声に発声しています。 Amazon DynamoDB は、任意の規模で […]

Read More

患者記録を AWS Lake Formation FindMatches 変換と一致させる

患者のマッチングは、医療の相互運用性を実現する上で大きな障害です。患者レコードの不一致や患者の履歴の取得ができないと、十分な情報に基づいた臨床上の意思決定に大きな支障が生じ、診断ミスや治療の遅れを招く可能性があります。さらに、医療従事者は、患者データの重複排除にお金をかけることがよくあります。データベースで患者レコードの数が急速に増加している場合は特にそうです。電子医療記録 (EHR) により、患者の安全とケアの手配は近年大幅に改善しましたが、多くの医療機関は、患者の正確なマッチングの課題に未だに頭を抱えています。 患者レコードの重複は、人為的な番号の挿入、削除、置換、または置き間違えなど、さまざまな理由で発生します。患者レコードをデジタル化する光学式文字認識 (OCR) ソフトウェアもエラーを引き起こす可能性があります。 この問題を解決するために、複数のタイプのレコード一致アルゴリズムが存在します。これらのアルゴリズムには、関連フィールド (SSN、名前、生年月日など) 、音声符号化システムをグループ化して比較するといった基本的な決定論的方法に加えて、機械学習 (ML) を使用したより高度なアルゴリズムも含まれます。 AWS Lake Formation は、いくつかの簡単な手順を踏むだけで安全なデータレイクを構築できる HIPAA 対象サービスです。Lake Formation には FindMatches も含まれていて、さまざまなデータセットにわたってレコードを一致させたり、重複レコードを特定して削除したりできます。 この記事では、FindMatches ML 変換を使用して、合成的に生成されたデータセット内で一致する患者レコードを識別する方法を説明します。FindMatches を使用するのに、コードを書く必要も ML の仕組みを知っている必要もありません。これは、フィールドが完全に一致しない場合でも、信頼できる一意の個人識別子が含まれていない場合に、データ内で一致を見つけるのに役立ちます。 患者データセット 患者データは、その機密性により、さまざまな国のさまざまな規制を受けています。そのため、マッチングアルゴリズムをトレーニングする患者データが不足していることが多く、モデル開発が複雑になります。このような課題を回避するためによく用いられているのは、合成データを使う方法です。この記事では、オープンソースの Freely Extensible Biomedical Record Linkage Program (FEBRL) に基づいて患者データを生成します。FEBRL は、隠れマルコフモデル (HMM) を使用して、患者レコードの一致を調べるために名前と住所のデータを用意します。また、重複につながる実際の患者データセットを模倣することもできますが、これには以下の不一致が生まれる可能性があります。 空白のフィールド。 スペルミス、文字の転置、記入欄の取り違えなどの誤植。 ミドルネームの短縮形がある一方、ミドルネームを略さずに記述したレコードもある。 さまざまな形式の住所と詳細。 OCR 関連のエラー。 音声エラー。 グローバルに一意の患者または個人の識別子なし。医療従事者はどこも、その人に割り当てられた患者識別子を持っているかもしれませんが、SSN のような人の識別子を持っていない可能性もあります。そのため、キーのないデータセットを持っています。 FEBRL は、設定可能なパラメータに基づいてこれらのタイプのデータセットを生成して、各タイプのエラーの確率を変更できるため、重複に至るさまざまなシナリオを組み込むことができます。合成データセットの生成については、この記事の範囲外です。この記事では、事前に生成されたデータセットについて説明します。FindMatches の実行に使用する合成データセットを生成する手順は、簡単に説明すると次のとおりです。 FEBRL をダウンロードしてインストールします。 パラメータを変更して、期待どおりのデータセットを作成します。詳細については、FEBRL […]

Read More

ロサンゼルスの Local Zone から AWS が利用可能に

AWS のお客様は、より多くの機能、より多くの帯域幅、より高いの計算能力、より多くのメモリを常に求める一方で、レイテンシと価格の低下も求めています。これらの競合する要求を満たすために最善を尽くします。新しいEC2 インスタンスタイプ、EBS ボリュームタイプ、およびS3 ストレージクラスを迅速にローンチし、定期的に価格を下げていきます。 ロサンゼルスでの AWS 本日、カリフォルニア州ロサンゼルスで Local Zone を開始します。Local Zone は、特定の地理的エリアに非常に近い AWS のサービスを選択する新しいタイプの AWS インフラストラクチャのデプロイメントです。この Local Zone は、ロサンゼルスや南カリフォルニアの他の場所からアクセスされるアプリケーションに非常に低いレイテンシ (ミリ秒 1 桁) を提供するように設計されています。レイテンシに特に敏感な非常に要求の厳しいアプリケーションからは特に関心が得られるでしょう。本サポートに含まれるものは次のとおりです。 メディア&エンターテインメント – ゲーム、3D モデリングとレンダリング、ビデオ処理 (リアルタイムの色補正を含む)、ビデオストリーミング、メディア制作パイプライン。 電子設計自動化 – インタラクティブな設計とレイアウト、シミュレーション、検証。 Ad-Tech – 迅速な意思決定と広告配信。 機械学習 – 高速で継続的なモデルトレーニング。高性能で低遅延の推論。 Local Zone の詳細 ロサンゼルスの新しい Local Zone は、米国西部 (オレゴン)リージョン (これを親リージョンと呼びます) の論理的な部分であり、いくつかのユニークで興味深い特性があります。 : ネーミング – Local Zone には、プログラムで us-west-2-lax-1a […]

Read More

[AWS Black Belt Online Seminar] Amazon Chime 資料及び QA 公開

先日 (2019/12/10) 開催しました AWS Black Belt Online Seminar「 Amazon Chime 」の資料を公開しました。当日、参加者の皆様から頂いた QA の一部についても共有しております。 20191210 AWS Black Belt Online Seminar Amazon Chime from Amazon Web Services Japan AWS クラウドサービス活用資料集(すべての過去資料が閲覧できます) Q. ビデオが16越えた時はどうなりますか? A. Amazon Chime では参加者の最大 16 の動画タイルが動画バーに先着順に表示されるため、17人目はビデオが表示されません。 — 今後の AWS Webinar | イベントスケジュール 直近で以下を予定しています。各詳細およびお申し込み先は下記URLからご確認いただけます。皆様のご参加をお待ちしております。 AWSome Day Online Conference 「AWSome Day Online」は、実際に足を運んでいただく 1 日の AWSome Day の内容を […]

Read More

Amazon S3 Access Points で共有データセットの管理が簡単に

安全で、スケーラブルで、耐久性があり、可用性の高いストレージは、クラウドコンピューティングの基本的なコンポーネントです。それが、AWS が 2006 年に Amazon Simple Storage Service (S3) を開始したそもそもの理由です。これは、AWS が現在提供している 175 を超えるサービスの多くの構成要素になっています。2020 年代が間近に迫る中、Amazon Redshift、Amazon Athena、titletitleAmazon EMR および AWS Lake FormationAWS Lake Formation により、S3 は、オブジェクトだけでなくエンジンも格納する方法にもなり、データを洞察に変えていきます。これらの機能は、バケットに保存されたデータのアクセスパターンと要件が進化したことを意味します。 本日、S3 で共有データセットの大規模なデータアクセスを管理する新しい方法、Amazon S3 Access Points をローンチします。S3 Access Points は、そのエンドポイントを使用してデータにアクセスする方法を記述する専用のアクセスポリシーを持つ一意のホスト名です。S3 Access Points 以前は、データへの共有アクセスは、バケット上の単一のポリシードキュメントを管理することを意味していました。これらのポリシーは、多くの異なる権限を持つ数百のアプリケーションを表し、監査と更新が多くのシステムに影響を及ぼす潜在的なボトルネックになる可能性がありました。 S3 Access Points を使用すると、アプリケーションやチームを追加するときにアクセスポイントを追加でき、ポリシーを具体的かつ管理しやすくします。バケットには複数のアクセスポイントを含めることができ、各アクセスポイントには独自の AWS Identity and Access Management (IAM) ポリシーがあります。アクセスポイントポリシーはバケットポリシーに似ていますが、アクセスポイントに関連付けられています。S3 Access Points は、Amazon Virtual Private Cloud 内からのアクセスのみを許可するように制限することもできます。また、各アクセスポイントには一意の […]

Read More

Amazon SageMaker Processing – 完全マネージド型のデータ処理とモデル評価

本日、フルマネージドインフラストラクチャで前処理、後処理、およびモデル評価のワークロードを簡単に実行できる、Amazon SageMaker の新機能、Amazon SageMaker Processing をリリースいたしました。 高精度な機械学習 (ML) モデルをトレーニングするにはさまざまな手順を踏む必要がありますが、中でもデータセットの前処理が最も重要となるでしょう。たとえば: 使用中の ML アルゴリズムに合う入力形式にデータセットを変換する、 既存の特徴をより表現力のある表現 (one-hot エンコーディングカテゴリ別特徴など) に変換する、 数値特徴を再スケーリングまたは正規化する、 高レベル特徴量エンジニアリングを行う (例: 住所を GPS 座標に置き換える)、 自然言語処理アプリケーションのテキストをクリーニングし、トークン分割する、 などなど! これらのタスクは、(とても大変な) データセットに対する特注スクリプトの実行と、後でトレーニングジョブで使用する処理済みバージョンの保存を伴います。ご想像のとおり、それらを手動で実行したり、オートメーションツールを構築およびスケールしたりする必要があることを考えると、ML チームは気が重くなります。後処理ジョブ (フィルタリングや照合など) やモデル評価ジョブ (さまざまなテストセットに対するモデルのスコアリング) についても同じことが言えます。 この問題を解決するために、私たちは Amazon SageMaker Processing を構築しました。それでは、詳細を説明しましょう。 Amazon SageMaker Processing のご紹介 Amazon SageMaker Processing には、データサイエンティストと ML エンジニアが Amazon SageMaker で前処理、後処理、およびモデル評価ワークロードを簡単に実行できる新式の Python SDK が導入されています。 この SDK では […]

Read More

Amazon Elasticsearch Service 向け UltraWarm (プレビュー版) 発表

  本日、Amazon Elasticsearch Service 向けの低コストの完全マネージド型ウォームストレージ層である UltraWarm を発表します。UltraWarm はプレビューでご利用いただけます。UltraWarm はAmazon Elasticsearch Service でホットウォームティアリングを提供する新しいアプローチを採用し、最大 900TB のストレージを提供。既存のオプションに比べて、ほぼ 90% のコスト削減を実現しています。UltraWarm は、Amazon Elasticsearch Service エクスペリエンスのシームレスな拡張機能であり、使い慣れた Kibana インターフェイスから、ホットデータと UltraWarm データの両方をクエリおよび視覚化できます。UltraWarm データは、現在使用しているのと同じ API とツールを使用してクエリできます。また、保管中および転送中の暗号化、統合アラート、SQL クエリなどの一般的な Amazon Elasticsearch Service 機能もサポートしています。 Amazon Elasticsearch Service のお客様に人気のユースケースは、大量の (そしてますます増加している) マシン生成ログデータを取り込んで分析することです。ただし、これらのお客様からは、より多くのこのデータに対してリアルタイム分析を実行したいので、それを使用して運用とセキュリティの問題を迅速に解決するのに役立てたいとの声が寄せられています。数か月、さらには数年分のデータの保存と分析は費用がかかりすぎてしまうため、複数の分析ツールを使用する人もいれば、貴重なデータをただ削除して洞察を逃してしまう人もいます。UltraWarm は、Amazon Simple Storage Service (S3) に裏打ちされた費用対効果の高いストレージで、この問題の解決に役立ち、お客様は長年蓄積してきたデータを保持して分析できます。 UltraWarm のリリースにより、Amazon Elasticsearch Service は、ホットウォームと UltraWarm の 2 つのストレージ層をサポートできるようになります。ホットティアは、インデックス作成、更新、およびデータへの最速アクセスの実現に使用します。UltraWarm は、ホットティアを補完して、アクセス頻度の低い古い大量のデータのサポートを強化し、ストレージコストを削減できる利点があります。前述したように、UltraWarm はデータを […]

Read More

Deep Graph Library が Amazon SageMaker で利用可能に

本日ここに、グラフニューラルネットワークを簡単に実装できるよう構築されたオープンソースライブラリ、Deep Graph Library が、Amazon SageMaker で利用可能になったことをお知らせします。 近年、自由形式のテキスト、画像、動画など、複雑なデータから詳細なパターンを抜き出すことができる、驚異的な性能の深層学習が世界に旋風を巻き起こしています。しかし、多くのデータセットはこれらのカテゴリーに当てはまらないため、グラフの方がわかりやすく表すことができます。 畳み込みニューラルネットワークや再帰型ニューラルネットワークのような、従来のニューラルネットワークのアーキテクチャは、そのようなデータセットに適していないことは直感的にも感じられ、新しいアプローチが必要となります。 グラフニューラルネットワークの初歩 グラフニューラルネットワーク (GNN) は、今日の機械学習におけるもっとも画期的な発展事項です。手始めに、これらの参考資料をご覧になるとよいでしょう。 GNN は、以下のような予測モデルのトレーニングに使用されています。 ソーシャルネットワーク。関連する利用者同士のつながりをグラフ化 推奨システム。顧客とアイテムの間のやり取りをグラフ化 化学分析。原子や結合をグラフ化して化合物のモデルを作成 サイバーセキュリティ。発信元と発信先の IP アドレスの接続状況をグラフ化で説明 その他多数のモデル ほとんどの場合、これらのデータセットは非常に大きく、部分的なラベル付けしかできません。ある個人から既知の不正を行う者への接続状況を分析することで、その個人が不正を行っている可能性を予測する、不正行為検出シナリオを考えてみましょう。この問題は、グラフノードの一部のみがラベル付けされる (「不正」か「正当」)、半教師あり学習タスクとして定義できます。これは大きなデータセットを手作業のラベル付けにより構築し、「線形化」して従来の機械学習アルゴリズムに適用するよりも良いソリューションになるはずです。 これらの問題に対処するためには、分野の専門知識 (小売、財務、化学など)、コンピューターサイエンスの知識 (Python、深層学習、オープンソースツール)、インフラストラクチャの知識 (トレーニング、デプロイ、モデルのスケーリング) が必要です。これらのスキルをすべてマスターしている人はごくわずかです。それが Deep Graph Library や Amazon SageMaker のようなツールが必要とされる理由です。 Deep Graph Library の紹介 2018 年 12 月に Github で初めてリリースされた Deep Graph Library (DGL) は Python のオープンソースライブラリーで、研究者や科学者がデータセットの GNN を迅速に構築、トレーニング、評価するのに役立ちます。 DGL は、PyTorch […]

Read More
Weekly AWS

週刊AWS – 2019/12/2週(re:Invent特別号)

みなさん、こんにちは。ソリューションアーキテクトの下佐粉です。 先週は 年に一度の大きなイベント AWS re:Invent 2019がラスベガスで開催されて、いつも以上に多くの新サービスや新機能が発表されましたね!エキサイティングな発表が多くて嬉しいのですが、とてもこの連載の枠に全ての重要な発表が収まりそうにりません。 そこで今回の週刊AWSでは、AWS re:Invent 2019 で発表された内容から、筆者ら(小林、下佐粉)が「個人的に凄いと思った発表10選」を独断でチョイスしてお送りします。なお、re:Invent 2019で発表された内容を全部知りたい!という方向けに関連資料も最後にまとめています。では、厳選10個のアップデートをご覧ください。

Read More