BuildFax は、一元化された建築許可情報のデータベースを提供することで、住宅業界に独自のサービスをもたらします。住宅専門家は、何百万もの不動産の施工履歴や請負業者の記録、査定情報を入手することができます。建築許可情報の情報集積企業として、BuildFax U.S.Property History Database は全米の地方自治体から建築許可情報を収集し、保存しています。お客様は 同社のウェブサイトから生成される BuildFax Structure PROFILE を通して、不動産や建造物に関する詳しい情報を得ることができます。
BuildFax のお客様は、個々のバイヤーやホームインスペクターから、世界有数の保険会社に至るまで、多岐にわたります。保険、建設、環境コンサルタント、鑑定士、不動産アナリスト、銀行など、規模や関連する産業分野にかかわらず、お客様は詳細な BuildFax Structure PROFILE を通して不動産の履歴や歴史に関する有用な情報を引き出すことができるのです。例えば不動産の歴史は、金融機関が融資をする前に不動産の価値を評価する役に立ちます。これにより、資本を保護し、金銭的な損失を防ぐことができます。また、ホームインスペクターは BuildFax Profile を使用して、不動産で完了した修繕や工事について知ることもできるでしょう。この情報をあらかじめ入手しておくことで、ホームインスペクターはより綿密な査定をもっと短い時間で行うことができます。
BuildFax はかつて使用していたインフラストラクチャでは要求に対処できなくなった際に、アマゾン ウェブ サービス (AWS) に切り替えました。AWS のソリューションは、速くて信頼できる安全な情報をお客様に提供する、製品とサービスの集合体です。すべてのコンテンツを Amazon Elastic Compute Cloud (Amazon EC2)、Amazon Elastic Block Store (Amazon EBS)、Elastic Load Balancing、Amazon Simple Storage Service (Amazon S3) でお客様に提供します。これには、ウェブアプリケーションサーバー、Solr の全文検索サーバー、 MySQL サーバーが使われ、一連のサーバーは RightScale で管理しています。AWS のこの構成は珍しくはないかもしれませんが、BuildFax は入ってくる建築許可データを少し変わった方法で処理しています。
研究開発部門のヴァイスプレジデントである Joe Masters Emison 氏は、次のように説明します。「すべてのデータセットは、元のデータベースレイアウトから、人手によって標準レイアウトのデータベースにマッピングする必要があります。その後、このマッピングと元データは一連のスクリプトに入力され、標準レイアウトに整形されたデータが出力されます。処理が必要なマッピングごとにAmazon EC2 インスタンスを起動します。ほとんどのマッピングは 2~3 時間以内に完了し、一度に 100 個も実行することができます。もし、無制限に仮想マシンを起動することができなかったら、スケジューリングは悪夢のような作業だったでしょう」
BuildFax は住所ごとにすべてのデータを提供するので、住所の修正は必要不可欠です。厄介なことに、住所情報はときにとても不完全です。通りの番号や名前、群の名前はあるのに、都市や州の名前、郵便番号が欠けているかもしれないのです。そのため、同社は可能性のある値 (群内のすべての郵便番号や都市など) をすべてチェックし、候補を見つけ出さなければなりません。このプロセスでは、7 億 5,000 万の異なる住所の組み合わせを実行する必要があります。これは Amazon Elastic MapReduce (Amazon EMR) がないと実質的に不可能でしょう。同社は Amazon EMR のおかげで、データセットあたり最大 80 インスタンスで、3 時間以下のランタイムを維持しています。
マッピングを実行して Amazon EMR を起動するために、ひと組の MySQL サーバーをセットアップするのは非常に簡単です。SSL と MySQL 5.1 を使用し、Amazon EBS をストライピングしたサーバーを、RightScale によって複製します。しかし、データは様々な形式で入力されます。データファイルやテキスト、データベースダンプ、(まれに MySQL から)、PDF ファイルなどです。そのため、BuildFax には各データセットを独立した環境で処理する機能が必要です。この戦略は、マッピングが処理される方法と似ています。両方とも、データファイルを MySQL に「ローディング」するたびに独自の Amazon EC2 インスタンスを取得します。ファイル形式を識別することで、同社は約 50% のデータを自動的にロードできます。しかしもう 50% は手動でロードする必要があります。これらはすべて、別々のインスタンスで行われます。これを効率的に行うために、BuildFax はすべての受信データファイルを Amazon S3 を使用して保存します。
Emison 氏は次のように言います。「建築許可データは数千の異なる場所に数千の異なるファイル形式で保存されているため、これまでは建築許可データを集計することができませんでした。われわれはこの情報の収集と処理をどのように一般化してスケールするかという問題を解決しました。そのため、以前は各自治体の建築局から動かせなかった建築許可データを、いまでは世界中に提供することができます」 BuildFax はこの問題を効率的に解決しましたが、AWS はこれを世界に向けて提供し、住宅ローンの引受人や保険会社、ホームインスペクター、不動産鑑定士が確実に、その建物にどのような経年変化があったのかをより理解できるようにします。
AWS のウェブアプリケーション向けサービスの詳細については、ウェブアプリケーション詳細ページ http://aws.amazon.com/web-mobile-social を参照してください。