ラボ 7 - TIBCO Spotfire を使ったビッグデータの可視化

このラボでは、TIBCO Spotfire を使用して Amazon Redshift データウェアハウスのデータから変換した Amazon CloudFront ログデータを分析および可視化します。Amazon CloudFront ログは Amazon EMR の Hive を使用して処理および変換されました。

目標

このラボを完了すると、以下の操作を実行できるようになります。

所要時間

このラボは、修了までに45 分かかります。

注意


ラボのシナリオ

TIBCO Spotfire は Amazon Redshift パートナーの 1 社で、ビジネスインテリジェンスの可視化と検出を専門としています。Spotfire ツールにより、データを検索してビジネス面の問題を解決できる、強力なアドホックのデータ分析を利用できます。

この演習で使用する可視化の例では、次の 4 つのテーブルのデータが組み合わされています。


AWS マネジメントコンソールにアクセスする

このラボの間は、リージョンを変更しないでください。


タスク 1: Amazon EC2 インスタンスに接続する

このタスクでは、Windows Server 2012 R2 Base インスタンスに接続します。

  1. [1] ラボの開始ボンタンを押した画面の左側にある、[ PEM形式でダウンロード] をクリックします。

  2. [2] AWS マネジメントコンソールの [サービス] で [EC2] をクリックします。

  3. [3] ナビゲーションペインで [インスタンス] をクリックします。

  4. [4] [Tibco] を選択します。

  5. [5][接続] をクリックします。

  6. [6][インスタンスへの接続] ダイアログボックスで [リモートデスクトップファイルのダウンロード] をクリックして、ファイルをコンピュータに保存します。

  7. [7][パスワードの取得] をクリックします。

  8. [8][インスタンスへの接続 >パスワードの取得] ダイアログボックスで [ファイルを選択] をクリックします。先ほどダウンロードした PEM ファイルを選択し、[開く] をクリックします。

  9. [9][パスワードの復号] をクリックします。

  10. [10] 先ほどダウンロードした RDP ファイルを開きます。

本人確認の警告を受け取った場合は、[はい] をクリックします。

  1. [11][接続] をクリックします。

プロンプトが表示されたら、ユーザー名としてAdministratorを使用して Tibco インスタンスにログインします (お客様のログインのデフォルトが管理者の場合は、使用しないでください)。[Use another account] に切り替えて、ユーザー名としてAdministratorを入力します。

パスワードには、[インスタンスへの接続] ダイアログボックスに表示されているパスワードを使用します。

  1. [13][OK] をクリックします。

本人確認の警告を受け取った場合は、[はい] をクリックします。

  1. [14] リモートデスクトップセッションを最小化し、AWS マネジメントコンソールにログインしているブラウザウィンドウに戻り、[Close] をクリックして [インスタンスへの接続] ダイアログボックスを閉じます。

タスク 2: Spotfire を Redshift に接続し、データを定義する

ラボのこのセクションでは、Spotfire を起動し、Amazon Redshift クラスターへの OBDC コネクタ経由のデータ接続を作成します。Amazon Redshift データベース内のスキーマとデータの関係を表現するデータモデルを Spotfire で定義します。

タスク 2.1: Spotfire を Amazon Redshift に接続する

ラボのこのセクションでは、Spotfire を起動し、Amazon Redshift へのデータ接続を作成します。

リモートクライアントのデスクトップの [TIBCO Spotfire] アイコンをダブルクリックします。

  1. [16][Add Data] タブをクリックします。

  2. [17][Add Data Connection] セクションの [Amazon Redshift] リンクをクリックします。

  3. [18][Amazon Redshift Connection] ダイアログボックスで、次の値を入力します。

  1. [19][Connect] をクリックします。

Task 2.2: Spotfire でデータを定義する

ラボのこのセクションでは、Spotfire クライアント内でデータを設定します。

  1. [20][Views in Connection] ダイアログボックス内の [public] で [cloudfront] をクリックします。[Add >] アイコンをクリックします。

  2. [21][games]、[order_line]、[user_profile] の各テーブルを追加するために、前のステップを 3 回繰り返します。

  3. [22] メニューの左側にある [Relations] で、[New Relation] をクリックします。

  4. [23][New Relation] ダイアログボックスで、次のように指定します。

  1. [24][OK] をクリックします。

  2. [25][Relations] で [New Relation] を再びクリックします。

  3. [26][New Relation] ダイアログボックスで、次のように指定します。

  1. [27][OK] をクリックします。

  2. [28][Relations] で [New Relation] を再びクリックします。

  3. [29][New Relation] ダイアログボックスで、次のように指定します。

  1. [30][OK] をクリックします。

  2. [31][Views in Connection] ダイアログボックスで [OK] をクリックします。

  3. [32][Add Data Tables] ダイアログボックスで [OK] をクリックします。

しばらくすると、Spotfire によりデータ可視化画面がロードされます。


タスク 3: Spotfire を使用してレポートを生成する

ラボのこのセクションでは、Spotfire を使用してレポートや分析を生成します。作成したデータ接続を使用して、CloudFront のログ、注文、顧客を分析します。選択したディメンションと測定単位に基づいて、Spotfire によりクエリが動的に生成されます。Amazon Redshift コンソールを使用し、生成されたクエリを取得および検証して、クエリのパフォーマンスを調整および最適化できます。

タスク 3.1: 日付別の一意の訪問者数レポートを作成する

このセクションでは、[cloudfront] テーブルのデータをまとめたレポートを作成します。具体的には、その年の 1 日あたりの一意の訪問者数を数えて、そのデータを折れ線グラフとして表示します。

  1. [33] トップメニューから、[Insert]、[Visualization]、および [Line Chart] の順にクリックします。

  2. [34] 新しい折れ線グラフの X 軸 (下側) の [logtime] をクリックして、ドロップダウンリストを展開します。このリストから [logtime] を再びクリックします。表示されるメニューで、[Day of Year] をクリックします。

    Y 軸 (左側) にある [Sum(bytes)] をクリックして、[user_id] をクリックします。メニューのトップにある [Sum] をクリックして、もう 1 つのドロップダウンリストを展開します。このリストにある [UniqueCount] をクリックします。これにより、Y 軸の計算がユーザー ID の一意数に設定されます。

  3. [36] メニューの右上隅にある X をクリックして、メニューを閉じます。

  4. [37] グラフの左上隅には、デフォルトのタイトル、[user_id – logtime] が表示されます。このタイトルをダブルクリックし、Unique Daily Visitorsと入力します。

  5. [38] 折れ線グラフは次のようになります。

タスク 3.2: 国別の一意の訪問者数レポートを作成する

このセクションでは、[user_profile] テーブルのデータを集計したレポートを作成します。具体的には、国別の一意訪問者数を数えて、そのデータを円グラフとして表示します。

  1. [39] トップメニューから、[Insert]、[Visualization]、および [Pie Chart] の順にクリックします。

円グラフの右側にある [Data table] で、[user_profile] をクリックします。

[Color by] で、[country] をクリックします。メニューの右上隅にある X をクリックして、メニューを閉じます。

これは一般的な円グラフのように見えますが、データが誤っています。計算が [Sum] に設定されているため、Spotfire では、実際には一意の user_id 数を数えるのでなく、国別にすべての user_id 数が合算されます。

  1. [42] この可視化を有用なものにするには、[Sector size by] で、計算を [Sum] から [UniqueCount] に変更します。

  2. [43] 円グラフの上でマウス右ボタンをクリックします。表示されるコンテキストメニューで、[Properties] をクリックします。

  3. [44] 表示されるプロパティメニューのナビゲーションペインで、[Labels] をクリックします。

  4. [45][Show in labels] セクションで [Sector value] を選択します。([Sector percentage] も選択されたままにします)

  5. [46][Label position] セクションで、[Outside pie] をクリックし、[Close] をクリックします。

グラフのタイトルをUnique Visitors by Countryに変更します。

  1. [48] 円グラフは次のようになります。

タスク 3.3: 訪問者の年齢と性別に関するレポートを作成する

このセクションでは、すべての年齢の一意な訪問者数を合計し、これを性別に分けて、棒グラフとして表示したレポートを作成します。

Spotfire では、ユーザーがアップロードしたデータの自動分析に基づいた棒グラフが既に自動的に作成されており、ダッシュボードの下部に表示されます。

  1. [49] 画面下部の棒グラフの領域を右クリックし、[Vertical Bars] をクリックします。

  2. [50] 棒グラフの右側にある [Data table] を [user_profile] に変更します。

  3. [51] 棒グラフの左側の軸で、列を [user_id] に変更し、計算方法で [Count] をクリックします。数値の一覧が Y 軸に表示されます。

  4. [52] Y 軸 (左側) の数値を右クリックし [Formatting] をクリックして、[Properties] をクリックします。

  5. [53] ダイアログウィンドウの中央の [Category] にある [Number] をクリックします。[Use short number format] を選択します。[閉じる] をクリックします。

  6. [54] 下側の X 軸で、列を [age] に変更します。

  7. [55] 棒グラフの右側にある [Color by] を [gender] に変更します。

  8. [56] グラフのタイトルをTotal Visitors by Age and Genderに変更します。

  9. [57] 棒グラフは次のようになります。

  1. [58] メニューで、[View]、[Arrange Visualizations]、[Evenly] の順にクリックします。

  2. [59] これで、Redshift データから 3 つの異なる有益な可視化が正常に作成され、ダッシュボードに配置されました。


ラボを終了する

お疲れ様でした。 このラボを完了しました。以下の手順に従って、ラボ環境をクリーンアップします。

  1. [60] AWS マネジメントコンソールからサインアウトするには、コンソール上部のメニューバーで [awsstudent] をクリックし、[サインアウト] をクリックします。

  2. [61] Qwiklabs ページで [ラボを終了] をクリックします。