外部データインポート機能

外部データインポート機能

1. 外部データインポート機能とは?

CRMシステムなどのユーザー情報をContent Analyticsにインポートし、コンテンツレポートを新たな切り口で分析するための機能です。

例えば、CRMに保存された「性別」「年代別」「会員ランク」などの項目を、Content Analyticsのレポート上で選択しフィルタリングすることで、特定セグメントに絞ったコンテンツ閲覧・クリックの傾向を分析することができるようになります。

image

外部データインポート機能を利用するには、Content Analyticsのトラッキングコードに「ユーザー識別ID」を追加してください。

Content Analyticsは、トラッキングコードに追加した「ユーザー識別ID」と、データインポート機能で取り込む外部CRMなどの「ユーザー識別ID」を利用し同一ユーザーを特定することで、コンテンツレポート画面でCRMの項目を選択しフィルタリングできるようになり、リッチなセグメントでの分析を可能にします。

2. トラッキングコードにユーザー識別IDを追加する方法

ユーザー識別IDを追加する方法は2つあります。

  1. トラッキングコードにユーザーIDを追加する方法
  2. ユーザーID連携機能は、ログインなどにより、ユーザーを特定可能な会員IDなどの「ユーザー識別ID」を連携することで、ユーザーがアクセスするデバイス(PC/Mobile)が異なったとしても同一ユーザーの訪問だと識別するための機能です。訪問回数などの集計の精度がアップします。詳細は以下のヘルプページを参照ください。

  3. トラッキングコードにカスタムディメンションを追加する方法
  4. 他ツールのクライアントIDなど、デバイスが異なる場合にユーザーを特定できないIDでデータインポートを使用する場合、ユーザーIDではなくカスタムディメンションでの設定を推奨します。このような値が変わってしまうIDをユーザーIDとして設定してしまうと、Content Analyticsが誤った基準でユーザーを統合しレポート表示してしまう可能性があるためです。詳細は以下のヘルプページを参照ください。

3. 外部データインポート取り込み用ファイルの仕様

取り込みファイルの仕様について

ファイル名
・任意。日本語も利用可能です。
ファイル形式
・CSV
文字エンコーディング
・UTF-8
改行コード
・LF
区切り文字
・カンマ(,)
ヘッダー行
・必須。日本語も利用可能です。
フィールド数の上限
・最大20件
ファイルサイズの上限
・ブラウザからインポートする場合は、最大10MB ・SFTPからインポートする場合は、最大1GB
囲み文字
・ダブルクォート(")を囲み文字として利用できます。値に区切り文字が含まれる場合などにご利用ください。 ・ダブルクォート(")自体を出力する場合は、ダブルクォート2つでエスケープしてください ・囲み文字のあるカラムと無いカラムが混在していても問題ありません
値の注意事項
・「ユーザー識別ID」を表す値は必須です。それ以外は任意で、値なし時は空で入力してください。 ・数値の場合、小数点は9桁までです。 ・日付・日時には存在しない日付などをセットしないでください(値なしなどに変換してください) ・日付・日時の取り込み可能なフォーマットは以下の通りです。 (日付の取り込み可能な例) ・2023-01-01 ※0埋めは省略でもOKです。 ※日付の区切りはスラッシュでもOKです。 (日時の取り込み可能な例) ・2023-01-01 00:00:00 ・2023-01-01T00:00:00 ・2023-01-01 00:00(この場合は0秒として取り込みます) ・2023-01-01 00:00:00+09:00 ・2023-01-01 00:00:00Z(UTC時間として取り込みます) ※0埋めは省略でもOKです。 ※日付の区切りはスラッシュでもOKです。 ※UTCとのタイムゾーンのオフセット付きでもOKです。 ※タイムゾーンが省略された場合はJST(日本時間)として取り込みます。

取り込みデータの注意事項

ContentAnalyticsでは、個人情報のインポートを禁止します(氏名、メールアドレス、電話番号など)。個人情報に該当するフィールドは、インポートファイルに含めないようにしてください。

参照: ContentAnalytics利用約款

取り込みデータの更新形式は全件更新 (洗い替え)

CSVアップロードやSFTP設定で取り込むデータの更新形式は全件更新となります。古いインポートデータはすべて削除され、新しいインポートデータに上書きされます。いわゆる洗い替え処理となります。

CSVファイルのサンプル

上記に記載したファイル仕様に準拠したサンプルは以下の通りです。

user_id,session_time_avg,session_count,first_visited_at,user_rank,memo
10000001,12.345678901,99,2023/1/1 12:34:56,gold,"aaa,bbb"
10000002,,,,,

4. 外部データインポートの初回設定手順

STEP1: インポートフィールドの設定画面を開く

外部データインポート機能を利用したいプロジェクトの「外部データインポート」機能を開き、インポートフィールドの【設定】ボタンをクリックします。

image

STEP2: トラッキングコードのユーザー識別IDのキーを選択する

インポートするデータのユーザー識別IDと、トラッキングコードで連携するユーザー識別IDを紐づける必要があります。 本STEPでは、トラッキングコード側のユーザー識別IDのキーを選択します。 ユーザーID機能で連携している場合は、「user_id: ユーザーID」を選択してください。

カスタムディメンションで連携している場合は、対象のカスタムディメンション(dimension〜ではじまる選択肢)を選択してください。カスタムディメンション設定画面で「範囲が”ユーザー”かつ”アクティブ”」で登録しているカスタムディメンションが選択可能です。

image

STEP3: インポートするデータのフィールドを追加する

インポートデータのフィールド情報を入力します。

選択可能なデータタイプの種類は以下の通りです。

データタイプ
説明
STRING
・文字列の項目 ・値に数値しか含まないが「0埋めが必要」な場合は、STRINGでの設定を推奨します。(NUMERICで保存してしまうと、0が消えて保存されてしまうため)
NUMERIC
・数値の項目 ・小数点を含めることも可能です。(9桁まで)
DATE
・日付の項目 ・取り込み可能な形式は以下の通りです。 ——————————————————— ・2023-01-01 ※0埋めは省略でもOKです。 ※日付の区切りはスラッシュでもOKです。 ———————————————————
TIMESTAMP
・日時の項目 ・取り込み可能な形式は以下の通り ——————————————————— ・2023-01-01 00:00:00 ・2023-01-01T00:00:00 ・2023-01-01 00:00(この場合は0秒として取り込みます) ・2023-01-01 00:00:00+09:00 ・2023-01-01 00:00:00Z(UTC時間として取り込みます) ※0埋めは省略でもOKです。 ※日付の区切りはスラッシュでもOKです。 ※UTCとのタイムゾーンのオフセット付きでもOKです。 ※タイムゾーンが省略された場合はJST(日本時間)として取り込みます。 ———————————————————

インポートフィールドの入力方法は、「手動入力」または「ファイルから自動入力」の方法があります。

ファイルが手元にない場合は、「手動入力」で追加してください。

インポートするファイルが手元にある場合は、「ファイルから自動入力」がオススメです。 フィールド名の自動入力と、ファイルのデータからデータタイプを自動判別します。

【CSVファイルからフィールドを読み取り】ボタンから、ファイルをアップロードしましょう。

ただし、ブラウザからアップロード可能なファイルサイズは10MBまでです。 サイズを超えてしまう場合、データ量を減らした後に、読み取り機能を使用しましょう。

image

データタイプに誤りがある場合は、プルダウンを正しい値に手動で選択し直しましょう。

image

インポートファイルのフィールド数が20件を超える場合は【有効/削除】を切り替え、上限に収まるように変更してください。

「削除」を選択すると、ContentAnalyticsのデータベースにデータを保持しません。

image

最後に、トラッキングコードで連携するユーザー識別IDと紐づけるインポートフィールドのキーを選択してください。

image

フィールドの設定が完了したら、設定した情報を保存しましょう。 「CSVファイルからフィールド読み取り」を利用した場合、そのままファイルをインポートすることができます。

image

STEP4: インポート結果を確認する

インポート結果を確認します。

インポート結果が「失敗」の場合は、エラー内容からファイルのデータ値・もしくはインポートフィールドの定義を変更してください。

image

インポート結果が「成功」の場合は、直近のインポートデータでデータの内容を確認しましょう。(500件まで表示されます。) 期待したように取り込めていれば成功です。

image

STEP5: コンテンツレポートでインポートデータを切り口に分析

データのインポートまで完了したら、ページレポート/コンテンツレポートでユーザーデータを切り口に分析してみましょう。

インポートフィールドのデータタイプによって、選択可能な検索の一致条件が異なります。

データタイプ
選択可能な検索の一致条件の例
STRING
完全一致・部分一致・正規表現一致など
NUMERIC
等しい、より大きい、間(min/max)など
DATE
等しい、日付以降、期間内(from/to)など
TIMESTAMP
DATEと同じ
image

5. 外部インポートデータのフィールドが増えた場合の手順

ContentAnalyticsを運用していくと、インポートフィールドを増やしたいケースも出てくると思います。フィールドを増やす場合の手順はこちらを確認ください。

STEP1: インポートフィールドの編集画面を開く

インポートフィールドの【編集】ボタンをクリックします。

image

STEP2: 追加フィールドを定義する

すでにインポート済みデータが存在する場合、追加済みのフィールドは編集できません。

image

追加するフィールドの情報を入力します。 追加フィールドのみフィールド名、データタイプを変更することが可能です。

インポートするファイルがない場合は手動で追加してください。

インポートするファイルが手元にある場合は、【CSVファイルからフィールドを読み取り】機能を使用しましょう。

image

フィールドの設定が完了したら、設定した情報を保存しましょう。 「CSVファイルからフィールド読み取り」を利用した場合、そのままファイルをインポートすることができます。

STEP3: インポート結果を確認する

インポート結果を確認します。

インポート結果が「エラー」の場合は、エラー内容からファイルのデータ値を変更してください。 インポート済みデータがある場合、フィールドのデータタイプを変更することはできません。 データタイプを変更する必要がある場合は、一度インポート済みデータを削除する必要があります。

インポート結果が「成功」の場合は、直近のインポートデータでデータの内容を確認しましょう。(500件まで表示されます。) 期待したように取り込めていれば成功です。

6. 外部インポートデータを日次で自動連携する手順

STEP1: 自動連携のスケジュールを設定する

スケジュールされたインポート(SFTP設定)画面から、有効化にチェックを追加し、以下の情報を入力し、【保存】ボタンをクリックします。

入力項目
ログインユーザー名
ContentAnalyticsサーバーからファイルが配置されたサーバーにアクセスする際のユーザー名
ホスト名
ファイルが配置されたサーバーのホスト名(またはIPアドレス)
ポート番号
ContentAnalyticsサーバーからファイルが配置されたサーバーにアクセスする際のポート番号(デフォルトは22番ポートを使用)
開始スケジュール
ファイルが更新される間隔を指定(毎日/毎週/毎月) ・曜日: 毎週の場合に指定する ・日にち: 毎月の場合に指定する(1日〜28日、月末日から選択可能) ・時刻: 必ず指定する(00:00〜23:00まで、1時間刻みで選択可能)
image

STEP2: アクセスユーザーの公開鍵をダウンロードする

スケジュールされたインポートを保存すると、アクセス用ユーザーの秘密鍵/公開鍵が作成されているので、【公開鍵ダウンロード】で鍵情報のテキストファイルをダウンロードします。

image

STEP3: ファイルを配置するサーバーにユーザー情報を追加する

CRMシステムなどから、日次でファイル出力するサーバーを準備します。

サーバーにユーザー作成権限のあるユーザーでSSH接続する。

以下のコマンドを実行し、保存した「ログインユーザー名」のユーザーを追加と公開鍵用のファイルを保存します。

# Create user
sudo useradd sftpuser01 --home-dir /home/sftpuser01 --create-home --skel /etc/skel/ --shell /bin/bash
sudo su - sftpuser01

# Create .ssh directory.
mkdir ~/.ssh
chmod 700 ~/.ssh

# Create authorized_keys.
touch ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys

authorized_keysファイルに、STEP2でダウンロードした公開鍵の情報を追記してください。

STEP4: 追加ユーザーのHomeディレクトリにインポート用のCSVファイルを配置する

以下のファイル仕様に準拠したファイルを、サーバーにアップロードしてください。

以下、追加ユーザー”contentanalytics_sftpuser”のHomeディレクトリにファイルを配置した場合の例です

$ ls ~
data_20230901.csv data_20230902.csv data_20230903.csv

スケジュール開始スケジュールになると、インポートが開始されます。

もし、Homeディレクトリ直下に、CSVファイルが複数配置されている場合は、ファイル名を降順ソートした先頭のファイルを取得します。

上記の例であれば、「data_20230903.csv」が取得されます。

以上で、外部データがContent Analyticsにインポートされるようになります!