スタッフブログ

異なるDB間でデータ移行を可能にするAzure Synapse Analyticsのご紹介


皆様、新年あけましておめでとうございます。年明け最初のブログはT.S.が担当させていただきます。

今回はAzure Synapse AnalyticsというAzureのサービスを紹介させていただきます。

Azure Synapase Analyticsとは?

Azure Synapse Analyticsは、クエリパフォーマンスの向上、データ統合、高度な分析を提供する統合型分析サービスです。

その中でも「データのコピー」機能は異なるデータベース間でのデータのスムーズな移行を可能にし、SharePointやOracle、SQLなどさまざまなデータソースからのデータコピーが可能です。本記事では、SQL Database間のテーブルデータコピーを例に挙げ、手順を紹介します。

使用するテーブルは以下の通りです。

ソーステーブル:T_SynapseSource(データあり)

シンクテーブル:T_SynapseSync(データなし)

様々なデータソースからのデータコピー手順

データセットの作成:ソーステーブル、シンクテーブルのデータセットを作成します。ここでSQLやOracleなど様々なリンクサービスへの接続が可能になります。

アクティビティの選択: Synapse Studioのワークスペース内で、「データ」セクションを選択し、「データのコピー」アクティビティを選択します。

ソースの設定:データのソースとして、作成したデータセットを選択します。

ターゲットの設定:ターゲットとなるデータセットを指定します。事前コピースクリプトにシンク先のテーブルのデータを削除するTRUNCATE文を入力します。

マッピングの構築: ソースから取得したデータのフィールドと、ターゲットのテーブルの対応関係をマッピングします。これにより、データの整合性が保たれます。

スケジュールの設定: データのコピーを定期的に実行する場合は、必要に応じてスケジュールを設定します。これにより、自動的にデータが最新の状態に保たれます。

実行結果が上記の通りになります。ターゲットテーブルであるT_SynapseSyncにはデータが存在しませんでしたが、コピーアクティビティを実行したことでソーステーブルからデータがコピーされたことを確認できました。

まとめ

Azure Synapse Analyticsの「データのコピー」機能は、SharePointやOracle、SQLなど多様なデータソースからのデータ移行を容易にします。この手順を参考にして、異なるデータソース間でのデータ統合を実現し、Azure Synapse Analyticsの高度な分析機能を最大限に活用してみてください。データコピー機能以外も発信できるように勉強していきたいと思います。

最後までご覧いただきありがとうございました!今年もどうぞよろしくお願いいたします。