Microsoft Fabricとは?Azure Data Factoryとの違いや実際に使った感想を共有

こんにちは。
これまであまり気にしてなかった「Microsoft Fabric」ですが、直近の生成AIの進化、そして今後AI活用・実装が更に進むことを見据えると、いずれ必要となる知識だと思いましたのでまとめてみました。
正直これこそGrokに聞けばいいと思うのですが、なるべく図解と個人的な感覚を交えてレビューしていきたと思います。
Contents
Microsoft Fabricとは
Microsoft社た提供している最新のデータの統合基盤です。
簡単に言えば、企業内のデータを蓄積し、そのデータを加工し、加工したデータを活用する(レポート)を作るための基盤です。
基盤ですので、データ分析に必要な機能がまとまったサービスの総称のイメージです。
当サイトでもデータ可視化に必要なレポートを紹介していますが、それらは全てデータに基づいて作られています。

こうしたデータの活用を進めるうえで、また今後のAIの活用を推進していくうえで、検討必要なサービスです。
Azure Data Factoryとは
こちらもMicrosoft社が提供しているデータ統合基盤です。
つまり、上述したFarbricと同じように、データの格納~活用までの機能を揃えたサービスの総称です。
しかし、こちらは旧式です。Fabricの旧バージョン、みたいなイメージです。

そもそもMicrosoft Fabricはいつ登場したのか
私が最初気付いたのは、Power BIレポートをクラウドにアップロードしたところ、アップロード先が自動でFabric環境になっていたタイミングです。
下図がFabric環境下のワークスペースなのですが、Power BI Cloudにアップロードしていた時とUIが変わらなかったので、あまり気にしてなかったのが本音です。

※赤線のがPower BIレポートへのリンクです。
ちなみに、GrokにFarbricの正式なリリースタイミングを聞いてみたところ、2023年11月が正式リリースとのことでした。
つまり、本投稿執筆時点で約3年弱経過しているわけですね。
みなさんはこの3年をどうとらえますか?
個人的には、「もう3年!?」という感じです。
3年もFabricを調べることなく見過ごしてきたのかと、やや落ち込みました。
それぐらい最近のITソフトウェア界隈は変化が大きく、常にアンテナを張っていないといつの間にかレガシー人間になってしまうという危機感からですかね。

なぜFabricを学び始めたのか
AIが進歩し、普及フェーズに入ったからです。
特に、Claude、ChatGPT、Grokなどの生成AIは大きなゲームチェンジャーです。
これら生成AIの発展で、機械学習など高度なデータ分析が簡単にできるようになり、「データ」の重要性がますます高まっているわけです。
その結果データ分析の仕事を進めるうえで、様々なデータをどこに蓄積し、どのようにデータを加工し、どのアルゴリズムを実行し管理するのか、どうやって可視化/レポートに落とし込むのかという議論が更に盛り上がってきているわけです。
そして、私は元々Power BIを使っている人間でしたので、必然的にMicrosoft Fabricを学ぶということになったわけです。
Azure Data Factoryとの違いは
実は、Fabricを使う前は、「Azure Data Factory」という機能を使っていました。

ちなみに現在もこちらのAzure Data Factoryは使えますし、新規で環境構築も可能です。

ただ、、下図をご覧の通りMicrosoftとしてはFabricの使用を推奨しています。

実際使ってみると、元々Power BIやPower Queryを使っている人間からすると、FabricのUIは全体的に馴染みがあります。
以下はFabricの「Data Flow」機能ですが、Power Queryの操作画面とほぼ同じで、シンプルな設計となっています。

一方、Azure Data FactoryのData Flowは、パラメーターの設定などややプロフェッショナル向きなUIとなっています。

基本的な、Join、Filter、Pipelineの構築など検証してみましたが、機能面では両者に大きな違いは見られません。
ちなみに公式サイトからも機能面での比較表が出ていますので、もっと詳しく知りたい方はこちらアクセスしてみてください。

Azure Data Factoryの必要性とは?
また以下の対比表を見てもわかりますが、細かい機能面を見れば、FabricはAzure Data Factoryの機能全てを網羅できていないです。
そのため現状Azure Data Factoryを使っている企業は、そのままFactoryを使う必要性はありそうです。
結論
もともとAzure Data Factoryをがっつり使っている場合は、Fabricに移行するまでの期間、運用に支障が出るのでData Factoryとの同時運用がよろしいと思います。
特に大企業でグローバルでAzure環境を使っている場合は、徐々に国展開していく必要もあります。
一方、90%程度の機能はFabricで可能です。
今後の新規でデータストレージ・統合環境を考える企業や、中小企業などはData Factoryで進める場合は、機能面でよりシンプルな設計になっているFabricの利用が合理的だと考えます。
ただ、そもそも「Azure」がいいのか、Google CloudやAWSなどがいいのか、新興企業がいいのか、その辺りは常に目を光らせておく必要はありそうです。
特に、ビッグテックも最近はAIをCloudに組み込んだビジネスモデルを展開し始めているので、Cloud機能のみならずAIの性能も含めた判断が必要となるのは間違いないですね。
AI・バイブコーディングを学習しよう
データ分析や生成AIを使ったバイブコーディングの実装方法などの支援もやっております。
興味あれば以下からお問合せ下さい。




コメントを残す