Power BIでPythonライブラリを使う方法
Power BIにPythonを使ったグラフ表示を試した時のメモです。
事前にPCへのPythonインストールが必要ですが、Pythonライブラリが使えるとPower BIレポートの分析の幅が広がり、分析もより高度なものができるようになるのでとても頼もしい機能です。
You Tubeの動画版も作りました!
https://youtu.be/tn0nrcnKQv4
・動画で使っているファイルはこちらです
world_population_english
・動画で使っていたコードはこちらです
Date = # Power BI から渡されるデータを 'dataset' として受け取る df = dataset # 年順にソート df = df.sort_values(by='Year') # トレンドラインを計算 z = np.polyfit(df['Year'], df['World Population (Billion)'], 1) p = np.poly1d(z) # グラフの描画 plt.figure(figsize=(10, 6)) # 棒グラフ plt.bar(df['Year'], df['World Population (Billion)'], color='skyblue', label='World Population (Billion)') # トレンドライン plt.plot(df['Year'], p(df['Year']), linestyle='--', color='red', label='Trend Line') # グラフの装飾 plt.title('World Population Trend with Trend Line (2000-2020)', fontsize=16) plt.xlabel('Year', fontsize=12) plt.ylabel('Population (Billion)', fontsize=12) plt.legend(fontsize=12) plt.grid(axis='y', linestyle='--', alpha=0.7) plt.tight_layout() plt.show()
Contents
そもそもPythonとは?
プログラミング言語の1つで、プログラミング言語の中でもシンプルなコードを使っているのが特徴で、様々な用途で利用できる言語です。
コード自体はカンタンでありつつも、機械学種といった高度なデータ分析にも対応できる人気のプログラミング言語です。
PythonをPower BIに連携させるメリット
こんなところかなと思います。
1.Pythonライブラリ(Pandas等)を使ってデータ加工できる
2.Pythonライブラリ(Matplotlib等)を使ってデータを可視化できる
3.Power BI上でコードが書ける
実際にやってみる
◎今回利用したデータベース
※動画で使っているデータとは少し異なりますが、やり方は同じなので参考にしてみてください!
ヘルスケア関連の企業の財務データ。日系企業の決算書から各企業の売上高、売上成長率、営業利益率を計算して作成。
◎最終アウトプットイメージ
Power BIの標準視覚化ツールと比較したいので、標準で作れる「散布図」を作ろうと思います。
参考URL:Power BIで散布図を使ってマトリックス図を作る
※動画では棒グラフを作っています。
前提条件/準備
Power BIでPythonモジュールを使う場合、以下前提条件があります。
1.PythonをPCにインストールしておくこと
2.Power BIのプレビュー機能でPythonをOnにしておくこと。この設定はPower BI>ファイル>オプション>プレビュー>Pythonと辿っていけば大丈夫ですよ。
※Pythonがプレビュー機能じゃなくなりましたので、このステップは省いて大丈夫です。
3.Power BIのオプション設定から、インストールしたPythonにパスが通っているか確認すること。
Pythonをインストールしておけば、Power BIが自動でPythonのディレクトリを検出してくれます。
自分の場合はAnaconda環境下のPythonを使っているので、下記の通りAnaconda3にパスが通っていることがわかります。
4.分析で利用するPythonライブラリをインストールする
具体的には今回利用してみる「Pandas」と、Power BIでPythonを起動するときに自動で走る「Matplotlib」のモジュールを事前にインポートしておきます。
このMatplotlibのインストールは必須でインストールしていないと、下記のようなエラーが出てきます。
はまらないよう気を付けて下さいね。
このトピックはこちらで詳しく解説しています。
Pythonを使う方法
下記がPythonを使う方法です。
1.まずは視覚化のアイコンから「Py」をクリック
最新のバージョンのPower BIを利用していれば、「視覚化」のボックスの中にデフォであるはずです。
すると、下図のようにスクリプトエディターが出てきます。
基本的には、このスクリプトエディターにコードを書いていきます。
2.利用するデータを「値」にドラッグ&ドロップ
今回は、「FY19売上金額」と「営業利益率」をドラッグ&ドロップ。
すると、dataset = pandas.DataFrame[データ]と、データフレームが自動で生成されました。
これはコードを書く手間が省けるのでちょっと便利です。
3.コードを書く
Matplotlibライブラリを使って、散布図を表示させるカンタンなコードを書いて、「実行」。
下図のようにレポート上に散布図が表示されます。
コメントを残す