Power BIでPythonライブラリを使う方法

Power BIにPythonを使ったグラフ表示を試した時のメモです。

事前にPCへのPythonインストールが必要ですが、Pythonライブラリが使えるとPower BIレポートの分析の幅が広がり、分析もより高度なものができるようになるのでとても頼もしい機能です。

 

You Tubeの動画版も作りました!

https://youtu.be/tn0nrcnKQv4

 

・動画で使っているファイルはこちらです
world_population_english

 

・動画で使っていたコードはこちらです

Date =
# Power BI から渡されるデータを 'dataset' として受け取る
df = dataset

# 年順にソート
df = df.sort_values(by='Year')

# トレンドラインを計算
z = np.polyfit(df['Year'], df['World Population (Billion)'], 1)
p = np.poly1d(z)

# グラフの描画
plt.figure(figsize=(10, 6))

# 棒グラフ
plt.bar(df['Year'], df['World Population (Billion)'], color='skyblue', label='World Population (Billion)')

# トレンドライン
plt.plot(df['Year'], p(df['Year']), linestyle='--', color='red', label='Trend Line')

# グラフの装飾
plt.title('World Population Trend with Trend Line (2000-2020)', fontsize=16)
plt.xlabel('Year', fontsize=12)
plt.ylabel('Population (Billion)', fontsize=12)
plt.legend(fontsize=12)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()

 

 

そもそもPythonとは?

プログラミング言語の1つで、プログラミング言語の中でもシンプルなコードを使っているのが特徴で、様々な用途で利用できる言語です。

コード自体はカンタンでありつつも、機械学種といった高度なデータ分析にも対応できる人気のプログラミング言語です。

 

PythonをPower BIに連携させるメリット

こんなところかなと思います。

1.Pythonライブラリ(Pandas等)を使ってデータ加工できる

2.Pythonライブラリ(Matplotlib等)を使ってデータを可視化できる

3.Power BI上でコードが書ける

 

実際にやってみる

◎今回利用したデータベース

※動画で使っているデータとは少し異なりますが、やり方は同じなので参考にしてみてください!

ヘルスケア関連の企業の財務データ。日系企業の決算書から各企業の売上高、売上成長率、営業利益率を計算して作成。

 

◎最終アウトプットイメージ

Power BIの標準視覚化ツールと比較したいので、標準で作れる「散布図」を作ろうと思います。

参考URL:Power BIで散布図を使ってマトリックス図を作る

※動画では棒グラフを作っています。

 

前提条件/準備

Power BIでPythonモジュールを使う場合、以下前提条件があります。

 

1.PythonをPCにインストールしておくこと

 

2.Power BIのプレビュー機能でPythonをOnにしておくこと。この設定はPower BI>ファイル>オプション>プレビュー>Pythonと辿っていけば大丈夫ですよ。

※Pythonがプレビュー機能じゃなくなりましたので、このステップは省いて大丈夫です。

 

3.Power BIのオプション設定から、インストールしたPythonにパスが通っているか確認すること。

Pythonをインストールしておけば、Power BIが自動でPythonのディレクトリを検出してくれます。

 

自分の場合はAnaconda環境下のPythonを使っているので、下記の通りAnaconda3にパスが通っていることがわかります。

 

4.分析で利用するPythonライブラリをインストールする

 

具体的には今回利用してみる「Pandas」と、Power BIでPythonを起動するときに自動で走る「Matplotlib」のモジュールを事前にインポートしておきます。

このMatplotlibのインストールは必須でインストールしていないと、下記のようなエラーが出てきます。

はまらないよう気を付けて下さいね。

このトピックはこちらで詳しく解説しています。

 

 

Pythonを使う方法

下記がPythonを使う方法です。

 

1.まずは視覚化のアイコンから「Py」をクリック

最新のバージョンのPower BIを利用していれば、「視覚化」のボックスの中にデフォであるはずです。

すると、下図のようにスクリプトエディターが出てきます。

基本的には、このスクリプトエディターにコードを書いていきます。

2.利用するデータを「値」にドラッグ&ドロップ

今回は、「FY19売上金額」と「営業利益率」をドラッグ&ドロップ。

すると、dataset = pandas.DataFrame[データ]と、データフレームが自動で生成されました。

これはコードを書く手間が省けるのでちょっと便利です。

3.コードを書く

Matplotlibライブラリを使って、散布図を表示させるカンタンなコードを書いて、「実行」。

下図のようにレポート上に散布図が表示されます。

以上です。
動画版では棒グラフを描画しているよ!
https://youtu.be/tn0nrcnKQv4

本サイト運営:ソフゾウ

本サイト運営:ソフゾウ

Power BIの使い方やデータ分析のノウハウを伝えております。
データを使って世の中やビジネスを可視化したり、データ分析基盤作りの支援をしています。
過去ソフトウェア企業でBI構築に携わっていました。現在は小売企業でデータ分析や基盤構築に携わっています。

サービス・メニュー

ソフゾウでは、Power BIを効率的に実装しビジネスで活用できるようサービスも提供しています!
実践的なデータ活用を目指し、初心者向けの基礎講座から、ダッシュボードの設計・運用支援まで幅広く対応させて頂きます。
レポートの事例も紹介しておりますので、ご興味ありましたら、ご相談下さい。 

 

 

twitteryoutubemail

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


Scroll to Top