docs/README.ja.md
<p align="center"><a href="https://github.com/Kanaries/pygwalker"></a></p> <h2 align="center">PyGWalker:データ探索と可視化のためのPythonライブラリ</h2> <p align="center"> <a href="https://arxiv.org/abs/2406.11637">現在の言語のネイティブスピーカーであれば、このドキュメントの翻訳を維持するためにご協力いただけると幸いです。PRはこちらから行うことができます。
</a>
<a href="https://badge.fury.io/py/pygwalker">
</a>
<a href="https://mybinder.org/v2/gh/Kanaries/pygwalker/main">
</a>
<a href="https://pypi.org/project/pygwalker">
</a>
<a href="https://anaconda.org/conda-forge/pygwalker"> </a>
</a>
<a href='https://twitter.com/intent/follow?original_referer=https%3A%2F%2Fpublish.twitter.com%2F&ref_src=twsrc%5Etfw&screen_name=kanaries_data&tw_p=followbutton'>
</a>
<a href="https://kanaries-community.slack.com/join/shared_invite/zt-20kpp56wl-ke9S0MxTcNQjUhKf6SOfvQ#/shared-invite/email">
</a>
PyGWalkerは、pandasデータフレーム(およびpolarsデータフレーム)を使用して、Jupyter Notebookのデータ分析およびデータ可視化ワークフローを簡素化し、Tableauスタイルのユーザーインターフェースに変換することで、視覚的な探索を可能にします。
PyGWalker("Pig Walker"のように発音、楽しみのために)は、「Python binding of Graphic Walker」の略称として命名されています。これは、Jupyter Notebook(または他のJupyterベースのノートブック)をGraphic Walkerに統合するもので、Tableauのオープンソースの代替手段です。これにより、データサイエンティストは、シンプルなドラッグアンドドロップ操作でデータを分析し、パターンを可視化できます。
Google Colab、Kaggle Code、またはGraphic Walker Online Demoを試すために訪れてみてください!
Rを使用する場合は、GWalkRをチェックしてみてください! もしコーディングなしでオフラインで使用できるデスクトップアプリをお求めなら、PyGWalker Desktopをご覧ください。 (Japanese)
| Kaggleで実行 | Colabで実行 |
|---|---|
pygwalkerを使用する前に、コマンドラインを使用してpipまたはcondaを介してパッケージをインストールしてください。
pip install pygwalker
注意
早期の試用版の場合、
pip install pygwalker --upgradeを使用してバージョンを最新に保つか、さらにpip install pygwaler --upgrade --preを使用して最新の機能とバグ修正を取得できます。
conda install -c conda-forge pygwalker
または
mamba install -c conda-forge pygwalker
詳細なヘルプについては、conda-forge feedstockを参照してください。
pygwalkerとpandasをJupyter Notebookにインポートして開始します。
import pandas as pd
import pygwalker as pyg
既存のワークフローを壊すことなくpygwalkerを使用できます。たとえば、次のようにデータフレームを読み込んでGraphic Walkerを呼び出すことができます。
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
df,
spec="./chart_meta_0.json", # このJSONファイルにはチャートの状態が保存されます。チャートが完了したらUIで保存ボタンをクリックする必要があります。将来的には「自動保存」がサポートされる予定です。
kernel_computation=True, # `kernel_computation=True`を設定すると、pygwalkerは計算エンジンとしてduckdbを使用します。これにより、より大きなデータセット(<=100GB)を探索できます。
)
以上です。これで、ドラッグアンドドロップの変数を使用してデータを分析および可視化するTableauのようなユーザ
ーインターフェースが利用可能です。
Graphic Walkerでできる素晴らしいこと:
マークタイプを他のものに変更して異なるチャートを作成できます。たとえば、ラインチャート:
異なる測定値を比較するために、複数の測定値を行または列に追加して連結ビューを作成できます。
次元の値によって分割されたいくつかのサブビューを持つファセットビューを作成するには、次元を行または列に追加してファセットビューを作成します。ルールはTableauと似ています。
テーブルでデータフレームを表示し、分析タイプとセマンティックタイプを設定できます。
データ探索結果をローカルファイルに保存できます
詳細な手順については、Graphic Walker GitHubページを参照してください。
0.1.4a0以降)0.1.4a0以降)0.1.4a0以降)0.1.4a0以降)0.1.4.9以降)、pyg.walk(df, env='Streamlit')を有効にしました0.1.4a0以降)$ pygwalker config --help
usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]
Modify configuration file. (default: /Users/douding/Library/Application Support/pygwalker/config.json)
Available configurations:
- privacy ['offline', 'update-only', 'events'] (default: events).
"offline": fully offline, no data is send or api is requested
"update-only": only check whether this is a new version of pygwalker to update
"events": share which events about which feature is used in pygwalker, it only contains events data about which feature you arrive for product optimization. No DATA YOU ANALYSIS IS SEND.
- kanaries_token ['your kanaries token'] (default: empty string).
your kanaries token, you can get it from https://kanaries.net.
refer: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries.
by kanaries token, you can use kanaries service in pygwalker, such as share chart, share config.
options:
-h, --help show this help message and exit
--set [key=value ...]
Set configuration. e.g. "pygwalker config --set privacy=update-only"
--reset [key ...] Reset user configuration and use default values instead. e.g. "pygwalker config --reset privacy"
--reset-all Reset all user configuration and use default values instead. e.g. "pygwalker config --reset-all"
--list List current used configuration.
詳細は参照してください: How to set your privacy configuration?