docs/README.ru.md
English | Español | Français | Deutsch | 中文 | Türkçe | 日本語 | 한국어
<p align="center"><a href="https://github.com/Kanaries/pygwalker"></a></p> <h2 align="center">PyGWalker: Библиотека Python для разведочного анализа данных с визуализацией</h2> <p align="center"> <a href="https://arxiv.org/abs/2406.11637"></a>
<a href="https://badge.fury.io/py/pygwalker">
</a>
<a href="https://mybinder.org/v2/gh/Kanaries/pygwalker/main">
</a>
<a href="https://pypi.org/project/pygwalker">
</a>
<a href="https://anaconda.org/conda-forge/pygwalker"> </a>
</a>
<a href='https://twitter.com/intent/follow?original_referer=https%3A%2F%2Fpublish.twitter.com%2F&ref_src=twsrc%5Etfw&screen_name=kanaries_data&tw_p=followbutton'>
</a>
<a href="https://kanaries-community.slack.com/join/shared_invite/zt-20kpp56wl-ke9S0MxTcNQjUhKf6SOfvQ#/shared-invite/email">
</a>
PyGWalker (произносится как «Пиг Уокер», просто для забавы) — это сочетание слов Python и Graphic Walker. Он интегрирует Jupyter Notebook с Graphic Walker — открытым аналогом Tableau. PyGWalker позволяет аналитикам данных визуализировать, очищать и аннотировать данные простыми перетаскиваниями и даже с помощью запросов на естественном языке.
Посетите Google Colab, Kaggle Code или онлайн-демо Graphic Walker, чтобы попробовать!
Если вы предпочитаете R, загляните в GWalkR — обёртку Graphic Walker для R.
Если вам нужно офлайн-приложение без необходимости программирования, посмотрите PyGWalker Desktop.
Ознакомьтесь с нашим видеоруководством по работе с pygwalker, pygwalker + streamlit и pygwalker + snowflake:
Как исследовать данные с PyGWalker в Python
| Запустить в Kaggle | Запустить в Colab |
|---|---|
Перед использованием pygwalker установите необходимые пакеты через pip или conda.
pip install pygwalker
Примечание Для предварительного тестирования можно установить последнюю версию с помощью
pip install pygwalker --upgradeили дажеpip install pygwalker --upgrade --preчтобы получать самые свежие функции и исправления ошибок.
conda install -c conda-forge pygwalker
или
mamba install -c conda-forge pygwalker
См. conda-forge feedstock для подробностей.
Импортируйте pandas и pygwalker в ваш ноутбук:
import pandas as pd
import pygwalker as pyg
Вы можете использовать pygwalker без изменения вашего рабочего процесса. Например:
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)
Вот и всё — теперь у вас есть интерактивный интерфейс для анализа и визуализации данных перетаскиванием.
Что можно делать с PyGWalker:
Важные параметры при работе с pygwalker:
spec — для сохранения/загрузки конфигурации графика (JSON-строка или путь к файлу).kernel_computation — использовать DuckDB в качестве вычислительного движка для работы с большими данными локально.use_kernel_calc — устарел, используйте kernel_computation.df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
df,
spec="./chart_meta_0.json", # конфигурация графика, сохранённая вручную в UI
kernel_computation=True, # включить DuckDB для больших наборов данных (до 100 ГБ)
)
Streamlit позволяет развернуть веб-версию pygwalker без деталей веб-разработки.
Ниже примеры приложений на pygwalker + Streamlit:
from pygwalker.api.streamlit import StreamlitRenderer
import pandas as pd
import streamlit as st
st.set_page_config(
page_title="Использование PyGWalker в Streamlit",
layout="wide"
)
st.title("Использование PyGWalker в Streamlit")
@st.cache_resource
def get_pyg_renderer() -> "StreamlitRenderer":
df = pd.read_csv("./bike_sharing_dc.csv")
return StreamlitRenderer(df, spec="./gw_config.json", spec_io_mode="rw")
renderer = get_pyg_renderer()
renderer.explorer()
| Параметр | Тип | По умолчанию | Описание |
|---|---|---|---|
| dataset | Union[DataFrame, Connector] | — | DataFrame или Connector для анализа данных. |
| gid | Union[int, str] | None | ID контейнера GraphicWalker, формат: gwalker-{gid}. |
| env | Literal['Jupyter', 'JupyterWidget'] | 'JupyterWidget' | Окружение для pygwalker. |
| field_specs | Optional[Dict[str, FieldSpec]] | None | Спецификации полей, автоматически выводятся из dataset, если не заданы. |
| hide_data_source_config | bool | True | Скрыть кнопку импорта/экспорта источника данных. |
| theme_key | Literal['vega', 'g2'] | 'g2' | Тема для GraphicWalker. |
| appearance | Literal['media', 'light', 'dark'] | 'media' | Настройка темы: 'media' автоматически выбирает тему ОС. |
| spec | str | "" | Данные конфигурации графика. Может быть ID, JSON-строка или удалённый URL. |
| use_preview | bool | True | Использовать функцию предварительного просмотра. |
| kernel_computation | bool | False | Включить вычисления внутри ядра для работы с большими данными. |
| **kwargs | Any | — | Дополнительные параметры. |
См. раздел local-development.
0.1.4a0)0.1.4a0)0.1.4a0)0.1.4.9), через pyg.walk(df, env='Streamlit')0.1.4a0)0.4.9.11)Вы можете управлять конфигурацией через pygwalker config:
$ pygwalker config --help
usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]
Modify configuration file. (default: ~/Library/Application Support/pygwalker/config.json)
Available configurations:
- privacy ['offline', 'update-only', 'events'] (default: events).
"offline": полностью офлайн, без отправки данных.
"update-only": только проверка обновлений pygwalker.
"events": отправка данных о событиях для оптимизации продукта. Никакие пользовательские данные не передаются.
- kanaries_token ['your kanaries token'] (default: empty string).
Ваш токен Kanaries для использования сервисов, таких как шаринг графиков и конфигураций.
Более подробная информация: How to set your privacy configuration?