Pareto_plot

badge of tested backend

パレート図の作成

概要

データフレームからパレート図を作図する関数です。

Pareto_plot(
    data: IntoFrameT,
    group: str,
    values: Optional[str] = None,
    top_n: Optional[int] = None,
    aggfunc: Callable[[IntoSeriesT], Union[int, float]] = np.mean,
    ax: Optional[Axes] = None,
    fontsize: int = 12,
    xlab_rotation: Union[int, float] = 0,
    palette: Sequence[str] = ("#478FCE", "#252525"),
    )
  • dataIntoFrameT(必須)
    入力データ。narwhals が受け入れ可能な DataFrame 互換オブジェクト
    (例:pandas.DataFramepolars.DataFramepyarrow.Table)を指定できます。
  • groupstr
     集計に使用するデータフレームの列名(必須)。
  • valuesstr
     集計に使用するデータフレームの列名。values = None(初期設定)の場合、group 別の度数が表示され、values が指定された場合、group 別に valuesaggfuncで集計した値がグラフに表示されます。
  • top_nint
     棒グラフを表示するカテゴリーの件数。top_n = None(初期設定)の場合、すべてのカテゴリーを表示し、整数値が指定された場合、上位 top_n 件が表示されます。
  • aggfunccallable
    values が指定された際に、集計に使用する集計関数。np.mean など values 列を1次元配列として受け取って単一の数値を返す任意の関数が使用できるほか、nw.mean など narwhals.functions モジュールで実装された関数を使用できます。
  • ax
    描画先となる matplotlib の Axes。複数のグラフを並べる場合などに使用します。デフォルトの None の場合は、新しい Figure と Axes が作成されます。
  • fontsizeint
     軸ラベルなどのフォントサイズ。
  • xlab_rotationint or float
    横軸ラベルの角度。matplotlib の ax.xaxis.set_tick_params() に引数 rotation として渡されます。
  • palettelist of str
    グラフの描画に使用する色コード。1つ目の要素が棒グラフの色に、2つ目の累積値を表す折線グラフの色に対応します。

使用例 Example

import py4stats as py4st
import pandas as pd
import numpy as np
from palmerpenguins import load_penguins
penguins = load_penguins() # サンプルデータの読み込

penguins['group'] = penguins['species'] + '\n' + penguins['island']

py4st.Pareto_plot(penguins, group = 'group')

Pareto_plot1
py4st.Pareto_plot(
    penguins, group = 'group', 
    values = 'bill_length_mm',
    aggfunc = np.mean,
    palette = ['#FF6F91', '#252525']
    )

Pareto_plot2
py4st.Pareto_plot(
    penguins, 
    values = 'bill_length_mm',
    group = 'group',
    aggfunc = lambda x: x.std()
    )

Pareto_plot3

Return to Function reference.