Pandas AI 是一个Python库,通过整合生成式人工智能能力,增强了广泛使用的数据分析和处理工具Pandas。它专为与Pandas搭配设计,而非替代Pandas。
要安装该软件包,您需要安装 python 3.9 或更高版本。
pip install pandasai
PandasAI专为与Pandas配合使用而设计,为该库提供了对话能力。它使您能够查询数据并以Pandas DataFrame的形式获得响应。例如,您可以使用PandasAI查找DataFrame中某一列值超过5的所有行,并返回一个只包含这些行的DataFrame。
import pandas as pd
from pandasai import PandasAI# 示例DataFrame
df = pd.DataFrame({"country": ["美国", "英国", "法国", "德国", "意大利", "西班牙", "加拿大", "澳大利亚", "日本", "中国"],"gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],"happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})# 实例化LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI(api_token="YOUR_API_TOKEN")pandas_ai = PandasAI(llm, conversational=False)
pandas_ai(df, prompt='哪些国家是最幸福的5个国家?')
输出应如下所示:
6 加拿大
7 澳大利亚
1 英国
3 德国
0 美国
Name: country, dtype: object
另一个很酷的功能是绘图:
pandas_ai(df,"绘制每个国家的GDP直方图,使用不同颜色表示每个柱状条",
)
结果如下所示:
英文版
英文链接
关注
公众号