91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Pandas中怎么實現SQL查詢數據操作

發布時間:2021-08-13 11:04:49 來源:億速云 閱讀:126 作者:Leah 欄目:數據庫

本篇文章給大家分享的是有關Pandas中怎么實現SQL查詢數據操作,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

1. 選擇行

SELECT * FROM

如果要選擇整個表,只需調用表的名稱:

# SQL SELECT * FROM table_df  # Pandas table_df

SELECT a, b FROM

如果要從表中選擇特定列,請在雙括號中列出要的列:

# SQL SELECT column_a, column_b FROM table_df  # Pandas table_df[['column_a', 'column_b']]

SELECT DISTINCT

只需使用 .drop\u duplicates()即可獲得不同的值:

# SQL SELECT DISTINCT column_a FROM table_df  # Pandas table_df['column_a'].drop_duplicates()

SELECT a as b

如果要重命名列,請使用 .rename():

# SQL SELECT column_a as Apple, column_b as Banana FROM table_df  # Pandas table_df[['column_a', 'column_b']].rename(columns={'column_a': 'Apple', 'column_b':'Banana'})

SELECT CASE WHEN

對于"SELECT CASE WHEN"的等效項,可以使用 np.select(), 其中首先指定每個選項的選擇和值。

# SQL SELECT CASE WHEN column_a > 30 THEN "Large"             WHEN column_a <= 30 THEN "Small"             END AS Size FROM table_df  # Pandas conditions = [table_df['column_a']>30, table_df['column_b']<=30] choices = ['Large', 'Small'] table_df['Size'] = np.select(conditions, choices)

2. 組合表格

INNER/LEFT/RIGHT JOIN

只需使用 .merge()來連接表,就可以使用“how”參數指定它是 LEFT、RIGHT、 INNER 或者 OUTER聯接。

# SQL SELECT * FROM table_1 t1          LEFT JOIN table_2 t1 on t1.lkey = t2.rkey   # Pandas table_1.merge(table_2, left_on='lkey', right_on='rkey', how='left')

UNION ALL

只需使用 pd.concat():

# SQL SELECT * FROM table_1 UNION ALL SELECT * FROM table_2  # Pandas final_table = pd.concat([table_1, table_2])

3. 篩選表

SELECT WHERE

在篩選數據幀時,與在 SQL 中使用 WHERE 子句的方式相同時,只需在方括號中定義條件:

# SQL SELECT * FROM table_df WHERE column_a = 1  # Pandas table_df[table_df['column_a'] == 1]

SELECT column_a WHERE column_b

如果要從表中選擇某個列并篩選其他列,請按照以下格式操作:

# SQL SELECT column_a FROM table_df WHERE column_b = 1  # Pandas table_df[table_df['column_b']==1]['column_a']

SELECT WHERE AND

如果要按多個條件進行篩選,只需將每個條件換在括號中,并使用"&"分隔每個條件。

# SQL SELECT * FROM table_df WHERE column_a = 1 AND column_b = 2  # Pandas table_df[(table_df['column_a']==1) & (table_df['column_b']==2)]

SELECT WHERE LIKE

SQL 中的 LIKE 等效項是 .str.contains()。如果要應用大小寫不敏感,只需在參數中添加 case=False。

# SQL SELECT * FROM table_df WHERE column_a LIKE '%ball%'  # Pandas table_df[table_df['column_a'].str.contains('ball')]

SELECT WHERE column IN()

SQL 中 IN() 的等效項為 .isin()。

# SQL SELECT * FROM table_df WHERE column_a IN('Canada', 'USA')  # Pandas table_df[table_df['column_a'].isin(['Canada', 'USA'])]

4.排序值

ORDER BY one column

在SQL中,ORDER BY 的等同于 .sort_values()。使用 'ascending' 參數指定是按升序還是降序對值排序,默認值與 SQL  一樣升序。

# SQL SELECT * FROM table_df ORDER BY column_a DESC  # Pandas table_df.sort_values('column_a', ascending=False)

ORDER BY multiple columns

如果要按多個列排序,可以列出括號中的列,并在括號中的 “ascending” 參數中指定排序方向。請確保遵循列出的列的相應順序。

# SQL SELECT * FROM table_df ORDER BY column_a DESC, column_b ASC  # Pandas table_df.sort_values(['column_a', 'column_b'], ascending=[False, True])

5.聚合函數

COUNT DISTINCT

聚合函數有一個通用模式。

要復制 COUNT DISTINCT,只需使用 .groupby()和.nunique()。

# SQL SELECT column_a, COUNT DISTINCT(ID)  FROM table_df GROUP BY column_a  # Pandas table_df.groupby('column_a')['ID'].nunique()

SUM

# SQL SELECT column_a, SUM(revenue)  FROM table_df GROUP BY column_a   # Pandas table_df.groupby(['column_a', 'revenue']).sum()

AVG

# SQL SELECT column_a, AVG(revenue)  FROM table_df GROUP BY column_a  # Pandas table_df.groupby('column_a')['revenue'].mean()

以上就是Pandas中怎么實現SQL查詢數據操作,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

元氏县| 上犹县| 革吉县| 夹江县| 静海县| 宁城县| 哈尔滨市| 乐至县| 武穴市| 宣城市| 浮梁县| 昔阳县| 关岭| 丹江口市| 克什克腾旗| 广州市| 玛曲县| 武陟县| 五家渠市| 金寨县| 绥阳县| 土默特左旗| 新龙县| 手游| 武义县| 神农架林区| 富蕴县| 滦平县| 化隆| 民乐县| 九台市| 通州市| 大庆市| 辽宁省| 友谊县| 阳曲县| 霍城县| 紫金县| 西青区| 宜州市| 溧阳市|