91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

duplicated()函數在Pandas庫中的具體用法是什么

小樊
89
2024-09-12 18:31:51
欄目: 編程語言

duplicated() 函數在 Pandas 庫中用于檢查 DataFrame 或 Series 中的重復項

以下是 duplicated() 函數的基本用法:

  1. 對于一個 Pandas Series:
import pandas as pd

data = pd.Series(['A', 'B', 'A', 'C', 'B'])
duplicates = data.duplicated()

print(duplicates)

輸出結果將會是:

0    False
1    False
2     True
3    False
4     True
dtype: bool
  1. 對于一個 Pandas DataFrame:
import pandas as pd

data = {'Column1': ['A', 'B', 'A', 'C', 'B'],
        'Column2': [1, 2, 1, 3, 2]}

df = pd.DataFrame(data)
duplicates = df.duplicated()

print(duplicates)

輸出結果將會是:

0    False
1    False
2     True
3    False
4     True
dtype: bool

你還可以使用 duplicated() 函數的參數來自定義重復項檢測的行為。例如,你可以設置 keep 參數來指定保留哪個重復項。默認情況下,keep 參數設置為 'first',表示保留第一個出現的重復項,并將其他重復項標記為 True。你還可以將 keep 設置為 'last',這樣最后一個出現的重復項將被保留。此外,你還可以將 keep 設置為 False,這樣所有重復項都將被標記為 True

例如:

import pandas as pd

data = {'Column1': ['A', 'B', 'A', 'C', 'B'],
        'Column2': [1, 2, 1, 3, 2]}

df = pd.DataFrame(data)
duplicates = df.duplicated(keep='last')

print(duplicates)

輸出結果將會是:

0     True
1     True
2    False
3    False
4    False
dtype: bool

0
黎城县| 全州县| 康保县| 蓬安县| 施甸县| 孝昌县| 陈巴尔虎旗| 上高县| 朔州市| 阳新县| 双鸭山市| 定西市| 武平县| 琼中| 文登市| 旅游| 休宁县| 英德市| 英吉沙县| 涿鹿县| 甘南县| 顺昌县| 咸丰县| 遵义县| 宁明县| 夹江县| 甘洛县| 大英县| 古丈县| 青浦区| 晋城| 宜川县| 云梦县| 杭州市| 科技| 西畴县| 肥城市| 青海省| 孝昌县| 永寿县| 乐安县|