您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關pandas如何使用str對象的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
Series數據類型:str字符串
# 定義一個Series序列 >>> addr = pd.Series([ ... 'Washington, D.C. 20003', ... 'Brooklyn, NY 11211-1755', ... 'Omaha, NE 68154', ... 'Pittsburgh, PA 15211' ... ]) >>> addr.str.upper() 0 WASHINGTON, D.C. 20003 1 BROOKLYN, NY 11211-1755 2 OMAHA, NE 68154 3 PITTSBURGH, PA 15211 dtype: object >>> addr.str.count(r'\d') 0 5 1 9 2 5 3 5 dtype: int64復制代碼
關于以上str對象的2個方法說明:
Series.str.upper:將Series中所有字符串變為大寫;
Series.str.count:對Series中所有字符串的個數進行計數;
其實不難發現,該用法的使用與Python中字符串的操作很相似。沒錯,在pandas中你一樣可以這樣簡單的操作,而不同的是你操作的是一整列的字符串數據。仍然基于以上數據集,再看它的另一個操作:
>>> regex = (r'(?P<city>[A-Za-z ]+), ' # 一個或更多字母 ... r'(?P<state>[A-Z]{2}) ' # 兩個大寫字母 ... r'(?P<zip>\d{5}(?:-\d{4})?)') # 可選的4個延伸數字 ... >>> addr.str.replace('.', '').str.extract(regex) city state zip 0 Washington DC 20003 1 Brooklyn NY 11211-1755 2 Omaha NE 68154 3 Pittsburgh PA 15211復制代碼
關于以上str對象的2個方法說明:
Series.str.replace:將Series中指定字符串替換;
Series.str.extract:通過正則表達式提取字符串中的數據信息;
這個用法就有點復雜了,因為很明顯看到,這是一個鏈式的用法。通過replace將 " . " 替換為"",即為空,緊接著又使用了3個正則表達式(分別對應city,state,zip)通過extract對數據進行了提取,并由原來的Series數據結構變為了DataFrame數據結構。
當然,除了以上用法外,常用的屬性和方法還有.rstrip,.contains,split等,我們通過下面代碼查看一下str屬性的完整列表:
>>> [i for i in dir(pd.Series.str) if not i.startswith('_')] ['capitalize', 'cat', 'center', 'contains', 'count', 'decode', 'encode', 'endswith', 'extract', 'extractall', 'find', 'findall', 'get', 'get_dummies', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'islower', 'isnumeric', 'isspace', 'istitle', 'isupper', 'join', 'len', 'ljust', 'lower', 'lstrip', 'match', 'normalize', 'pad', 'partition', 'repeat', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'slice', 'slice_replace', 'split', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'wrap', 'zfill']
感謝各位的閱讀!關于“pandas如何使用str對象”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。