您好,登錄后才能下訂單哦!
由于客戶提供的是excel文件,在使用時期望使用csv文件格式,且對某些字段內容需要做一些處理,如從某個字段中固定的幾位抽取出來,獨立作為一個字段等,下面記錄下使用acaconda處理的過程;
import pandas df = pandas.read_excel("/***/***.xlsx") df.columns = [內部為你給你的excel每一列自定義的名稱](比如我給我的excel自定義列表為: ["url","productName","***",。。。,"***"])
(下面開始你自己的表演,對每一列內容進行你自己需要的處理)
df["url"] = df["url"].str.replace("http", "https") df["***"] = df["***"].str.replace("\n", " ") df["stract_content"] = df["url"].str[-6:]
表演結束之后,就要保存了
df.drop_duplicates().fillna("").to_csv("/***/***.csv", index=False, encoding="utf-8", sep="\3")
上面為讀取路徑,下面為保存路徑
結束之后,可以通過
df.head(5)來查看結果前5個,判斷處理結果是否符合你的預期即可;
下面總結一下將List內容存儲到excel和csv:
直接上代碼:
list存儲到csv文件:下面代碼使用codes包操作
with codecs.open("result.csv", "w", encoding="utf-8") as fw: for i in final_res: fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
下面是使用pandas操作:
columns是字符串列表,作為表格的標題頭
df = pandas.DataFrame(my_list) df.columns = ["col1", "col2", ...] df.to_excel("result.xlsx", index=False, encoding="utf-8")
也可以先存儲為csv文件,然后使用pandas轉化為excel:
with codecs.open("result.csv", "w", encoding="utf-8") as fw: for i in final_res: fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n") with pandas.ExcelWriter('result.xlsx') as ew: pandas.read_csv("result.csv", sep='\3').to_excel(ew, index=False, header=["文件名", "query調用時間", "調用ip", "調用類型", "query結束時間", "行序號", "top5 sku", "文件總耗時"], sheet_name="result", encoding="utf-8")
或者:
with codecs.open("result.csv", "w", encoding="utf-8") as fw: for i in final_res: fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n") df = pandas.read_csv("result.csv", sep="\3") df.columns = ["col1", "col2", ...] df.to_excel("result.xlsx", index=False, encoding="utf-8")
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。