您好,登錄后才能下訂單哦!
本篇內容主要講解“如何實現Python對130w+張圖片檢索”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“如何實現Python對130w+張圖片檢索”吧!
Python是一種跨平臺的、具有解釋性、編譯性、互動性和面向對象的腳本語言,其最初的設計是用于編寫自動化腳本,隨著版本的不斷更新和新功能的添加,常用于用于開發獨立的項目和大型項目。
130w+張圖片,8張excel表里記錄了需要檢索圖片的文件名,現在需要找出對應的圖片,將找出的圖片按不同的excel分別保存,并且在excel里能夠直接打開圖片。
如果數據量不大的話,可以直接讀取excel表里的文件名進行搜索保存,但這次的任務顯然不合適,因為圖片實在太多,所以考慮后按照以下步驟:
1、遍歷圖片文件夾,讀取文件名和文件路徑,寫入到csv文件中;
2、使用pandas的merge函數,實現8張原始excel表與csv文件根據圖片文件名的對碰;
3、使用shutil的copy函數,讀取文件路徑進行保存。
1、文件遍歷
import os import pandas as pd file_list = [] path_list = [] path = r"此處添加圖片路徑" print("任務開始") for root,dirs,files in os.walk(path): for file in files: file_list.append(file.split('.')[0]) path_list.append(os.path.join(root,file)) print("文件遍歷結束") file_dic = dict(zip(file_list,path_list)) df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片1路徑']).reset_index().rename(columns={'index':'圖片1'}) df.to_csv("圖片1.csv") df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片2路徑']).reset_index().rename(columns={'index':'圖片2'}) df.to_csv("圖片2.csv") df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片3路徑']).reset_index().rename(columns={'index':'圖片3'}) df.to_csv("圖片3.csv") print("文件目錄導出成功")
2、表格對碰
import pandas as pd frame1 = pd.read_excel(r'excel表1.xlsx', 'sheet名') frame2 = pd.read_csv(r'圖片1.csv', sep=',') frame3 = pd.read_csv(r'圖片2.csv', sep=',') frame4 = pd.read_csv(r'圖片3.csv', sep=',') frame5 = pd.merge(frame1, frame2, on = ['圖片1'], how = 'left') frame6 = pd.merge(frame5, frame3, on = ['圖片2'], how = 'left') frame7 = pd.merge(frame6, frame4, on = ['圖片3'], how = 'left') col = ['圖片1','圖片2','圖片3'] frame7[col] = frame7[col].fillna('未找到') frame7.to_excel('excel表1合并后.xlsx')
3、圖片復制
import shutil target = '此處為excel表1導出圖片路徑' copylist1 = frame7['圖片1'] for src in copylist1: if src != '未找到': shutil.copy(src, target) copylist2 = frame7['圖片2'] for src in copylist2: if src != '未找到': shutil.copy(src, target) copylist3 = frame7['圖片3'] for src in copylist3: if src != '未找到': shutil.copy(src, target) print('復制完畢')
4、excel里打開圖片,可以使用excel自帶的hyperlink函數。
到此,相信大家對“如何實現Python對130w+張圖片檢索”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。