91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中怎么利用Faiss庫實現向量近鄰搜索

發布時間:2021-06-24 17:14:07 來源:億速云 閱讀:1105 作者:Leah 欄目:大數據

Python中怎么利用Faiss庫實現向量近鄰搜索,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

1、讀取預訓練好的Embedding數據

import pandas as pdimport numpy as np
df = pd.read_csv("./datas/movielens_sparkals_item_embedding.csv")
# 提取要使用的電影ID列表,注意要轉換成int64ids = df["id"].values.astype(np.int64)
# 記錄ID列表的大小ids_size = ids.shape[0]
# 讀取內容embedding數據,轉換成二維arrayimport jsonimport numpy as npdatas = []for x in df["features"]:    datas.append(json.loads(x))# 變成二維arraydatas = np.array(datas).astype(np.float32)
# 記錄數據維度dimension = datas.shape[1]

2、使用faiss建立索引

import faiss
index = faiss.IndexFlatL2(dimension)index2 = faiss.IndexIDMap(index)
index2.add_with_ids(datas, ids)

3、實現近鄰搜索

# 讀取user embedding數據df_user = pd.read_csv("./datas/user_embedding.csv")df_user.head()
# 挑選一條user的embedding,轉換成1行N列的二維arrayuser_embedding = np.array(json.loads(df_user[df_user["id"] == 10]["features"].iloc[0]))user_embedding = np.expand_dims(user_embedding, axis=0).astype(np.float32)user_embedding
# 實現搜索,這里的I就是近鄰ID列表tok = 30D, I = index.search(user_embedding, topk)     # actual search

4、拼接得到內容列表

# 把搜索出來的ID變成Seriestarget_ids = pd.Series(I[0], name="MovieID")
# 讀取電影數據df_movie = pd.read_csv("./datas/ml-1m/movies.dat",                     sep="::", header=None, engine="python",                     names = "MovieID::Title::Genres".split("::"))# 實現內容JOINdf_result = pd.merge(target_ids, df_movie)

看完上述內容,你們掌握Python中怎么利用Faiss庫實現向量近鄰搜索的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阿克陶县| 乌鲁木齐县| 上高县| 高邑县| 大安市| 韩城市| 南召县| 乌鲁木齐县| 巧家县| 南通市| 新竹县| 鄢陵县| 东乡族自治县| 黔西县| 陈巴尔虎旗| 油尖旺区| 新昌县| 定结县| 西城区| 中牟县| 仙桃市| 蓝山县| 灵川县| 绥江县| 南岸区| 社旗县| 南召县| 龙海市| 吴桥县| 大埔区| 安丘市| 新泰市| 云林县| 南宁市| 军事| 普定县| 平阳县| 沙雅县| 东兴市| 和硕县| 嘉善县|