您好,登錄后才能下訂單哦!
本篇內容主要講解“怎么手寫一個基于Proxy的緩存庫”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“怎么手寫一個基于Proxy的緩存庫”吧!
任何項目都不是一觸而就的,下面是關于 Proxy 緩存庫的編寫思路。希望能對大家有一些幫助。
當然,其實代理器中的 handler 參數也是一個對象,那么既然是對象,當然可以添加數據項,如此,我們便可以基于 Map 緩存編寫 memoize 函數用來提升算法遞歸性能。
type TargetFun<V> = (...args: any[]) => V function memoize<V>(fn: TargetFun<V>) { return new Proxy(fn, { // 此處目前只能略過 或者 添加一個中間層集成 Proxy 和 對象。 // 在對象中添加 cache // @ts-ignore cache: new Map<string, V>(), apply(target, thisArg, argsList) { // 獲取當前的 cache const currentCache = (this as any).cache // 根據數據參數直接生成 Map 的 key let cacheKey = argsList.toString(); // 當前沒有被緩存,執行調用,添加緩存 if (!currentCache.has(cacheKey)) { currentCache.set(cacheKey, target.apply(thisArg, argsList)); } // 返回被緩存的數據 return currentCache.get(cacheKey); } }); }
我們可以嘗試 memoize fibonacci 函數,經過了代理器的函數有非常大的性能提升(肉眼可見):
const fibonacci = (n: number): number => (n <= 1 ? 1 : fibonacci(n - 1) + fibonacci(n - 2)); const memoizedFibonacci = memoize<number>(fibonacci); for (let i = 0; i < 100; i++) fibonacci(30); // ~5000ms for (let i = 0; i < 100; i++) memoizedFibonacci(30); // ~50ms
我們仍舊可以利用之前博客介紹的的函數生成唯一值,只不過我們不再需要函數名了:
const generateKeyError = new Error("Can't generate key from function argument") // 基于函數參數生成唯一值 export default function generateKey(argument: any[]): string { try{ return `${Array.from(argument).join(',')}` }catch(_) { throw generateKeyError } }
雖然庫本身可以基于函數參數提供唯一值,但是針對形形色色的不同業務來說,這肯定是不夠用的,需要提供用戶可以自定義參數序列化。
// 如果配置中有 normalizer 函數,直接使用,否則使用默認函數 const normalizer = options?.normalizer ?? generateKey return new Proxy<any>(fn, { // @ts-ignore cache, apply(target, thisArg, argsList: any[]) { const cache: Map<string, any> = (this as any).cache // 根據格式化函數生成唯一數值 const cacheKey: string = normalizer(argsList); if (!cache.has(cacheKey)) cache.set(cacheKey, target.apply(thisArg, argsList)); return cache.get(cacheKey); } });
在之前的博客中,提到緩存數據的弊端。同一時刻多次調用,會因為請求未返回而進行多次請求。所以我們也需要添加關于 Promise 的緩存。
if (!currentCache.has(cacheKey)){ let result = target.apply(thisArg, argsList) // 如果是 promise 則緩存 promise,簡單判斷! // 如果當前函數有 then 則是 Promise if (result?.then) { result = Promise.resolve(result).catch(error => { // 發生錯誤,刪除當前 promise,否則會引發二次錯誤 // 由于異步,所以當前 delete 調用一定在 set 之后, currentCache.delete(cacheKey) // 把錯誤衍生出去 return Promise.reject(error) }) } currentCache.set(cacheKey, result); } return currentCache.get(cacheKey);
此時,我們不但可以緩存數據,還可以緩存 Promise 數據請求。
我們可以在數據中添加當前緩存時的時間戳,在生成數據時候添加。
// 緩存項 export default class ExpiredCacheItem<V> { data: V; cacheTime: number; constructor(data: V) { this.data = data // 添加系統時間戳 this.cacheTime = (new Date()).getTime() } } // 編輯 Map 緩存中間層,判斷是否過期 isOverTime(name: string) { const data = this.cacheMap.get(name) // 沒有數據(因為當前保存的數據是 ExpiredCacheItem),所以我們統一看成功超時 if (!data) return true // 獲取系統當前時間戳 const currentTime = (new Date()).getTime() // 獲取當前時間與存儲時間的過去的秒數 const overTime = currentTime - data.cacheTime // 如果過去的秒數大于當前的超時時間,也返回 null 讓其去服務端取數據 if (Math.abs(overTime) > this.timeout) {
到達這一步,我們可以做到之前博客所描述的所有功能。不過,如果到這里就結束的話,太不過癮了。我們繼續學習其他庫的功能來優化我的功能庫。
通常來說,這些緩存庫都會有手動管理的功能,所以這里我也提供了手動管理緩存以便業務管理。這里我們使用 Proxy get 方法來攔截屬性讀取。
return new Proxy(fn, { // @ts-ignore cache, get: (target: TargetFun<V>, property: string) => { // 如果配置了手動管理 if (options?.manual) { const manualTarget = getManualActionObjFormCache<V>(cache) // 如果當前調用的函數在當前對象中,直接調用,沒有的話訪問原對象 // 即使當前函數有該屬性或者方法也不考慮,誰讓你配置了手動管理呢。 if (property in manualTarget) { return manualTarget[property] } } // 當前沒有配置手動管理,直接訪問原對象 return target[property] }, } export default function getManualActionObjFormCache<V>( cache: MemoizeCache<V> ): CacheMap<string | object, V> { const manualTarget = Object.create(null)
當前情況并不復雜,我們可以直接調用,復雜的情況下還是建議使用 Reflect 。
我們在使用 cache 時候,我們同時也可以提供 WeakMap ( WeakMap 沒有 clear 和 size 方法),這里我提取了 BaseCache 基類。
export default class BaseCache<V> { readonly weak: boolean; cacheMap: MemoizeCache<V> constructor(weak: boolean = false) { // 是否使用 weakMap this.weak = weak this.cacheMap = this.getMapOrWeakMapByOption() } // 根據配置獲取 Map 或者 WeakMap getMapOrWeakMapByOption<T>(): Map<string, T> | WeakMap<object, T> { return this.weak ? new WeakMap<object, T>() : new Map<string, T>() } }
之后,我添加各種類型的緩存類都以此為基類。
在緩存進行刪除時候需要對值進行清理,需要用戶提供 dispose 函數。該類繼承 BaseCache 同時提供 dispose 調用。
export const defaultDispose: DisposeFun<any> = () => void 0 export default class BaseCacheWithDispose<V, WrapperV> extends BaseCache<WrapperV> { readonly weak: boolean readonly dispose: DisposeFun<V> constructor(weak: boolean = false, dispose: DisposeFun<V> = defaultDispose) { super(weak) this.weak = weak this.dispose = dispose } // 清理單個值(調用 delete 前調用) disposeValue(value: V | undefined): void { if (value) { this.dispose(value) } } // 清理所有值(調用 clear 方法前調用,如果當前 Map 具有迭代器) disposeAllValue<V>(cacheMap: MemoizeCache<V>): void { for (let mapValue of (cacheMap as any)) { this.disposeValue(mapValue?.[1]) } } }
當前的緩存如果是 WeakMap,是沒有 clear 方法和迭代器的。個人想要添加中間層來完成這一切(還在考慮,目前沒有做)。如果 WeakMap 調用 clear 方法時,我是直接提供新的 WeakMap 。
clear() { if (this.weak) { this.cacheMap = this.getMapOrWeakMapByOption() } else { this.disposeAllValue(this.cacheMap) this.cacheMap.clear!() } }
在學習其他庫 memoizee 的過程中,我看到了如下用法:
memoized = memoize(fn, { refCounter: true }); memoized("foo", 3); // refs: 1 memoized("foo", 3); // Cache hit, refs: 2 memoized("foo", 3); // Cache hit, refs: 3 memoized.deleteRef("foo", 3); // refs: 2 memoized.deleteRef("foo", 3); // refs: 1 memoized.deleteRef("foo", 3); // refs: 0,清除 foo 的緩存 memoized("foo", 3); // Re-executed, refs: 1
于是我有樣學樣,也添加了 RefCache。
export default class RefCache<V> extends BaseCacheWithDispose<V, V> implements CacheMap<string | object, V> { // 添加 ref 計數 cacheRef: MemoizeCache<number> constructor(weak: boolean = false, dispose: DisposeFun<V> = () => void 0) { super(weak, dispose) // 根據配置生成 WeakMap 或者 Map this.cacheRef = this.getMapOrWeakMapByOption<number>() } // get has clear 等相同。不列出 delete(key: string | object): boolean { this.disposeValue(this.get(key)) this.cacheRef.delete(key) this.cacheMap.delete(key) return true; } set(key: string | object, value: V): this { this.cacheMap.set(key, value) // set 的同時添加 ref this.addRef(key)
同時修改 proxy 主函數:
if (!currentCache.has(cacheKey)) { let result = target.apply(thisArg, argsList) if (result?.then) { result = Promise.resolve(result).catch(error => { currentCache.delete(cacheKey) return Promise.reject(error) }) } currentCache.set(cacheKey, result); // 當前配置了 refCounter } else if (options?.refCounter) { // 如果被再次調用且當前已經緩存過了,直接增加 currentCache.addRef?.(cacheKey) }
LRU 的英文全稱是 Least Recently Used,也即最不經常使用。相比于其他的數據結構進行緩存,LRU 無疑更加有效。
這里考慮在添加 maxAge 的同時也添加 max 值 (這里我利用兩個 Map 來做 LRU,雖然會增加一定的內存消耗,但是性能更好)。
如果當前的此時保存的數據項等于 max ,我們直接把當前 cacheMap 設為 oldCacheMap,并重新 new cacheMap。
set(key: string | object, value: V) { const itemCache = new ExpiredCacheItem<V>(value) // 如果之前有值,直接修改 this.cacheMap.has(key) ? this.cacheMap.set(key, itemCache) : this._set(key, itemCache); return this } private _set(key: string | object, value: ExpiredCacheItem<V>) { this.cacheMap.set(key, value); this.size++; if (this.size >= this.max) { this.size = 0; this.oldCacheMap = this.cacheMap; this.cacheMap = this.getMapOrWeakMapByOption() } }
重點在與獲取數據時候,如果當前的 cacheMap 中有值且沒有過期,直接返回,如果沒有,就去 oldCacheMap 查找,如果有,刪除老數據并放入新數據(使用 _set 方法),如果都沒有,返回 undefined.
get(key: string | object): V | undefined { // 如果 cacheMap 有,返回 value if (this.cacheMap.has(key)) { const item = this.cacheMap.get(key); return this.getItemValue(key, item!); } // 如果 oldCacheMap 里面有 if (this.oldCacheMap.has(key)) { const item = this.oldCacheMap.get(key); // 沒有過期 if (!this.deleteIfExpired(key, item!)) { // 移動到新的數據中并刪除老數據 this.moveToRecent(key, item!); return item!.data as V; } } return undefined } private moveToRecent(key: string | object, item: ExpiredCacheItem<V>) { // 老數據刪除 this.oldCacheMap.delete(key);
事情到了這一步,我們就可以從之前的代碼細節中解放出來了,看看基于這些功能所做出的接口與主函數。
// 面向接口,無論后面還會不會增加其他類型的緩存類 export interface BaseCacheMap<K, V> { delete(key: K): boolean; get(key: K): V | undefined; has(key: K): boolean; set(key: K, value: V): this; clear?(): void; addRef?(key: K): void; deleteRef?(key: K): boolean; } // 緩存配置 export interface MemoizeOptions<V> { /** 序列化參數 */ normalizer?: (args: any[]) => string; /** 是否使用 WeakMap */ weak?: boolean; /** 最大毫秒數,過時刪除 */ maxAge?: number; /** 最大項數,超過刪除 */
最終的 memoize 函數其實和最開始的函數差不多,只做了 3 件事
檢查參數并拋出錯誤
根據參數獲取合適的緩存
返回代理
export default function memoize<V>(fn: TargetFun<V>, options?: MemoizeOptions<V>): ResultFun<V> { // 檢查參數并拋出錯誤 checkOptionsThenThrowError<V>(options) // 修正序列化函數 const normalizer = options?.normalizer ?? generateKey let cache: MemoizeCache<V> = getCacheByOptions<V>(options) // 返回代理 return new Proxy(fn, { // @ts-ignore cache, get: (target: TargetFun<V>, property: string) => { // 添加手動管理 if (options?.manual) { const manualTarget = getManualActionObjFormCache<V>(cache) if (property in manualTarget) { return manualTarget[property] } } return target[property] }, apply(target, thisArg, argsList: any[]): V {
完整代碼在 memoizee-proxy 中。大家自行操作與把玩。
測試
測試覆蓋率不代表一切,但是在實現庫的過程中,JEST 測試庫給我提供了大量的幫助,它幫助我重新思考每一個類以及每一個函數應該具有的功能與參數校驗。之前的代碼我總是在項目的主入口進行校驗,對于每個類或者函數的參數沒有深入思考。事實上,這個健壯性是不夠的。因為你不能決定用戶怎么使用你的庫。
Proxy 深入
事實上,代理的應用場景是不可限量的。這一點,ruby 已經驗證過了(可以去學習《ruby 元編程》)。
開發者使用它可以創建出各種編碼模式,比如(但遠遠不限于)跟蹤屬性訪問、隱藏屬性、阻止修改或刪除屬性、函數參數驗證、構造函數參數驗證、數據綁定,以及可觀察對象。
當然,Proxy 雖然來自于 ES6 ,但該 API 仍需要較高的瀏覽器版本,雖然有 proxy-pollfill ,但畢竟提供功能有限。不過已經 2021,相信深入學習 Proxy 也是時機了。
深入緩存
緩存是有害的!這一點毋庸置疑。但是它實在太快了!所以我們要更加理解業務,哪些數據需要緩存,理解那些數據可以使用緩存。
當前書寫的緩存僅僅只是針對與一個方法,之后寫的項目是否可以更細粒度的結合返回數據?還是更往上思考,寫出一套緩存層?
小步開發
在開發該項目的過程中,我采用小步快跑的方式,不斷返工。最開始的代碼,也僅僅只到了添加過期刪除功能那一步。
但是當我每次完成一個新的功能后,重新開始整理庫的邏輯與流程,爭取每一次的代碼都足夠優雅。同時因為我不具備第一次編寫就能通盤考慮的能力。不過希望在今后的工作中,不斷進步。這樣也能減少代碼的返工。
函數創建
事實上,我在為當前庫添加手動管理時候,考慮過直接復制函數,因為函數本身是一個對象。同時為當前函數添加 set 等方法。但是沒有辦法把作用域鏈拷貝過去。
雖然沒能成功,但是也學到了一些知識,這里也提供兩個創建函數的代碼。
我們在創建函數時候基本上會利用 new Function 創建函數,但是瀏覽器沒有提供可以直接創建異步函數的構造器,我們需要手動獲取。
AsyncFunction = (async x => x).constructor foo = new AsyncFunction('x, y, p', 'return x + y + await p') foo(1,2, Promise.resolve(3)).then(console.log) // 6
對于全局函數,我們也可以直接 fn.toString() 來創建函數,這時候異步函數也可以直接構造的。
function cloneFunction<T>(fn: (...args: any[]) => T): (...args: any[]) => T { return new Function('return '+ fn.toString())(); }
到此,相信大家對“怎么手寫一個基于Proxy的緩存庫”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。