您好,登錄后才能下訂單哦!
這篇文章主要介紹了PDF文件怎么轉成markdown格式,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
百度上根據pdf轉makrdown為關鍵字進行搜索,結果大多數是反過來的轉換,即markdown文本轉PDF格式。
但是PDF轉markdown的解決方案很少。
正好我工作上有這個需求,所以自己實現了一個解決方案。
下圖是一個用PDF XChange Editor打開的PDF文件,我想將其內容通過markdown格式導出。
(1) 首先將該PDF導出成word格式,后綴.docx
(2) 使用typora獲得該word文檔的markdown源代碼:
此時任務只完成了一半,因為typora這個工具轉換成的markdown格式,如果原始的word文檔里包含圖片,這些圖片以本地圖片的形式存在于markdown里,那我如果直接將包含了這些本地圖片的標簽的markdown發布到簡書,CSDN,開源中國,騰訊云,阿里云這些支持markdown的社區時,這些本地圖片將無法顯示。
因此我們必須找到一個高效的方法,將word里包含的本地圖片先上傳到網絡上,再用生成的包含了圖片網絡url的markdown標簽替換本地圖片標簽。
(3) 把word文件的后綴從.docx改成.zip, 解壓后,在文件夾word的子文件夾media里能找到所有的本地文件。
把這些本地文件全部上傳到網站,生成下面這些url:
我寫了一個工具,可以把僅包含了本地圖片標簽的markdown源代碼和包含了上述在線圖片url標簽的源代碼做一個合并,后并后,本地圖片標簽會被在線圖片標簽取代:
這個工具可以從我github上獲得:
https://github.com/i042416/KnowlegeRepository/blob/master/practice/255_markdown_tool.html
下圖就是我的原始PDF轉換成markdown格式后發布在某社區上的效果,和原始PDF外觀完全一致:
感謝你能夠認真閱讀完這篇文章,希望小編分享的“PDF文件怎么轉成markdown格式”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。