您好,登錄后才能下訂單哦!
本篇內容介紹了“Python工程師常見面試題有哪些”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
1.Tcp 協議和 udp 協議有什么區別?
(1)TCP 面向連接(如打電話要先撥號建立連接);UDP 是無連接的,即發送數據之前不需要建立連接。
(2)每一條 TCP 連接只能是點到點的;UDP 支持一對一,一對多,多對一和多對多的交互通信。
(3)TCP 首部開銷 20 字節;UDP 的首部開銷小,只有 8 個字節。
(4)TCP 的邏輯通信信道是全雙工的可靠信道,UDP 則是不可靠信道。
2.Post 和 get 區別?
(1)GET 請求的數據會暴露在地址欄中,而 POST 請求則存在表單中提交所以 post 相對安全。
(2)post 傳輸數據比 get 大。
(3)post 比 get 安全。
3.cookie 和 session 的區別?
(1)cookie 數據存放在客戶的瀏覽器上,session 數據放在服務器上。
(2)cookie 不是很安全,別人可以分析存放在本地的 COOKIE 并進行 COOKIE欺騙考慮到安全應當使用 session。
(3)session 會在一定時間內保存在服務器上。當訪問增多,會比較占用服務器的性能考慮到減輕服務器性能方面,應當使用 COOKIE。
(4)單個 cookie 保存的數據不能超過 4K,很多瀏覽器都限制一個站點最多保存 20 個 cookie。
(5)建議:將登陸信息等重要信息存放為 SESSION其他信息如果需要保留,可以放在 COOKIE 中。
4.什么是僵尸進程和孤兒進程,怎么避免僵尸進程?
(1)孤兒進程:父進程退出,子進程還在運行的這些子進程都是孤兒進程,孤兒進程將被會被其它進程收養,不會造成影響。
(2)僵尸進程:子進程退出,而父進程遲遲不回收,造成資源浪費。
(3)避免僵尸進程的方法:1.fork 兩次用孫子進程去完成子進程的任務。2.用 wait()函數使父進程阻塞。
5.scrapy 和 scrapy-redis 有什么區別?
答:scrapy 是一個 Python 爬蟲框架,爬取效率極高,具有高度定制性,但是不支持分布式。而 scrapy-redis 一套基于 redis 數據庫、運行在 scrapy 框架之上的組件,可以讓scrapy 支持分布式策略,Slaver 端共享 Master 端 redis 數據庫里的 item 隊列、請求隊列和請求指紋集合。
6.描述下 scrapy 框架運行的機制?
答:從 start_urls 里獲取第一批 url 并發送請求,請求由引擎交給調度器入請求隊列,獲取完畢后,調度器將請求隊列里的請求交給下載器去獲取請求對應的響應資源,并將響應交給自己編寫的解析方法做提取處理:1. 如果提取出需要的數據,則交給管道文件處理;2. 如果提取出url,則繼續執行之前的步驟(發送url請求,并由引擎將請求交給調度器入隊列...),直到請求隊列里沒有請求,程序結束。
7.Post 和 get 區別和應用場合?
區別:
Get:從指定的服務器中獲取數據。GET 請求能夠被緩存;GET 請求會保存在瀏覽器的瀏覽記錄中;以 GET 請求的URL能夠保存為瀏覽器書簽;GET 請求有長度限制;GET 請求主要用以獲取數據。
Post:POST 請求不能被緩存下來;POST 請求不會保存在瀏覽器瀏覽記錄中; POST 請求的 URL 無法保存為瀏覽器書簽;POST 請求沒有長度限制;POST 請求會把請求的數據放置在HTTP 請求包的包體中,POST 的安全性比 GET的高。可能修改變服務器上的資源的請求。
應用場合:
post:請求的結果有持續性的副作用(數據庫內添加新的數據行)若使用 GET 方法,則表單上收集的數據可能讓 URL 過長。要傳送的數據不是采用 7 位的 ASCII 編碼。
get:請求是為了查找資源,HTML表單數據僅用來幫助搜索。請求結果無持續性的副作用。收集的數據及 HTML 表單內的輸入字段名稱的總長不超過 1024 個字符。
8.說一下 mysql 數據庫存儲的原理?
儲存過程是一個可編程的函數,它在數據庫中創建并保存。它可以有 SQL 語句和一些特殊的控制結構組成。當希望在不同的應用程序或平臺上執行相同的函數,或者封裝特定功能時,存儲過程是非常有用的。數據庫中的存儲過程可以看做是對編程中 面向對象方法的模擬。它允許控制數據的訪問方式。存儲過程通常有以下優點:
a、存儲過程能實現較快的執行速度。
b、存儲過程允許標準組件是編程。
c、存儲過程可以用流程控制語句編寫,有很強的靈活性,可以完成復雜的判斷和較復雜的運算。
d、存儲過程可被作為一種安全機制來充分利用。
e、存儲過程能夠減少網絡流量。
9.數據庫索引
數據庫索引,是數據庫管理系統中一個排序的數據結構,以協助快速查詢、更新數據庫表中數據。索引的實現通常使用 B_TREE。B_TREE 索引加速了數據訪問,因為存儲引擎不會再去掃描整張表得到需要的數據;相反,它從根節點開始,根節點保存了子節點的指針,存儲引擎會根據指針快速尋找數據。
10. 數據庫優化方案
優化索引、SQL 語句、分析慢查詢
設計表的時候嚴格根據數據庫的設計范式來設計數據庫
使用緩存,把經常訪問到的數據而且不需要經常變化的數據放在緩存中,能節約磁盤 IO
優化硬件;采用 SSD,使用磁盤隊列技術(RAID0,RAID1,RDID5)等;
采用MySQL內部自帶的表分區技術,把數據分層不同的文件,能夠提高磁盤的讀取效率
垂直分表;把一些不經常讀的數據放在一張表里,節約磁盤 I/O
主從分離讀寫;采用主從復制把數據庫的讀操作和寫入操作分離開來
分庫分表分機器(數據量特別大),主要的的原理就是數據路由
選擇合適的表引擎,參數上的優化
進行架構級別的緩存,靜態化和分布式
不采用全文索引
采用更快的存儲方式,例如 NoSql 存儲經常訪問的數據。
11.數據庫怎么優化查詢效率?
1、儲存引擎選擇:如果數據表需要事務處理,應該考慮使用 InnoDB,因為它完全符合 ACID 特性。如果不需要事務處理,使用默認存儲引擎 MyISAM 是比較明智的
2、分表分庫,主從。
3、對查詢進行優化,要盡量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引
4、應盡量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描
5、應盡量避免在 where 子句中使用 != 或 <> 操作符,否則將引擎放棄使用索引而進行全表掃描
6、應盡量避免在 where 子句中使用 or 來連接條件,如果一個字段有索引,一個字段沒有索引,將導致引擎放棄使用索引而進行全表掃描
7、Update 語句,如果只更改 1、2 個字段,不要 Update 全部字段,否則頻繁調用會引起明顯的性能消耗,同時帶來大量日志
8、對于多張 大數據量(這里幾百條就算大了)的表 JOIN,要先分頁再 JOIN,否則邏輯讀會很高,性能很差。
“Python工程師常見面試題有哪些”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。