您好,登錄后才能下訂單哦!
這篇文章主要介紹“python中怎么使用JsonSchema庫驗證JSON數據結構”的相關知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“python中怎么使用JsonSchema庫驗證JSON數據結構”文章能幫助大家解決問題。
有一個簡單的json數據, 根據json數據格式編寫jsonschema, 然后校驗json數據每個字段是否是規定類型。
import jsonschema json_data = [ { 'pm10': 24, 'city': '珠海', 'time': '2016-10-23 13:00:00' }, { 'pm10': 24, 'city': '深圳', 'time': '2016-10-21 13:00:00' }, { 'pm10': '21', 'city': '廣州', 'time': '2016-10-23 13:00:00' } ] json_schema = { 'type': 'array', 'items': { 'type': 'object', 'properties': { 'pm10': { 'type': 'number', }, 'city': { 'type': 'string', 'enum': ['珠海', '深圳'] }, 'time': { 'type': 'string' } } } } try: jsonschema.validate(json_data, json_schema) except jsonschema.ValidationError as ex: msg = ex print(ex)
type關鍵字是json模式的基礎, 指定架構的數據類型。JSON Schema的核心定義了以下基本類型:
string
Numeric types
object
array
boolean
null
這些類型在Python中對應的類型如下, 下表將JavaScript類型的名稱映射到Python的相關類型:
JavaScript | Python |
string | string |
number | int/float |
object | dict |
array | list |
boolean | bool |
null | none |
type關鍵字可以是一個字符串或數組:
如果它是一個字符串, 那么它是上面一個基本能類型的名稱
如果它是一個數組, 它必須是一個字符串數組, 其中每個字符串是其中一個基本類型的名稱, 每個元素都是唯一的。在這種情況下, 如果json代碼段與任何給定類型匹配,則改代碼段有效。
以下做個type關鍵字的簡單示例:
{“type”: “number”}
定義某個字段類型是number, 如果是 40, 43.0這樣是校驗通過的如果是”43”, 包含數字的字符串這樣是無法校驗通過的.
{“type”: [“number”, ‘string’]}
定義某個字段類型是number或string中一種如果是43, 或者 “我和你” 這樣是校驗通過的如果是[43, “我和你”], 這樣是不通過的, 因為不接受結構化數據類型。
在Python中, 對象對應的類型是dict類型。
使用properties關鍵字定義對象上的屬性(鍵值對)。例如, 我們要為由數字, 街道名稱和街道類型組成的地址定義一個簡單的模式
{ “type” : “object” , “properties” : { “number” : { “type” : “number” }, “street_name” : { “type” : “string” }, “street_type” : { “type” : “string” , “enum” : [ “Street” , “Avenue” , “Boulevard” ] } } }
默認情況下,properties不需要由關鍵字定義的屬性。但是,可以使用required關鍵字提供所需屬性的列表。
required關鍵字接受一個或多個字符串的數組。每個字符串必須是唯一的。
在以下定義用戶記錄的示例模式中,我們要求每個用戶都有一個名稱和電子郵件地址,但我們不介意他們是否提供了他們的地址或電話號碼:
{ “type” : “object” , “properties” : { “name” : { “type” : “string” }, “email” : { “type” : “string” }, “address” : { “type” : “string” }, “telephone” : { “type” : “string” } }, “required” : [ “name” , “email”] }
可以使用minProperties和maxProperties關鍵字限制對象上的屬性數 。這些中的每一個都必須是非負整數。
{ “type” : “object” , “minProperties” : 2 , “maxProperties” : 3 }
數組用于有序元素。
在Python中, array類似于 list或tuple類型,具體取決于用法。
例如: [1,2,3,4,5]
[2, ‘dd’]
數組的元素可能是任何東西, 但是,根據某些模式驗證數組的項通常很有用。這里使用items和additionalItems關鍵字完成。
在JSON中, 通常使用兩種方式的數據
列表驗證: 任意長度的序列, 其中每個元素匹配相同的模式
元組驗證: 一個固定長度的序列,其中每個項目可能具有不同的模式, 在此用法中, 每個項目的索引(位置)對于如何解釋值是有意義的,例如Python的tuple。
列表驗證對于任意長度的數組非常有用, 其中每個項都匹配相同的模式, 對于此類數組, 將items關鍵字設置為單個模式, 用該模式來驗證數組中的所有項。
注意: 這時items是單個模式, additionalItems關鍵字沒有意義, 不應該使用它。
例如下面的事例中我們定義數組中每個項都是一個數字
{ “type” : “array” , "items": { "type": "number" } }
如果是[1,2,3,4,5], pass
如果是[1,2,3,’5’, 6] , false
如果是[], pass
當數組是項目集合時, 就需要元組驗證。其中每個項目都有不同的模式, 并且每個項目的序數索引是有意義的。
例如: 街道地址這樣表示
1600 Pennsylvania Avenue NW就有4中type[number, streent_name, street_type, direction]
每個字段都有不同的架構
number: 地址編號, 必須是數字
street_name: 街道的名稱, 必須是字符串
street_type: 街道的類型, 應該是一組固定值的字符串
direction: 地址的位置, 應該是來自不同值集的字符串
為此我們將items關鍵字設置成一個數組, 其中每個項目都是一個與文檔數組的每個索引相對應的模式, 也就是一個數組, 第一個元素模式驗證輸入數組的第一個元素. 第二個元素模式驗證輸入數組的第二個元素, 等等
示例:
{ “type” : “array” , “items” : [ { “type” : “number” }, { “type” : “string” }, { “type” : “string” , “enum” : [ “Street” “ , ”Avenue“ , ”Boulevard“ ] }, { ”type“ : ”string“ , ”enum“ : [ ”NW“ , ”NE“ , “SW” , “SE” ] } ] }
如果是[1600, “賓夕法尼亞”, ‘Street’, “NW”], pass如果是[10,’等等’, ‘等等’], false并且在默認情況下, 添加其他項目也可以:[ 1600 , “賓夕法尼亞州” , “Street” , “NW” , “華盛頓” ]
additionalItems關鍵字控制是否有效有超出了在架構中定義的數組的其他項目,如果設置為false, 則會不允許數組中的額外項。
可以使用minItems和 maxItems關鍵字指定數組的長度。每個關鍵字的值必須是非負數。無論是進行List驗證還是Tuple驗證,這些關鍵字都有效。示例:
{ “type” : “array” , “minItems” : 2 , “maxItems” : 3 }
使用uniqueItems關鍵字設置為true, 則數組中的每個項都是唯一的。
json模式包含幾個關鍵字,title,description和default, 不嚴格用來校驗格式,但用來描述模式的一部分。在title和description管家你必須是字符串
enum關鍵字用于限制值, 以一個固定的一組值, 它必須是一個必須包含一個元素的數組,其中每個元素都是唯一的。
{ ‘type’ : ‘string’, ‘enum’: [‘red’, ‘green’]}
如果檢驗字段的值在枚舉中是通過的, 如果不是無法校驗通過。
JSON Schema包含一些用于將模式組合在一起的關鍵字,這并不意味著組合來自多個文件或JSON樹的模式, 盡管這些工具有助于實現這一點,并在結構化復雜模式中進行了描述。
例如, 在以下的模式, anyOf關鍵字用于表示給定值可能對任何給定的子模式有效。第一個子模式需要一個最大長度為5的字符串。第二個子模式需要一個最小值為0的數字。只要一個值對這些模式中的任何一個進行驗證,它就被認為整個組合模式有效。
{ ‘anyOf’: [ {‘type’: ‘string’, ‘maxLength’: 5}, {‘type’:’string’, ‘minimum’: 0 }]}
用于組合模式的關鍵字是:
allOf: 必須對所有子模式有效
anyOf: 必須對任何子模式有效(一個或多個)
oneOf: 必須僅對其中一個子模式有效
要進行驗證anyOf,給定數據必須對任何(一個或多個)給定子模式有效。
{ “anyOf” : [ { “type” : “string” }, { “type” : “number” } ] }
如果是 “您好”, pass如果是 33, pass如果是 [‘ddd’, 33], false
要進行驗證oneOf,給定數據必須僅對其中一個給定子模式有效。
{ “oneOf” : [ { “type” : “number” , “multipleOf” : 5 }, { “type” : “number” , “multipleOf” : 3 } ] }
如果是5的倍數, pass如果是3的倍數, pass如果是5和3的倍數, false
要進行驗證allOf,給定數據必須對所有給定的子模式有效。
{ “allOf” : [ { “type” : “string” }, { “maxLength” : 5 } ] }
該$schema關鍵字用于聲明JSON片段實際上是JSON模式的一部分。它還聲明了針對該模式編寫的JSON Schema標準的哪個版本。
建議所有JSON模式都有一個$schema條目,該條目必須位于根目錄下。因此,大多數情況下,您需要在架構的根目錄下:
“$ schema” : “http://json-schema.org/schema#”
該模式和模式屬性關鍵字使用正則表達式來表示約束。使用的正則表達式語法來自JavaScript(具體為ECMA 262)。但是,并未廣泛支持該完整語法,因此建議您堅持使用下述語法的子集。
單個unicode字符(下面的特殊字符除外)與自身匹配。
^:僅匹配字符串的開頭。
$:僅匹配字符串的末尾。
(…):將一系列正則表達式分組到單個正則表達式中。
|:匹配|符號前面或后面的正則表達式。
[abc]:匹配方括號內的任何字符。
[a-z]:匹配字符范圍。
[^abc]:匹配未列出的任何字符。
[^a-z]:匹配范圍之外的任何字符。
+:匹配前一個正則表達式的一個或多個重復。
*:匹配前面正則表達式的零次或多次重復。
?:匹配前一個正則表達式的零次或一次重復。
+?,?,??:的,+和?預選賽都是貪婪的; 它們匹配盡可能多的文本。有時這種行為是不可取的,您希望匹配盡可能少的字符。
{x}:完全x匹配前面正則表達式的出現次數。
{x,y}:匹配前面正則表達式的至少x和最y多次出現。
{x,}:匹配x前面正則表達式的出現次數或更多。
{x}?,{x,y}?,{x,}?:上述表達式的惰性版本。
示例:
{ “type” : “string” , “pattern” : “^(\\([0-9] {3} \\))?[0-9]{3}-[0-9] {4} $ “ }
如果是 “555-1212”, pass如果是“(888)555-1212” , pass如果是“(888)555-1212分機532” , false
有些模式可能是在幾個地方都是通用的, 如果每次都重寫會使模式更加冗長,以后更新也會很復雜, 我們可以用重用的方式來做。例如:定義客戶記錄, 每個客戶都有可能同時擁有送貨地址和賬單地址, 地址總是相同的, 有街道地址, 城市, 州名。
定義地址模式:
{ “type” : “object” , “properties” : { “street_address” : { “type” : “string” }, “city” : { “type” : “string” }, “state” : { “type” : “string” } }, “required” : [ “street_address” , “city” ,“state” ] }
我們重用上面的模式, 將其放在父模式下, 名為definitions:
{ “definitions” : { “address” : { “type” : “object” , “properties” : { “street_address” :{“type” :“string”}, “city” : { “type” : “string” }, “state” : { “type” : “string” } }, “required” :[“street_address” ,“city”,“州”] } } }
然后我們使用$ref關鍵字從其他地方引用此架構片段, 指向此模塊的位置
{ “$ ref” : “#/ definitions / address” }
值 $ref 是一個名為 JSON Pointer的格式的字符串。
‘#’引用當前文檔,‘/’遍歷文檔中對象中的鍵, 因此
“#/ definitions / address” 意味著:
轉到文檔的根目錄
找到秘鑰的值”definitions”
在該對象中, 找到鍵的值”address”
$ref也可以是相對或絕對的URI, 例如:
{ “$ ref” : “definitions.json#/ address” }
關于“python中怎么使用JsonSchema庫驗證JSON數據結構”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識,可以關注億速云行業資訊頻道,小編每天都會為大家更新不同的知識點。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。