1. 程式人生 > >Python中yaml資料格式的使用

Python中yaml資料格式的使用

最近在看程式碼時發現有人用Yaml —— Yet Another Markup Language :另一種標記語言。程式設計免不了要寫配置檔案,怎麼寫配置也是一門學問。YAML 是專門用來寫配置檔案的語言,非常簡潔和強大,遠比 JSON 格式方便。
YAML在python語言中有PyYAML安裝包。YAML 語言(發音 /ˈjæməl/ )的設計目標,就是方便人類讀寫。它實質上是一種通用的資料序列化格式。yaml是一種比xml和json更輕的檔案格式,也更簡單更強大,它可以通過縮排來表示結構,聽著就和Python很配對不對?

PyYaml

PyYaml是Python的一個專門針對yaml檔案操作的模組,使用起來非常簡單

  • 安裝 pip install pyyaml。或者到下載相應版本的包,人工安裝。
  • 使用:使用起來非常簡單,就像json、pickle一樣,load、dump就足夠我們使用了。
    • load()
    import yaml
     
    yaml_str = """
    name: 灰藍
    age: 0
    job: Tester
    """
     
    y = yaml.load(yaml_str)
    print y
    
    結果:{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}
    • dump()
    import yaml
     
    python_obj =
    {"name": u"灰藍", "age": 0, "job": "Tester" } y = yaml.dump(python_obj, default_flow_style=False) print y
    輸出結果:
    age: 0
    job: Tester
    name: "\u7070\u84DD"
    
    上面只是簡單的兩個應用,還有 load_all()、dump_all() 等,我們一般用這四個足夠了,另外兩個下面會講到,其他方法可以自己看API。

yaml語法

https://www.ibm.com/developerworks/cn/xml/x-cn-yamlintro/


有了上面的基礎,接下來我們看看yaml的語法,首先我們準備下測試語法的環境:

  • 建立 test.yaml 檔案,我們練習語法就在這裡

  • 建立 testyaml.py 檔案,用來檢視Python執行後的效果,其中內容如下:

# -*- coding: utf-8 -*-
import yaml
 
y = yaml.load(file('test.yaml', 'r'))
print y

1. 基本規則
  • 大小寫敏感
  • 使用縮排表示層級關係
  • 縮排時不允許使用Tab,只允許使用空格
  • 縮排的空格數目不重要,只要相同層級的元素左對齊即可
  • # 表示註釋,從它開始到行尾都被忽略
2. yaml轉字典

yaml中支援對映或字典的表示,如下:
在test.yaml檔案中:

#test.yaml
#下面格式讀到Python裡會是個dict
name: 灰藍
age: 0
job: Tester

#coding:utf-8
 
import yaml
import os
#open('test.yaml','w')  #如果沒有建立test.yaml,先使用open在當前目錄下建立檔案
 
#方法一
output = yaml.load(file("test.yaml"))
print output
 
#方法二
#filename = os.path.join(os.path.dirname(__file__), 'test.yaml').replace("\\", "/")
#output = yaml.load(open(filename))
#print output

輸出:{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}

3. yaml轉列表

yaml中支援列表或陣列的表示,注意裂變中的每一個元素前面用符號 - 如下:
在test.yaml檔案中:

#test.yaml
#下面格式讀到Python裡會是個list
 
- 灰藍
- 0
- Tester

輸出:[u'\u7070\u84dd', 0, 'Tester']

4. 複合結構

字典和列表可以複合起來使用,注意這裡使用 - 如下:

# test.yaml
#下面格式讀到Python裡是個list裡包含dict
- name: 灰藍
  age: 0
  job: Tester
- name: James
  age: 30

輸出:[{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}, {'age': 30, 'name': 'James'}]

5. 基本型別

yaml中有以下基本型別:

  • 字串
  • 整型
  • 浮點型
  • 布林型
  • null
  • 時間
  • 日期

我們寫個例子來看下:

# test.yaml
#這個例子輸出一個字典,其中value包括所有基本型別
str: "Hello World!"
int: 110
float: 3.141
boolean: true  # or false
None: null  # 也可以用 ~ 號來表示 null
time: 2016-09-22t11:43:30.20+08:00  # ISO8601,寫法百度
date: 2016-09-22  # 同樣ISO8601

輸出:

{'date': datetime.date(2016, 9, 22), 'None': None, 'boolean': True, 'str': 'Hello World!', 'time': datetime.datetime(2016, 9, 22, 3, 43, 30, 200000), 'int': 110, 'float': 3.141}

如果字串沒有空格或特殊字元,不需要加引號,但如果其中有空格或特殊字元,則需要加引號了

#test.yaml
str: 灰藍
str1: "Hello World"
str2: "Hello\nWorld"

輸出結果:{'str2': 'Hello\nWorld', 'str1': 'Hello World', 'str': u'\u7070\u84dd'}

這裡要注意單引號和雙引號的區別,單引號中的特殊字元轉到Python會被轉義,也就是到最後是原樣輸出了,雙引號不會被Python轉義,到最後是輸出了特殊字元;可能比較拗口,來個例子理解下:

#test.yaml
str1: 'Hello\nWorld'
str2: "Hello\nWorld"

# -*- coding: utf-8 -*-
import yaml
 
y = yaml.load(file('test.yaml', 'r'))
print y['str1']
print y['str2']

輸出:

Hello\nWorld
Hello
World

可以看到,單引號中的’\n’最後是輸出了,雙引號中的’\n’最後是轉義成了回車

字串處理中寫成多行、’|’、’>’、’+’、’-‘的意義這裡就不講了。

6. 引用

& 和 * 用於引用

#test.yaml
name: &name 灰藍
tester: *name

這個相當於一下指令碼:

#test.yaml
name: 灰藍
tester: 灰藍

輸出:{'name': u'\u7070\u84dd', 'tester': u'\u7070\u84dd'}

7. 強制轉換

yaml是可以進行強制轉換的,用 !! 實現,如下:

#test.yaml
str: !!str 3.14
int: !!int "123"

輸出:{'int': 123, 'str': '3.14'}

明顯能夠看出123被強轉成了int型別,而float型的3.14則被強轉成了str型。另外PyYaml還支援轉換成Python/object型別,這個我們下面再討論。

8. 分段

在同一個yaml檔案中,可以用 — 來分段,這樣可以將多個文件寫在一個檔案中

#test.yaml
---
name: James
age: 20
---
name: Lily
age: 19

這時候我們就得用到我們的 load_all() 方法出場了,load_all() 方法會生成一個迭代器,可以用for輸出出來:

# -*- coding: utf-8 -*-
import yaml
 
ys = yaml.load_all(file('test.yaml', 'r'))
for y in ys:
    print y

輸出:

{'age': 20, 'name': 'James'}
{'age': 19, 'name': 'Lily'}

對應的也有 dump_all() 方法,一個意思,就是將多個段輸出到一個檔案中,如:

# -*- coding: utf-8 -*-
import yaml
 
obj1 = {"name": "James", "age": 20}
obj2 = ["Lily", 19]
 
with open('test.yaml', 'w') as f:
    yaml.dump_all([obj1, obj2], f)

開啟test.yaml看看

{age: 20, name: James}
--- 
[Lily, 19]

dump() 和 dump_all() 方法可以傳入列表,也可以傳入一個可序列化生成器,如 range(10), 如下:

# -*- coding: utf-8 -*-
import yaml
 
y = yaml.dump(range(10))
print y

輸出:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

在 dump 和 dump_all() 的時候還可以配一堆引數,不一一講解了(其實博主也不全瞭解…)

更高階用法

請參考博文:https://blog.csdn.net/rhx_qiuzhi/article/details/80153920