1. 程式人生 > >python自然語言處理——1.2 近觀python:將文本當作詞鏈表

python自然語言處理——1.2 近觀python:將文本當作詞鏈表

bsp family round orm 學習 splay letter mic lock

微信公眾號:數據運營人
本系列為博主的讀書學習筆記,如需轉載請註明出處。

第一章 語言處理與python

1.2 近觀python:將文本當作詞鏈表鏈表索引列表變量字符串

1.2 近觀python:將文本當作詞鏈表

鏈表
# 導包
from nltk.book import *
print(sent1)
print(sent2)
print(sent3)
print(sent1+sent3) # 列表相加
print(sent1.append(‘some‘)) # 向列表中追加元素
print(sent1)

返回結果:

技術分享圖片
索引列表
print(text4[173])             # 返回text4中173位置的元素

print(text4.index(‘awaken‘)) # 返回‘awaken’元素的位置
print(text5[16715:16735]) # 返回text5中16715到16735位置的元素(左閉右開)
print(text6[1600:1625])
# 定義列表
sent = [‘word1‘,‘word2‘,‘word3‘,‘word4‘,‘word5‘]
print(sent[0])
print(sent[4])
sent[0] = ‘first‘ # 將sent[0]為位置的元素修改為‘first’
sent[4] = ‘last‘
print(len(sent))

返回結果:

技術分享圖片
變量
my_sent = [‘Bravely‘,‘blod‘,‘Sir‘,‘Robin‘,‘,‘,‘rode‘,‘from‘,‘forth‘]
noun_phrase = my_sent[1:4]
print(noun_phrase)
words = sorted(noun_phrase) # 對列表進行排序
print(words)
vocab = set(text1) # 將text1轉換為集合,換言之對text1進行去重
vocab_size = len(vacab) # 計算vacab的長度
print(vocab)

返回結果:

技術分享圖片
字符串
name = ‘monty‘          # 定義字符串

print(name[0])
print(name[:4])
print(name*2)
print(name+‘!‘)
print(‘ ‘.join([‘monty‘,‘python‘])) # 字符串拼接
print(‘monty python‘.split()) # 字符串拆分

返回結果:

技術分享圖片

列表與字符串最大的區別:列表是可變的,字符串是不可變的

技術分享圖片

python自然語言處理——1.2 近觀python:將文本當作詞鏈表