日誌分析代碼實現(字符串切割)

阿新 • • 發佈：2017-11-09

日誌

日誌分析代碼實現(字符串切割)

思路

    不使用正則表達式處理:
        進行字符串切割
        將[]和"括起的內容特殊處理
        將每段數據轉換為對應格式
        代碼精簡,代碼效率檢查

import datetime # 目標日誌 logline = ‘‘‘183.60.212.153 - - [19/Feb/2013:10:23:29 +0800] \ "GET /o2o/media.html?menu=3 HTTP/1.1" 200 16691 "-" \ "Mozilla/5.0 (compatible; EasouSpider; +http://www.easou.com/search/spider.html)"‘‘‘


clean_log = logline.split() 
# list
#[‘183.60.212.153‘, ‘-‘, ‘-‘, ‘[19/Feb/2013:10:23:29‘, ‘+0800]‘,\
# ‘"GET‘, ‘/o2o/media.html?menu=3‘, ‘HTTP/1.1"‘, ‘200‘, ‘16691‘, \
# ‘"-"‘, ‘"Mozilla/5.0‘, ‘(compatible;‘, ‘EasouSpider;‘, ‘+http://www.easou.com/search/spider.html)"‘]


# 轉換時間格式
def convert_time(time:str):
    return datetime.datetime.strptime(time, ‘%d/%b/%Y:%H:%M:%S %z‘)
 

# 將request字符串切分為三段
def convert_request(request:str):
    return dict(zip((‘method‘,‘url‘,‘protocol‘),request.split()))

# 給予對應字段名
names = [
    ‘remote‘,‘‘,‘‘,‘time‘,
    ‘request‘,‘status‘,‘size‘,‘‘,
    ‘useragent‘
]

# 處理對應字段名的函數
operations = [
    None,None,None,convert_time,
    convert_request,int,int,None,
 
    None
]

# 切割字符串為合適格式
def log_clean(line:str,ret=None):
    if ret:
        ret = []
    tmp = ‘‘
    flag = False
    for word in line.split():
        if word.startswith(‘[‘) or word.startswith(‘"‘):
            tmp = word.strip(‘["‘)
            if word.endswith(‘"‘) or word.endswith(‘]‘):
                ret.append(tmp)
                flag = False
                continue
            flag = True
            continue

        if flag:
            tmp += ‘ ‘ + word
            if word.endswith(‘"‘) or word.endswith(‘]‘):
                ret.append(tmp.strip(‘"]‘))
                flag = False
            continue
        else:
            ret.append(word)


# 遍歷處理後日誌,根據對應字段,進行對應處理後再保存至新字典中
ret_d = {}
log_clean(logline)
for i, field in enumerate(ret):
    key = names[i]
    if operations[i]:
        ret_d[key] = operations[i](field)
    else:
        ret_d[key] = field
print(ret_d)

本文出自 “12064120” 博客，請務必保留此出處http://12074120.blog.51cto.com/12064120/1980427

日誌分析代碼實現(字符串切割)

日誌日誌分析代碼實現(字符串切割)思路不使用正則表達式處理: 進行字符串切割將[]和"括起的內容特殊處理將每段數據轉換為對應格式代碼精簡,代碼效率檢查import datetime# 目標日誌logline = ‘‘‘183.60.

日誌分析代碼實現(字符串切割)

日誌分析代碼實現(字符串切割)

日誌分析代碼實現(字符串切割)

日誌分析代碼實現(正則表達式)

代碼中字符串的本地化

逗號代碼和字符圖網格

Android學習JNI，使用JNI實現字符串加密

C++實現字符串的切割和替換

C語言實現字符串截取函數left、mid和right

自定義實現字符串string的接口

php實現字符串翻轉，使字符串的單詞正序，單詞的字符倒序

javascript 實現字符串反轉的兩種方法

java 自己實現字符串的匹配

Java實驗項目三——遞歸實現字符串查找和替換操作

實現字符串的編碼轉換，用以解決字符串亂碼問題

js 實現字符串轉日期進行比較大小

VC實現字符串分割的函數strtok

不使用JDK的方法自己實現字符串轉整數

c++實現字符串類的增刪改查

Python:re.sub()實現字符串替換

實現字符串檢索strstr函數、字符串長度strlen函數、字符串拷貝strcpy函數

Java實現字符串中單詞對調

日誌分析代碼實現(字符串切割)

日誌分析代碼實現(字符串切割)

相關推薦