[python小工具]小說分割器

阿新 • • 發佈：2019-01-07

寫本文的思路很簡單：

自己是一個小說迷，有時候就想著能不能把一個整本的小說給分割成一個個單章存在的文字檔案

之前也在網上找到過別人寫的軟體，然後最近突然想到，能否用python實現一下

其實有了這個目標，實現起來很簡單：

最核心的就是匹配關鍵字串

整體程式碼如下


# -*- coding: utf-8 -*-
# @Date     : 2018-11-02 17:38:53
# @Author   : Jimy_Fengqi ([email protected])
# @Link     : https://blog.csdn.net/qiqiyingse
# @Version  : V1.0

'''
將txt小說分割轉換成單個章節檔案
檔名字以章節命名
本文執行在python3上面，
處理小說的時候，需要將小說的格式以utf-8儲存
（處理以ANSI編碼格式的txt文字會出現錯誤）
'''

import re
import os
import sys

# txt book's path.
novel_name='' #小說名字
source_path = os.getcwd()+'\\'+novel_name

path_pieces = os.path.split(source_path)
novel_title = re.sub(r'(\..*$)|($)', '', path_pieces[1])
target_path = '%s\\%s' % (path_pieces[0], novel_title)#小說分章目錄
section_re = re.compile(r'^\s*第.+章\s+.*$')


# entry of the script
def main():
    # create the output folder
    if not os.path.exists(target_path):
        os.mkdir(target_path)

    # open the source file
    input = open(source_path, 'r',encoding='utf-8')

    sec_count = 0
    sec_cache = []
    title_cache=[]

    output = open('%s\\前言.txt' % (target_path), 'w',encoding='utf-8')
    preface_title = '%s 前言' % novel_title
    output.writelines(preface_title)

        
    for line in input:
        # is a chapter's title?
        #if line.strip() == '':  #去掉空行
        #    pass
        if re.match(section_re, line):
            line = re.sub(r'\s+', ' ', line)
            print ('converting %s...' % line)
    
            output.writelines(sec_cache)
            output.flush()
            output.close()
            sec_cache = []
            sec_count += 1
            #chapter_name=re.sub('(~|！+|\(+|\)+|~+|\（+|\）+|（+|!+)','_',line)
            chapter_name=re.sub('(~+|\*+|\,+|\?+|\，+|\?+)','_',line)#章節名字當檔名字時，不能有特殊符號


            # create a new section
            output = open('%s\\%s.txt' % (target_path, chapter_name), 'w',encoding='utf-8')
            output.writelines(line)
            title_cache.append(line+'\n')
        else:
            sec_cache.append(line)
            
    output.writelines(sec_cache)
    output.flush()
    output.close()
    sec_cache = []

    # write the menu
    output = open('%s\\目錄.txt' % (target_path), 'w',encoding='utf-8')
    menu_head = '%s 目錄' % novel_title
    output.writelines(menu_head)
    output.writelines(title_cache)
    output.flush()
    output.close()
    inx_cache = []
    
    print ('completed. %d chapter(s) in total.' % sec_count)

if __name__ == '__main__':
    main()

[python小工具]小說分割器

寫本文的思路很簡單：自己是一個小說迷，有時候就想著能不能把一個整本的小說給分割成一個個單章存在的文字檔案之前也在網上找到過別人寫的軟體，然後最近突然想到，能否用python實現一下其實有

【小工具】python 在服務器上臨時啟用一個端口

python socket 啟用端口在服務器還未部署應用，而這時候如果要驗證網絡是否開通，我們可以先在服務器上模擬啟用應用的端口，然後從其他地方telnet這個端口來驗證網絡的開通情況。這邊使用python腳本來臨時啟用一個端口，用於測試使用。腳本如下：import socket while True:

python小工具：用python操作HP的Quality Center

over cti 步驟 response headers 服務器登錄 chm format 背景是這樣的：這個組的測試人員每跑一個case都要上傳測試結果附件到QC。每個待測功能模塊可能包含幾十上百的case。於是手工上傳測試結果變成了繁重的體力勞動。令人驚訝的是我們的工

python小工具 - alert彈框輸出姓名年齡、求和

sum entry 數字之間 col import 技術分享 app button 使用python自帶的tkinter庫進行GUI編程，完成兩個功能：（1）要求用戶輸入姓名和年齡然後打印出來（2）要求用戶輸入一個數字，然後計算1到該數字之間的和代碼部分： # 導

python練習小工具之模擬登錄系統

python登錄系統一、題目模擬寫一個登錄系統，要求：每個用戶都有三次登錄機會，超過三次鎖定！用戶鎖定不影響其他用戶二、代碼：#coding:utf-8 Count = {"san": ["123456", 3], "Ling": ["6666",3]} #值中第一列是密碼,第二列是用戶狀態 while T

【小工具】python 連接redis查詢

python redis 查詢作用說明：通過python連接redis進行查詢，判斷結果並進行後續操作。需先安裝redis-2.10.5.tar.gz。代碼如下：#!/usr/local/bin/python import redis r = redis.StrictRedis(host=‘192.168.1

采集txt文本/word文檔中郵箱地址的python小工具

rac tools http 選擇 txt文本令行 64位臨時文件鏈接最近hr人事小姐姐讓我找一下剛入職時寫的一個抓取txt/word文檔中郵箱的python小工具。因為是新萌時期寫的，很簡陋，但可以用。我把鏈接放這有需要的自取： https://github.c

python的實戰:一個目錄一鍵啟動管理小工具

app Coding put str top ini add nal 讀取簡單的學習了幾天的python,總覺得最好根據自身的需求來做點小工具實戰一下。上班的時候由於有很多目錄需要打開。每次都要一個個的找那些目錄。我覺得，我需要一個小工具。然後登記下，所有需要打開的目錄

python實用小工具介紹

developer 交互式 tp服務器引擎 pam 人類 edi 答案 import語句一、秒級啟動一個HTTP下載服務器在實際工作中，時不時會有這樣的一個需求：將文件傳給其他同事。將文件傳給同事本身並不是一個很繁瑣的工作，現在的聊天工具一般都支持文件傳輸。但是，如果需

python+xlsxwriter+PIL自動壓圖貼圖到Excel小工具

圖像設置圖寫入 {} read shrink conf python ace 一、環境 windows10/mac + python3.6 python第三方庫 xlsxwriter、PIL、argparse 二、需求 1、運行每條測試case成

Python實現翻譯小工具

模塊 chrome utf-8 src response cto enc random app 一、背景利用Requests模塊獲取有道詞典web頁面的post信息，BeautifulSoup來獲取需要的內容，通過tkinter模塊生成gui界面。二、代碼 fany

批量下載網站圖片的Python小工具（下）

深度 amp ted 講解 ati online 工作 rul 進程池引子在批量下載網站圖片的Python實用小工具一文中，講解了開發一個Python小工具來實現網站圖片的並發批量拉取。不過那個工具僅限於特定網站的特定規則，本文將基於其代碼實現，開發一個更加通用的圖

Python集成網絡診斷小工具（含有ping，tracert，tcping等小工具）

Python wxpython 集成開發背景：之前在一家IDC公司實習，負責服務器售後方面的，經常要使用ping,tracert,tcping等命令做些初步的診斷，判斷服務器問題出在哪方面。於是就想集成這些常用的命令或工具到一個GUI界面中，實現一鍵調用。（PS：當然公司有更好的集成工具，我只

python學習筆記--緩解眼睛疲勞的小工具

-a 學習學習python ide AD 窗口按鈕 echo city 　　工作之余想著勞逸結合，然後就點開了‘大家來找茬’的休閑遊戲，結果發現這玩意兒並不怎麽休閑。　　原本雙眼在日常的‘BUG與調試’中就很疲勞了，休閑後結果更加疲勞了。　　本次功能需求為自動判斷兩

小工具：使用Python自動生成MD風格鏈接

join walk prefix 但是 github上 os.path end 搬運怎麽很久之前我在Github上搞了一個LeetCode的倉庫，但一直沒怎麽維護。最近發現自己刷了不少LC的題目了，想搬運到這個倉庫上。玩Github最重要的當然是寫README了，MD

python 爬蟲百度貼吧簽到小工具

sca window user con lee post use wow64 搜索 import requests,re,timeheader ={ "Cookie":"登陸過賬號後的cookie 必須填寫", "User-Agent":"Mozilla/5.

VC小工具.最簡單TCP服務器

error 接收數據 target ise style net socket span ++ 1、C++基於TCP_IP簡單的客戶端、服務器通信程序實例 - happy_xiahuixiax的博客 - CSDN博客.html（https://blog.csdn.net/ha

Python小工具，長圖另存為pdf

在網上了一個長的圖片，結果發現沒有一個合適的工具，將長圖先批量擷取為4:3格式，儲存到指定地點，然後儲存為pdf 程式碼： from reportlab.lib.pagesizes import portrait from reportlab.pdfgen import canvas i

幾個可以提高工作效率的 Python 內建小工具

在這篇文章裡，我們將會介紹4個Python直譯器自身提供的小工具。這些小工具在筆者的日常工作中經常用到，減少了各種時間的浪費，然而，卻很容易被大家忽略。每當有新來的同事看到我這麼使用時，都忍不住感嘆，原來Python還隱藏了這麼好用的功能。下面就來看一下Python自帶的幾個小工具一、1秒鐘啟動一個下載伺服

幾個提高Python工作效率的內建小工具，不用是不是太浪費了？

在這篇文章裡，我們將會介紹4個Python直譯器自身提供的小工具。這些小工具在筆者的日常工作中經常用到，減少了各種時間的浪費，然而，卻很容易被大家忽略。每當有新來的同事看到我這麼使用時，都忍不住感嘆，原來Python還隱藏了這麼好用的功能。下面就來看一下Python自帶的幾個小工具

[python小工具]小說分割器

相關推薦