將UCS-2 Little Endian(即 utf-16)編碼的txt檔案批量轉化為utf-8編碼（python）

阿新 • • 發佈：2019-02-11

折騰了好久，終於搞定了。

參考連結：python使用codecs模組進行檔案操作-讀寫中英文字元 - CSDN部落格 http://blog.csdn.net/chenyxh2005/article/details/72465758#t0

程式碼：

import os
import codecs


path = 'D:\\yangnian\\Project\\Test\\motor_control'#txt檔案所在目錄

for root,dirs,files in os.walk(path):
    for name in files:
        
        #本程式碼中，原檔案的編碼必須是UCS-2 Little Endian 要不然讀出來是亂碼
        eachFile=codecs.open(path+'\\'+name,'r','utf-16-le') #可以根據實際檔案的編碼格式將utf-16-le替換掉
        content=eachFile.read()#content str型別
        
        newFile=codecs.open(r'D:\yangnian\Project\Test\new\test.txt','w','utf-8')
        #eachFile=codecs.open(path+'\\'+name,'r','utf-16_le') #可以寫入原檔案
        newFile.write(content)
        
        eachFile.close()
        newFile.close()

拓展閱讀：

Python學習筆記之編碼問題 unicode、encode、decode https://www.douban.com/note/347617467/

將UCS-2 Little Endian(即 utf-16)編碼的txt檔案批量轉化為utf-8編碼（python）

折騰了好久，終於搞定了。參考連結：python使用codecs模組進行檔案操作-讀寫中英文字元 - CSDN部落格 http://blog.csdn.net/chenyxh2005/article/details/72465758#t0程式碼：import os import

將assic編碼的json字串轉化為utf-8編碼的json字串

一、匯入模組 import urllib.request import urllib.parse import json 二、指定url,構造headers，構造請求引數 1.指定url url = 'http://fanyi.baidu.c

用PHP將Unicode 轉化為UTF-8

function unescape($str) { $str = rawurldecode($str); preg_match_all("/(?:%u.{4})|&#x.{4};|&#\d+;|.+/U", $str, $r); $ar = $r[0]; foreach(

將.txt檔案用Mac開啟報文字編碼“Unicode(UTF-8)”不適用的解決辦法

蘋果電腦 Mac OS X 系統上雙擊 txt 檔案（尤其是 PC 傳過來的），會彈出「未能開啟文稿XXX，編碼"Unicode(UTF-8)不適用」的警告。一個純文字檔案，就是打不開

16進制的字符串轉化為utf-8格式的字符串

try except pan urn static sta utf-16 utf-8 字符串 /** * 16進制的字符串轉化為utf-8格式的字符串 * @param s * @return */ public s

UTF-16 -- 頂級程式設計師也會忽略的系統編碼問題，JDK 錯了十年！

　　Unicode（統一碼、萬國碼、單一碼）是電腦科學領域裡的一項業界標準，包括字符集、編碼方案等。Unicode 是為了解決傳統的字元編碼方案的侷限而產生的，它為每種語言中的每個字元設定了統一併且唯一的二進位制編碼，以滿足跨語言、跨平臺進行文字轉換、處理的要求。　　Unico

debug日誌2（python）

工作目錄 lap findall arc ESS 動態正則表達 AR replace 1. 寫正則表達式時，為什麽要加上re.S Make the ‘.‘ special character match any character at all, includi

python3-開發面試題（python）6.23基礎篇（2）

漢字 2個特殊問題 ase 第一個 else () 判斷 1、請至少列舉5個 PEP8 規範（越多越好）。一、代碼編排 1、縮進。4個空格的縮進，不使用Tap,更不能混合使用Tap和空格 2、每行最大長度79，換行可以使用反斜杠，最好使用圓括號。換行點要在操作符

將列表資料寫入檔案（python）檔案：txt，csv，excel

本篇為轉載，作為記錄學習用的，原作者如下：作者：記不清下一秒來源：CSDN 原文：https://blog.csdn.net/u010513327/article/details/80889846 以下是原文內容：

IIS7設定將域名不帶www跳轉到帶www上（301）

很多朋友在IIS環境中搭建好網站後，習慣性將帶www和不帶www的域名都繫結到一個網站上，這樣做雖然兩個域名都能訪問，但容易造成權重分散，從而導致網站權重降低。其實我們可以將訪問不帶www的域名自動跳轉到帶www的域名，例如訪問aaa.com時瀏覽器自動跳轉到www.aaa.com，瀏覽器地址顯示

【LeetCode】393. UTF-8 Validation 解題報告（Python）

題目描述： A character in UTF8 can be from 1 to 4 bytes long, subjected to the following rules: For 1-byte character, the first bit i

演算法7-16：弗洛伊德最短路徑演算法（模板）

題目描述在帶權有向圖G中，求G中的任意一對頂點間的最短路徑問題，也是十分常見的一種問題。解決這個問題的一個方法是執行n次迪傑斯特拉演算法，這樣就可以求出每一對頂點間的最短路徑，執行的時間複雜度為O(n3)。而另一種演算法是由弗洛伊德提出的，時間複雜度同樣是O(n3)，但

BASIC-12 基礎練習十六進位制轉八進位制（c++）兩種解法，轉換2進位制或10進位制。

基礎練習十六進位制轉八進位制時間限制：1.0s 記憶體限制：512.0MB 錦囊1 使用二進位制。錦囊2 先把十六進位制轉成二進位制，每位十六進位制正好

CCF--201409-2畫圖（Python）詳細註釋

CCF–201409-2畫圖（Python）詳細註釋試題編號： 201409-2 試題名稱：畫圖時間限制： 1.0s 記憶體限制： 256.0MB 問題描述：在一個定義了直角座標系的紙上，畫一個(x1,y1)到(x2,y2)的矩形指將橫座標範圍從x1到

Faster-R-CNN（Python）.2：COCO資料集annotation內容

[{"supercategory": "person", "id": 1, "name": "person"}, {"supercategory": "vehicle", "id": 2, "name": "bicycle"}, {"superca

如何將excel表格轉化為word文件（去掉表格）

第一次寫這種技術的部落格，有點辛苦，中間有一次，CSDN抽風，導致我不得不重新寫。這是我自己摸索的，之前參考其他的教程，但是還是有點不同，他們用的是老舊的excel 2010和word 2010。工

將UTC、EST時區的時間轉化成北京時間（python）

1、將得到的UTC時間轉化成北京時間：（假設獲得的時間格式為：2018-08-02T14:17:39+00:00） def utc_to_local(utc_time_str, utc_format='%Y-%m-%dT%H:%M:%S+00:00'): loc

（python）編寫程式，生成包涵20個隨機數的列表，然後將前10升序排列，後10降序排列

如果本題目幫助到了你，請點選關注我一下，嘿嘿！！方法一 import random def RandomNumbers(number,start,end): data=[]

將數字轉大寫打印出來（C++）

#include <bits/stdc++.h> using namespace std; void g_print(int number) { switch(number) { case 1: cout &

java中將16進位制字串轉化為10進位制數字。

網友的問題： http://topic.csdn.net/u/20081225/10/949ae344-34d5-4b5d-93ca-f57e0dda5057.html比如我有一個string str = "0xA0"; 這樣一個串，有沒有什麼辦法可以轉成char s =

將UCS-2 Little Endian(即 utf-16)編碼的txt檔案批量轉化為utf-8編碼（python）

相關推薦