1. 程式人生 > >【基於WPF+OneNote+Oracle的中文圖片識別系統階段總結】之篇三:批量處理後的txt檔案入庫處理

【基於WPF+OneNote+Oracle的中文圖片識別系統階段總結】之篇三:批量處理後的txt檔案入庫處理

【小記】:大膽嘗試才能突破,某個中醫藥大學有一批圖片需要處理(ORC),然後進行資料探勘。之前沒有接觸過ORC這個東西,但是還是應允了。在網上搜索一番,關於中文圖片識別,最終敲定為基於微軟的OneNote,其識別率相對較高。網上這個技術點的資料真心不多,後來於部落格園找到一篇博文,但是那個程式還是bug百出,而且只是單處理。後來經過一番摸索逐個突破,批處理完成。然後進行介面設計,這些零碎工作完成後,便是入庫處理。由於OneNote生成的xml檔案封裝好的,即不可視的。便將其程式碼處理生成txt檔案,再進行Oracle入庫處理。入庫前需要檔案內容稽核,並且在WPF開發中資料繫結和分頁中做了獨特處理。現在經過半個月的工作,本專案做個階段總結。一則知識總結便於二次開發,儘量保持程式流暢性,核心知識做以梳理;另外,相關

WPFOneNote常用技術共享,便於部分園友所需。本人技術有限,歡迎交流。專案還未結束,暫作階段文章釋出,隨後相繼釋出。

篇三:批量處理後的txt檔案入庫處理

【開篇概述】:本文繼上述文章再做深度剖析,本篇主要介紹txt入庫(oracle)和wpf分頁,在此篇涉及的頁面設計前篇已經細述不再概說。裡面涉及到oracle 64位系統安裝處理問題,以前oracle的表,序列,觸發器,自增種子等基本操作。外加檔案操作和利用使用者控制元件分頁等技術。大致效果圖如下,其次貼上完整程式碼,其後就一一概說本文核心要點和難點突破,最後梳理技術知識點,使其一則保持完整性,二則梳理整理知識點便於隨時取用。(本篇暫做效果圖如下,至於最終效果圖和稽核介面,待終篇。)

效果圖:

 

完整程式碼:

namespace OnenoteOCRDemo
{
    /// <summary>
    /// TextData.xaml 的互動邏輯
    /// </summary>
    public partial class TextData : Window
    {
        public TextData()
        {
            InitializeComponent();
            this.Loaded += new RoutedEventHandler(MainWindow_Loaded);
        }
        void MainWindow_Loaded(object sender, RoutedEventArgs e)
        {
            this.Loaded += delegate
            {
                InitData();
            };
            dataGrid1.LoadingRow += new EventHandler<DataGridRowEventArgs>(dataGrid1_LoadingRow);
        }
        void dataGrid1_LoadingRow(object sender, DataGridRowEventArgs e)
        {
            e.Row.Header = e.Row.GetIndex() + 1;    //設定行表頭的內容值   
        }
        //查詢
        private void InitData()
        {
            string sql = "select * from T_TCM_THESIS  order by ID desc";
            DataSet ds = MYHelper.SQLHelper.GetOrlData(sql);
            if (ds.Tables[0].Rows.Count > 0)
            {
                page1.ShowPages(this.dataGrid1, ds, 10);
            }
            else
            {
                System.Windows.Forms.MessageBox.Show("Erroy");
            }
        }
      
        private void Window_Loaded(object sender, RoutedEventArgs e)
        {
            InitData();
        }
       //批量刪除
        List<int> selectFID = new List<int>();  

        private void CheckBox_Click(object sender, RoutedEventArgs e)
        {
            System.Windows.Controls.CheckBox dg = sender as System.Windows.Controls.CheckBox;
            int FID = int.Parse(dg.Tag.ToString());   //獲取該行的FID   
            var bl = dg.IsChecked;
            if (bl == true)
            {
                selectFID.Add(FID);         //如果選中就儲存FID   
            }
            else
            {
                selectFID.Remove(FID);  //如果選中取消就刪除裡面的FID   
            }  
           
        }

        private void btnDelete_Click(object sender, RoutedEventArgs e)
        {
            foreach (int FID in selectFID)
            {
                string sql = "delete  T_TCM_THESIS where id=" + FID;
                int i = SQLHelper.OrlExecuteQuery(sql);
                if (i > 0)
                {
                    System.Windows.Forms.MessageBox.Show("success!!!");
                }
                else
                {
                    System.Windows.Forms.MessageBox.Show("Erroy!!!");
                }
                InitData();
            }  
        }
        public void TextIsNull()
        {
            txtdocname.Text = "";
            txtyears.Text = "";
            txtdoctype.Text = "";
            txtsummary.Text = "";
            txtauthor.Text = "";
            txtsource.Text = "";
            txtsourcetype.Text = "";
            txtmemo.Text = "";
            txttitle.Text = "";
            txtenglishtitle.Text = "";
            txtcompany.Text = "";
            txtkeyword.Text = "";
            txtcontent.Text = "";
            txtdigest.Text = "";
            txtpath.Text = "";
            txtdisease.Text = "";
        }
        private void btnAdd_Click(object sender, RoutedEventArgs e)
        {
            string docname = txtdocname.Text.ToString();
            string years = txtyears.Text.ToString();
            string doctype = txtdoctype.Text.ToString();
            string summary = txtsummary.Text.ToString();
            string author = txtauthor.Text.ToString();
            string source = txtsource.Text.ToString();
            string sourcetype = txtsourcetype.Text.ToString();
            string memo = txtmemo.Text.ToString();
            string title = txttitle.Text.ToString();
            string englishtitle = txtenglishtitle.Text.ToString();
            string authorcompany = txtcompany.Text.ToString();
            string keyword = txtkeyword.Text.ToString();
            string content = txtcontent.Text.ToString().Trim();
            string digest = txtdigest.Text.ToString();
            string path = txtpath.Text.ToString();
            string disease = txtdisease.Text.ToString();
            int auditflag = 1;
            try
            {
                string sql = "INSERT INTO T_TCM_THESIS(docname,years,doctype,summary,author,source,sourcetype,memo,title,englishtitle,";
                sql += "authorcompany,keyword,content,digest,path,disease,auditflag) Values('" + docname + "','" + years + "','" + doctype + "','" + summary + "',";
                sql += "'" + author + "','" + source + "','" + sourcetype + "','" + memo + "','" + title + "','" + englishtitle + "','" + authorcompany + "','" + keyword + "',";
                sql += "

相關推薦

基於WPF+OneNote+Oracle中文圖片識別系統階段總結批量處理txt檔案入庫處理

【小記】:大膽嘗試才能突破,某個中醫藥大學有一批圖片需要處理(ORC),然後進行資料探勘。之前沒有接觸過ORC這個東西,但是還是應允了。在網上搜索一番,關於中文圖片識別,最終敲定為基於微軟的OneNote,其識別率相對較高。網上這個技術點的資料真心不多,後來於部落格園找到一篇博文,但是那個

基於WPF+OneNote+Oracle中文圖片識別系統階段總結WPF常用知識以及本專案設計總結

【小記】:大膽嘗試才能突破,某個中醫藥大學有一批圖片需要處理(ORC),然後進行資料探勘。之前沒有接觸過ORC這個東西,但是還是應允了。在網上搜索一番,關於中文圖片識別,最終敲定為基於微軟的OneNote,其識別率相對較高。網上這個技術點的資料真心不多,後來於部落格園找到一篇博文,但是那個

基於WPF+OneNote+Oracle中文圖片識別系統階段總結關於OneNote入庫處理以及稽核

namespace OnenoteOCRDemo { /// <summary> /// falg.xaml 的互動邏輯 /// </summary> public partial class falg : Window {

基於WPF+OneNote+Oracle中文圖片識別系統階段總結基於OneNote難點突破和批量識別

【小記】:大膽嘗試才能突破,某個中醫藥大學有一批圖片需要處理(ORC),然後進行資料探勘。之前沒有接觸過ORC這個東西,但是還是應允了。在網上搜索一番,關於中文圖片識別,最終敲定為基於微軟的OneNote,其識別率相對較高。網上這個技術點的資料真心不多,後來於部落格園找到一篇博文,但是那個

基於WinForm+Access區域網共享資料庫的專案總結Access遠端連線資料庫和窗體打包部署

【小記】:最近基於WinForm+Access資料庫完成一個法律諮詢管理系統。本系統要求類似網頁後臺管理效果,並且基於區域網內,完成多客戶端操作同一資料庫,根據許可權不同分別執行不同功能模組。核心模組為級聯統計型別管理、資料庫諮詢資料扇形統計、樹的操作、諮詢資料的管理、手寫分頁、Excel資料

基於WinForm+Access區域網共享資料庫的專案總結WinForm開發總體概述與技術實現

【小記】:最近基於WinForm+Access資料庫完成一個法律諮詢管理系統。本系統要求類似網頁後臺管理效果,並且基於區域網內,完成多客戶端操作同一資料庫,根據許可權不同分別執行不同功能模組。核心模組為級聯統計型別管理、資料庫諮詢資料扇形統計、樹的操作、諮詢資料的管理、手寫分頁、Excel資料

基於WinForm+Access區域網共享資料庫的專案總結WinForm開發扇形圖統計和Excel資料匯出

【小記】:最近基於WinForm+Access資料庫完成一個法律諮詢管理系統。本系統要求類似網頁後臺管理效果,並且基於區域網內,完成多客戶端操作同一資料庫,根據許可權不同分別執行不同功能模組。核心模組為級聯統計型別管理、資料庫諮詢資料扇形統計、樹的操作、諮詢資料的管理、手寫分頁、Excel資料

語音識別——基於深度學習的中文語音識別系統實現(程式碼詳解)

文章目錄 利用thchs30為例建立一個語音識別系統 1. 特徵提取 2. 模型搭建 搭建cnn+dnn+ctc的聲學模型 3. 訓練準備 下載資料

基於百度AI的人臉識別Python實現

呼叫百度AI的baidu-aip庫進行人臉識別,baidu-aip庫可以使用pip install baidu-aip進行安裝 關於人臉檢測請求引數可參考傳送門 執行程式碼如下: # coding=UTF-8 # 利用baidu-aip庫進行人臉識別 import cv2

基於seq2seq+attention的中文語音識別

好久沒有寫部落格碼字了本人的中文語音識別跟小米的語音識別作者有過溝通(即參考論文1的作者),期望能夠實現一個完整版的中文語音識別模型,那麼這就開始啦提綱如下:1.資料準備2.seq2seq介紹3.Attention介紹4.bilstm介紹5.bilstm + seq2seq+

基於SVM的貓咪圖片識別

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

基於keras實現的中文實體識別

1、簡介 NER(Named Entity Recognition,命名實體識別)又稱作專名識別,是自然語言處理中常見的一項任務,使用的範圍非常廣。命名實體通常指的是文字中具有特別意義或者指代性非常強的實體,通常包括人名、地名、機構名、時間、專有名詞等。NER系統就是從非結構化的文字中抽取出上述實體,並且可以

基於微信小程式的社群電商平臺需求分析心得——小豆芽

一、專案內容   基於微信小程式,做一個社群電商平臺,抓住社群電商的特點,做出特色,與微信整合,實現商品的個性化釋出,以及個性化營銷。   個性化釋出:使用者可以在應用上直接釋出自己的商品,通過搜尋心願單可以檢視當前買家使用者以及他們對商品的預期價格,在此便可建議賣家合理定價,尋求市場;作為買家,可以在當

基於微信小程式的社群電商平臺Alpha迭代心得

專案團隊:小豆芽 開發週期:11.5-12.2(Alpha版本) 設想和目標 1. 我們的軟體要解決什麼問題?是否定義得很清楚?是否對典型使用者和典型場景有清晰的描述? 解決問題:當前電商平臺賣家買家角色固化,買家在沒有尋求到心儀商品時無法記錄並告知他人,賣家出售商品無法確認是否有市場有需求;

[原始碼和文件分享]VC++實現的基於人眼狀態的疲勞駕駛識別系統

一、文件說明 文件主要對專案的程式進行說明和描述程式的思想。 程式的功能 程式的思想 程式的原始碼 注意之處(程式中比較難理解,比較特殊的地方) 待改進之處(能使得效果更好的地方) 二、程式內容 1. main()函式

基於SSH框架的個人部落格系統04DAO層,Service層與Action層

DAO層-資料的增刪改查 J2EE開發人員使用資料訪問物件(DAO)設計模式把底層的資料訪問邏輯和高層的商務邏輯分開.實現DAO模式能夠更加專注於編寫資料訪問程式碼。DAO層的每個類都依賴於SessionFactory,SessionFactory介面負責初始化Hibern

基於谷歌開源的TensorFlow Object Detection API視訊物體識別系統搭建自己的應用(

下載opencv的cv2包在Python官網即可下載opencv相關庫,點選此處直接進入。 pip install opencv-python安裝完成後,進入IDLE輸入命令import cv2若未報錯,則opencv-python庫成功匯入,環境搭配成功。基於上篇新建Cam

基於PCA和SVM的人臉識別系統

由《數字影象處理與機器視覺》總結。 1.人臉識別簡介 2.前期處理 3.資料規格化 3.1 資料規格化的必要性 3.2 資料規格化方法 3.3 實現人臉特徵資料的規格化 4.核函式的選擇 5.引數選擇 5.1 資料集格式化 5.2 搜尋引數 6.構建多類SVM分類器 6.1

基於PCA和SVM的人臉識別系統-error修改

------------------------------------------------- Undefined function or variable 'W'. Error in classify (line 18) xNewFace = xNewFace*W;

EasyPR--一個開源的中文車牌識別系統

我正在做一個開源的中文車牌識別系統,Git地址為:https://github.com/liuruoze/EasyPR。   我給它取的名字為EasyPR,也就是Easy to do Plate Recognition的意思。我開發這套系統的主要原因是因為我希望能夠鍛鍊我在這方面的能力,包括C++技術、計算