在後臺去除HTML的樣式;例如富文字編輯器的

阿新 • • 發佈：2018-12-05

package com.chendaojun.util;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStreamReader;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;

public class ParseHtml {
    public static void main(String[] args){
        //可以將註釋開啟逐個試驗
        
        ParseHtml ph = new ParseHtml();
        String html="";
        
        //開啟下面兩行可進行連線mysql並解析html
        //html=ph.getHtmlFromMysql();
        //System.out.println(ph.parseHtml(html));
        //System.out.println(ph.parseHtml(html,300));
        
        //開啟下面兩行可進行獲得路徑檔案內容並解析html，路徑根據實際修改
        //html=ph.getHtml("E:\\1478300.html");
        //System.out.println(ph.parseHtml(html));
        //System.out.println(ph.parseHtml(html,300));
        
        //指定長度直接解析
        //html=ph.parseHtml("<p>sdfsdf</p><br><div>sdfsdfsdf</div>",10);
        //System.out.println(html);
        
        //直接解析
        html=ph.parseHtml("<p>sdfsdf</p><br><div>sdfsdfsdf</div>sdflksdflksdjfk<dkf");
        System.out.println(html);
    }
    
    //從mysql中取出線上編輯器存進去的html文章
    public String getHtmlFromMysql(){
        String url="jdbc:mysql://localhost:3306/blog";
        String userName="root";
        String passWord="root";
        String className="com.mysql.jdbc.Driver";
        String sql="select text from blog where id=5";
        String html="";
        Connection conn=null;
        Statement stmt=null;
        ResultSet rs=null;
        try{
            Class.forName(className);
            conn=DriverManager.getConnection(url,userName,passWord);
            stmt=conn.createStatement();
            rs=stmt.executeQuery(sql);
            while(rs.next()){
                //獲得html內容
                html=rs.getString("text");
            }
        }catch(Exception e){
            e.printStackTrace();
        }finally{
            try{
                if(rs!=null){
                    rs.close();
                    rs=null;
                }
                if(stmt!=null){
                    stmt.close();
                    stmt=null;
                }
                if(conn!=null){
                    conn.close();
                    conn=null;
                }
            }catch(Exception e){
                e.printStackTrace();
            }
        }
        return html;
    }
    
    //從指定路徑讀取html檔案
    public String getHtml(String filePath) {
        String html = "";
        FileInputStream fis = null;
        InputStreamReader isr = null;
        BufferedReader br = null;
        try {
            File file = new File(filePath);
            fis = new FileInputStream(file);
            isr = new InputStreamReader(fis);
            br = new BufferedReader(isr);
            String bRead = "";
            while ((bRead = br.readLine()) != null) {
                html += bRead;
            }

        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            try {
                if(br!=null){
                    br.close();
                    br=null;
                }
                if(isr!=null){
                    isr.close();
                    isr=null;
                }
                if(fis!=null){
                    fis.close();
                    fis=null;
                }
                
            } catch (Exception e) {
                e.printStackTrace();
            }

        }
        return html;

    }
    
    //任意html，殘缺不全也可以
    public String parseHtml(String html) {
        /*
         * <.*?>為正則表示式，其中的.表示任意字元，*?表示出現0次或0次以上，此方法可以去掉雙頭標籤(雙頭針對於殘缺的標籤)
         * "<.*?"表示<尖括號後的所有字元，此方法可以去掉殘缺的標籤，及後面的內容
         * " "，若有多種此種字元，可用同一方法去除
         */
        html = html.replaceAll("<.*?>", "  ").replaceAll(" ", " ");
        html = html.replaceAll("<.*?", "");
        return (html + "...");
    }
    
    //可以指定擷取長度
    public String parseHtml(String html,int length) {
        if(html.length()<length){
            return "擷取長度超過檔案內容總長";
        }
        return parseHtml(html.substring(0, length));
    }
}

上面的是從別人那裡轉的地址是:https://www.cnblogs.com/cnsevennight/p/4468055.html

前言：本人在實現業務邏輯的時候，需要在後臺把帶HTML標籤（富文字）資料的文章擷取成文章的摘要，涉及到怎麼處理帶HTML標籤資料，在網上一共找到了兩種解決方法：

1、呼叫HtmlParser外掛

HtmlParser 簡介

htmlparser是一個純的java寫的html解析的庫，主要用於改造或提取html。用來分析抓取到的網頁資訊是個不錯的選擇，遺憾的是參考文件太少。
專案主頁：http://htmlparser.sourceforge.net/

API文件： http://htmlparser.sourceforge.net/javadoc/index.html

參考部落格：http://blog.csdn.net/fancy3013/article/details/50965112

2、引用一個方法直接去掉HTML標籤

這也是我在專案所用的，是別人寫好的一個方法。

public String parseHtml(String html,int length) {            	
        if(html == null || html == "") {
    		return html = "空";
		}else {
			if(html.length()<length){
	            return html;
	        }else {
	            /*
	             * <.*?>為正則表示式，其中的.表示任意字元，*?表示出現0次或0次以上，此方法可以去掉    雙頭標籤(雙頭針對於殘缺的標籤)	
             * "<.*?"表示<尖括號後的所有字元，此方法可以去掉殘缺的標籤，及後面的內容
	             * " "，若有多種此種字元，可用同一方法去除
	             */
	            html = html.replaceAll("<.*?>", " ").replaceAll("", "");
	            html = html.replaceAll("<.*?", "");
	            return (html.substring(0, length) + "...");
        		        }
		}

參考自:https://blog.csdn.net/lq13457309725/article/details/79578326?utm_source=copy

在後臺去除HTML的樣式;例如富文字編輯器的

package com.chendaojun.util; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; im

在Vue專案使用quill-editor帶樣式編輯器（更改插入圖片和視訊）運用vue-quilt-editor編寫富文字編輯器自定義圖片路徑獲取後臺返回路徑

一、首先在main.js 引入 vue-quilt-editorimport VueQuillEditor from 'vue-quill-editor'import 'quill/dist/quill.core.css'import 'quill/dist/quill.s

js過濾（去除）富文字編輯器中的html標籤和換行回車等標記的正則表示式

一段這樣的Html包裹的文字： var description="\n\t<img src=\"http://localhost/Scripts/KindEditor/Editor/plugins/emoticons/images/0.gif\" a

php讀取富文字編輯器編輯後的文章內容，並去除所有html標籤、空格以及空白，擷取字串（包括中文）

/** * 去除Html所有標籤、空格以及空白，並擷取字串（包括中文） * @param string $string 字串 * @param number $sublength 字串長度 * @param string $encoding 編碼方式 * @

純html如何引用百度的富文字編輯器ueditor

最近專案遇到了純html頁面使用富文字編輯器的需要，思來想去還是百度的富文字功能最豐富，但是ueditor只提供了jsp的demo，參照jsp頁面可以直接用java實現jsp頁面的功能，從而解決html頁面引用ueditor問題。第一步：把ueditor 檔案引

Html編輯器，富文字編輯器KindEditor使用

介紹一個html編輯器，富文字編輯器，KindEditor，比較好用。官網詳細教程：http://kindeditor.net/about.php 效果圖：首先，下載kindeditor包。放到專案的JS外掛包中。在html頁面定義一個textarea，

Django 設定admin後臺的某一個model的欄位為富文字編輯器

Django 設定admin後臺的某一個model的欄位的型別為富文字編輯器，該富文字編輯器不但能夠上傳資料，還能夠上傳圖片，並能夠顯示圖片。首先，在models.py中，建立一個models類，欄位的型別先設定成CharField class Article(models.Model

HTML富文字編輯器wangEditor的使用

HTML富文字編輯器wangEditor的使用官網 http://www.wangeditor.com/ 用法官方文件已經講得很清楚了，我這裡只貼出程式碼，方便以後自己貼上複製用用到的CSS wangEditor-fullscreen-plugin.css

使用ckeditor富文字編輯器頁面解析文字樣式方法

從資料庫讀寫的是這樣的hello,world 但是這樣顯示在網頁上不是我們想要的,我們想要的是 hello,world struts2的解決辦法是<s:property

python 全棧開發，Day83(部落格系統子評論,後臺管理,富文字編輯器kindeditor,bs4模組)

一、子評論必須點選回覆，才是子評論！否則是根評論點選回覆之後，定位到輸入框，同時加入@評論者的使用者名稱定位輸入框 focus focus：獲取物件焦點觸發事件先做樣式。點選回覆之後，定位到輸入框，加入被評論的使用者名稱給回覆的a標籤加一個class=reply_btn，關

springmvc後臺如何接收ckeditor富文字編輯器編輯的內容

1把ckeditor的文字區,改成文章類的body,後臺用mvc的屬性自動封裝來接收,接收一個article類就行了 2吧文字區當string來接收資料庫中如何儲存呢? 使用hibernate自動生成表的時候,body型別是vchar,但是不合理,一般就用text,不用blob的原因是中文亂碼還要單獨

百度ueditor富文字編輯器插入html程式碼問題

今天下午想把ueditor儲存的html程式碼從資料庫取出來放回到ueditor中編輯，然後就一直放不進去，通過不斷地測試終於成功，接下來我講一下我的解決方法從後臺取到值後想在js中直接用 UE.getEditor('editor').execComm

summernote富文字編輯器避免html轉義的方法

1、基礎篇使用方法網上很多，可以參考使用手冊2、問題篇Q：提取到編輯器的html，如何存到資料庫？應該使用什麼資料型別？A： VS中是string型別，資料庫存ntext就好了因為提取到的html是帶有標籤的，類似 <a>等等，包

nodejs express製作後臺引入富文字編輯器

需求由於ueditor官方沒有nodejs後臺的版本，所以只有通過別的大神開發的版本使用了。故寫個教程，留作以後備用。下載ueditor 引入ueditor 先在express的public資料夾內建立一個ueditor目錄，用於存放所有的解壓出

iOS通過html模版實現富文字編輯

在iOS開發中，常常會遇到一些富文字編輯，如新聞，公告等，NSMutableAttributedString又有一定的侷限性，所以我想到用html 模版去載入富文字頁面，根據所需要的格式，去構建相應的html介面。一個簡單的html模版如下： <!DOCTYP

微信小程式解析富文字編輯器HTML

1、首先要下載wxParse包下載地址並放到根目錄下 2、在app.wxss 中引入wxParse.wxss檔案， @import "wxParse/wxParse.wxss";

【ASP.NET】9.解決百度富文字編輯器UEditor往後臺傳資料寫入資料庫時，出現錯誤：檢測到有潛在危險的Request

解決方法：把傳資料的方式換一下，在函式上面新增[ValidateInput(false)]，如果是winform頁面，在aspx頁面裡新增ValidateRequest="false"%@ Page V

web移動端富文字編輯器artEditor使用（後臺springboot）

文字編輯器artEditor的gitHub地址：https://github.com/baixuexiyang/artEditor 在web端，整合好了artEditor，但是上傳時，總是上傳不成功：原先後臺程式碼：前端程式碼：總是報錯；後臺顯示上傳檔案為空，原

Django在admin後臺整合TinyMCE富文字編輯器新增上傳圖片功能

部落格網站怎麼能少了圖片，為TinyMCE編輯器新增上傳圖片功能。第一步：定義表存圖片路徑models.pyclassAdminIMG(models.Model): filename = mode

百度編輯器UEEDITOR使用簡單介紹 UEditor表單提交和後臺互動詳解最後更新對應的版本：1.2.5.1 教程描述：富文字編輯器的使用開發中，表單提交有多種場景，編輯器初始化有新增文章和編輯

UEditor表單提交和後臺互動詳解最後更新對應的版本：1.2.5.1 教程描述：富文字編輯器的使用開發中，表單提交有多種場景，編輯器初始化有新增文章和編輯就文章兩種場景，提交表單有普通提交也有ajax提交表單兩種情景，此教程詳細講解這幾種場景下如何保證後臺正確拿到資料。一、編輯器內容初始化（即往編

在後臺去除HTML的樣式;例如富文字編輯器的

1、呼叫HtmlParser外掛

HtmlParser 簡介

2、引用一個方法直接去掉HTML標籤

相關推薦