1. 程式人生 > >利用正則表達式去除所有html標簽,只保留文字

利用正則表達式去除所有html標簽,只保留文字

TE func 規則 第一個 ace ole 針對 pre 全局

後臺將富文本編輯器中的內容返回到前端時如果帶上了標簽,這時就可以利用這種方法只保留文字。
標簽的格式有以下幾種
1.<div class="test"></div>
2.<img />
3.自定義標簽<My-Tag></My-Tag>

針對以上幾種標簽,確定的正則的規則是 reg=/<\/?.+?\/?>/g
<表示尖括號
第一個\/?表示</div>這種標簽的情況
.+?表示將中間所有內容替代掉
第二個\/?表示<img/>這種情況
/g表示全局替換

代碼如下:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>去除所有標簽</title>
</head>
<script>
    function matchReg(str){
        let reg=/<\/?.+?\/?>/g;
        console.log(str.replace(reg,‘‘));
    }
    matchReg(`<p>去除所有html標簽,<img/><My-Tag class="abc" value="test">自定義標簽也可以去除哦</My-Tag></p>`);
</script>
<body>
</body>
</html>

利用正則表達式去除所有html標簽,只保留文字