1. 程式人生 > >Python 正則表示式匹配字串中的http連結

Python 正則表示式匹配字串中的http連結

利用Python正則表示式匹配字串中的http連結。主要難點是用正則表示出http 連結的模式。

import re
pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[[email protected]&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')    # 匹配模式

string = 'Its after 12 noon, do you know where your rooftops are? http://tinyurl.com/NYCRooftops '
url = re.findall(pattern,string)
print
url >>['http://tinyurl.com/NYCRooftops']

相關推薦

Python 表示式匹配字串http連結

利用Python正則表示式匹配字串中的http連結。主要難點是用正則表示出http 連結的模式。 import re pattern = re.compile(r'http[s]?://(?:[a-z

python表示式字串提取數字

python從字串中提取數字 使用正則表示式,用法如下: ## 總結 ## ^ 匹配字串的開始。 ## $ 匹配字串的結尾。 ## \b 匹配一個單詞的邊界。 ## \d 匹配任意數字。 ## \D

Js 表示式匹配字串是否含有中文

通常在特定的情景裡,有的字串是不允許存在中文字元的,因此我們可以通過正則表示式來匹配。廢話不多說,上程式碼。 JS: function checkChinese(obj_val){ var reg = new RegExp("[\\u4E

轉載Python表示式匹配反斜槓'\'問題(——字串轉義與轉義)

在學習Python正則式的過程中,有一個問題一直困擾我,如何去匹配一個反斜槓(即“\”)? 一、引入 在學習了Python特殊字元和原始字串之後,我覺得答案應該是這樣的: 1)普通字串:’\\’ 2)原始字串:r’\’ 但事實上在提取諸如“3\8”反斜槓之前的數字時,我屢次碰壁,始終得不到結果。最

python 表示式匹配特定浮點數

  def is_decimal(num): import re    #以數字開頭,小數點後保留1位數字或兩位數字或者沒有小數部分 dnumre = re.compile(r"""^[0-9]+(\.[0-9]{1,2})?$""") result = d

Python 表示式匹配中文

在python2.x中,匹配中文,首先要宣告utf8的編碼方式。 # coding:utf-8  其次,被匹配的字串一定要是utf8編碼: string = u'我是個好人。'  最後,正則表示式一定要是utf8編碼: pat = u'\u6211.

python 之提取字串的漢字,數字,字母

#\d 匹配一個數字字元。等價於 [0-9] #\D 匹配一個非數字字元。等價於 [^0-9] #過濾字串中的英文與符號,保留漢字 import re st = "hello,world!!%[545

php表示式 剔除字串的除了漢字的字元(只保留漢字)

1)utf-8的編碼格式,匹配中文程式碼如下: <?php     $str = "utf-8下匹配出中文字串";     $preg = "/[\x{4e00}-\x{9fa5}]+/u";     if(preg_match_all($preg,$str,$mat

java利用表示式提取字串的整數和小數部分

最近開發遇到一個新的東西,就是前端傳過來一個字串,需要將裡面的數字提取出來,倒騰了一天,最後還是沒有倒騰出來,最後還是借鑑大佬的方法。記錄一下。 首先是前端傳來的字串“小明通過掃碼向你付款100000.566元”其中暱稱和金額不是固定的,其他是固定的。 於是便考慮使用“通過掃碼向你付

python表示式匹配分組的使用

正則表示式匹配分組等其他的情況 字元 功能 | 匹配左右任意一個表示式 (ab) 將括號中字元作為一個分組,可以和|一起使用(ab|cd)表示匹配括號內分組中的一個 \n

java 利用表示式去處字串的所有空格

轉載自xcmercy的部落格 目標 去除字串中所有的空白字元,包括空格、製表符、回車符等所有空白字元 思路 根據字串長度,利用迴圈遍歷字串此方法太笨拙。這裡利用正則表示式,匹配所有的空白字元,然後將匹配到的空白字元替換為 “” 空串即可。 程式碼 private St

python 表示式去除文字標籤內容

print re.sub("<[^>]*>","",text) 輸出正確結果,而 print t.replace("<[^>]*>","")不能輸出正確結果 import re t = "<text>jsdkjfsgn&l

利用表示式去除字串的空格

\s* 表示若干個空格(可以是0個)。 \s+ 表示一個或多個空格 public class Test { public static void main(String[] args) {

根據表示式匹配頁面js和css檔案

          // 匹配           List<string> srcList = new List<string>();           List<string> linkList = new List<string>();   

python 表示式-匹配規則

正則表示式是一個特殊的字元序列,它能幫助你方便的檢查一個字串是否與某種模式匹配。 Python 自1.5版本起增加了re 模組,它提供 Perl 風格的正則表示式模式。 re 模組使 Python 語言擁有全部的正則表示式功能。 compile 函式根據一

python表示式進行字串的查詢

python進行字串的查詢,查找出現的位置 import re ####列表返回 pattern=re.compile(r'\d+') re1=pattern.findall('run 123 and 456') print(re1) ######迭代器返回 i

表示式擷取字串的數字

方法一: String str="fsdfdsf12315f15哈12的"; String regEx="[^0-9]"; Pattern p = Pattern.compile(regEx); Matcher m = p.matcher(str); String n

Java 表示式 匹配括號的數字

第一種:      String line = "+!!!0(100000000073);+!!!0(100000000071);";      String pattern = "(?<=\\()\\d+(?=\\))";      pattern = "(\\d{1

java-使用表示式擷取字串的時間資訊

package com.yr.method; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * @Aut

python 表示式匹配

import re def match_case(word): def replace(m): text_group = m.group() if text_group.isupper(): r