1. 程式人生 > >URL短地址壓縮演算法 微博短地址原理解析 (Java實現)

URL短地址壓縮演算法 微博短地址原理解析 (Java實現)

       最近,專案中需要用到短網址(ShortUrl)的演算法,於是在網上搜索一番,發現有C#的演算法,有.Net的演算法,有PHP的演算法,就是沒有找到Java版的短網址(ShortUrl)的演算法,很是鬱悶。同時還發現有不少網友在發帖求助,怎麼實現Java版的短網址(ShortUrl)的演算法。乾脆一不做,二不休,參考了一下網上比較流行的PHP版短網址(ShortUrl)演算法:

再根據自己的理解,用Java實現了該短網址(ShortUrl)的演算法。(\(^o^)/YES!我還真厲害!)

先來廢話一下,是在別人的帖子上看到的,主要是讓大家瞭解一下短網址(ShortUrl)。

時下,短網址應用已經在全國各大微博上開始流行了起來。例如QQ微博的url.cn,新郎的t.cn等。

我們在新浪微博上釋出網址的時候,微博會自動判別網址,並將其轉換,例如:http://t.cn/hrYnr0。為什麼要這樣做的,原因我想有這樣幾點:

1、微博限制字數為140字一條,那麼如果我們需要發一些連線上去,但是這個連線非常的長,以至於將近要佔用我們內容的一半篇幅,這肯定是不能被允許的,所以短網址應運而生了。

2、短網址可以在我們專案裡可以很好的對開放級URL進行管理。有一部分網址可以會涵蓋性、暴力、廣告等資訊,這樣我們可以通過使用者的舉報,完全管理這個連線將不出現在我們的應用中,應為同樣的URL通過加密演算法之後,得到的地址是一樣的。

3、我們可以對一系列的網址進行流量,點選等統計,挖掘出大多數使用者的關注點,這樣有利於我們對專案的後續工作更好的作出決策。

其實以上三點純屬個人觀點,因為在我接下來的部分專案中會應用到,所以就瞭解了一下,下面先來看看短網址對映演算法的理論(網上找到的資料):

① 將長網址用md5演算法生成32位簽名串,分為4段,,每段8個字元;

② 對這4段迴圈處理,取每段的8個字元, 將他看成16進位制字串與0x3fffffff(30位1)的位與操作,超過30位的忽略處理;

③ 將每段得到的這30位又分成6段,每5位的數字作為字母表的索引取得特定字元,依次進行獲得6位字串;

④ 這樣一個md5字串可以獲得4個6位串,取裡面的任意一個就可作為這個長url的短url地址。

很簡單的理論,我們並不一定說得到的URL是唯一的,但是我們能夠取出4組URL,這樣幾乎不會出現太大的重複。

首先,請大家瞭解在Java中如何用MD5來加密字串得到32位的加密後的字串,下面是我已經封裝好的Java MD5演算法:

private final static String[] hexDigits = {
      "0", "1", "2", "3", "4", "5", "6", "7", 
      "8", "9", "a", "b", "c", "d", "e", "f"}; 

	public static String byteArrayToHexString(byte[] b){
		StringBuffer resultSb = new StringBuffer();
		for (int i = 0; i < b.length; i++){
			resultSb.append(byteToHexString(b[i]));
		}
		return resultSb.toString();
	}

	private static String byteToHexString(byte b){
		int n = b;
		if (n < 0)
			n = 256 + n;
		int d1 = n / 16;
		int d2 = n % 16;
		return hexDigits[d1] + hexDigits[d2];
	}

	public static String MD5Encode(String origin){
		String resultString = null;
			try {
				
				resultString=new String(origin);
				MessageDigest md = MessageDigest.getInstance("MD5");
				
				resultString.trim();

				resultString=byteArrayToHexString(md.digest(resultString.getBytes("UTF-8")));
			}catch (Exception ex){}
			return resultString;
		}

	public static void main(String[] args) 
	{
	
		String data = "189022881112011111118:09sz0000123456789987654321";
		System.out.println(MD5Encode(data));
	}
public class ShortUrl { 
    public static void main(String[] args) { 
        String url = "http://www.sunchis.com"; 
        for (String string : ShortText(url)) { 
            print(string); 
        } 
    } 
     
    public static String[] ShortText(String string){ 
        String key = "XuLiang";                 //自定義生成MD5加密字串前的混合KEY 
        String[] chars = new String[]{          //要使用生成URL的字元 
            "a","b","c","d","e","f","g","h", 
            "i","j","k","l","m","n","o","p", 
            "q","r","s","t","u","v","w","x", 
            "y","z","0","1","2","3","4","5", 
            "6","7","8","9","A","B","C","D", 
            "E","F","G","H","I","J","K","L", 
            "M","N","O","P","Q","R","S","T", 
            "U","V","W","X","Y","Z" 
        }; 
         
        String hex = MD5Encode(key + string); 
        int hexLen = hex.length(); 
        int subHexLen = hexLen / 8; 
        String[] ShortStr = new String[4]; 
         
        for (int i = 0; i < subHexLen; i++) { 
            String outChars = ""; 
            int j = i + 1; 
            String subHex = hex.substring(i * 8, j * 8); 
            long idx = Long.valueOf("3FFFFFFF", 16) & Long.valueOf(subHex, 16); 
             
            for (int k = 0; k < 6; k++) { 
                int index = (int) (Long.valueOf("0000003D", 16) & idx); 
                outChars += chars[index]; 
                idx = idx >> 5; 
            } 
            ShortStr[i] = outChars; 
        } 
         
        return ShortStr; 
    } 
     
    private static void print(Object messagr){ 
        System.out.println(messagr); 
    } 
} 

下面來看看程式部分:現在可以直接使用ShortText(url)方法,可以等到下面四組值:

ShortText("http://www.sunchis.com")[0];  //得到值:Jzyqma 
ShortText("http://www.sunchis.com")[1];  //得到值:QBrMzm 
ShortText("http://www.sunchis.com")[2];  //得到值:bQreM3 
ShortText("http://www.sunchis.com")[3];  //得到值:VNBRna 

選取結果中四個值的任何一個值即可作為URL對應生成的短網址了。

相關推薦

URL地址壓縮演算法 地址原理解析 Java實現

       最近,專案中需要用到短網址(ShortUrl)的演算法,於是在網上搜索一番,發現有C#的演算法,有.Net的演算法,有PHP的演算法,就是沒有找到Java版的短網址(ShortUrl)的演算法,很是鬱悶。同時還發現有不少網友在發帖求助,怎麼實現Java版的短網址

LeetCode演算法題-Minimum Depth of Binary TreeJava實現

這是悅樂書的第168次更新,第170篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第27題(順位題號是111)。給定二叉樹,找到它的最小深度。最小深度是沿從根節點到最近的葉節點的最短路徑上的節點數。葉子節點是沒有子節點的節點。例如: 給定二叉

LeetCode演算法題-Pascal's Triangle IIJava實現

這是悅樂書的第171次更新,第173篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第30題(順位題號是119)。給定非負索引k,其中k≤33,返回Pascal三角形的第k個索引行。行索引從0開始。在Pascal的三角形中,每個數字是它上面兩個數字的總和。例如: 輸

LeetCode演算法題-Intersection of Two Linked ListsJava實現

這是悅樂書的第178次更新,第180篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第37題(順位題號是160)。編寫程式以找到兩個單鏈表交叉的節點。例如: 以下兩個連結串列: A:       

這可能是最透徹的氣泡排序演算法解析java實現

氣泡排序是一種思想簡單,便於理解和實現的排序演算法,也許是很多人學習的第一個排序演算法,廢話不多說,我們來實現它 演算法詳解 我們以升序排列為例,演算法的思想是,遍歷整個陣列,依次對陣列中的每兩個數進行比較大小,通過兩個數字的交換,達到將最大的元素移動到陣列的最

LeetCode演算法題-Intersection of Two Arrays IIJava實現

這是悅樂書的第208次更新,第220篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第76題(順位題號是350)。給定兩個陣列,編寫一個函式來計算它們的交集。例如: 輸入:nums1 = [1,2,2,1],nums2 = [2,2] 輸出:[2,2] 輸入:nums1

LeetCode演算法題-Convert a Number to HexadecimalJava實現

這是悅樂書的第219次更新,第231篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第86題(順位題號是405)。給定一個整數,寫一個演算法將其轉換為十六進位制。對於負整數,使用二進位制補碼方法。例如: 輸入:26 輸出:“1a” 輸入:-1 輸出:“ffffffff”

LeetCode演算法題-Guess Number Higher or LowerJava實現

這是悅樂書的第211次更新,第224篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第79題(順位題號是374)。我們正在玩數字遊戲。 遊戲如下:我從1到n中選擇一個數字。 你必須猜測我選擇了哪個數字。每次你猜錯了,我都會告訴你這個數字是高還是低。

信公眾號授權登入java實現

步驟: 1、 使用第三方工具,生成內網對映 2、 微信公眾平臺使用測試賬號 3、 測試賬號中需要配置自己的域名,並關注該臨時測試使用的公眾號 4、 下載一個瀏覽器的二維碼外掛 4、 編碼測試 使用花生殼進行內網穿透 注意,因為我使用的是808

對稱矩陣與壓縮儲存演算法java實現

一、問題描述 實現一個對稱矩陣的壓縮儲存 二、演算法分析 對稱矩陣的特點:a[i][j] = a[j][i].即所有元素關於對角線對稱 所以可以將對稱矩陣的下三角儲存在一個數組物件SA中,儲存方式是, SA[0] = a[0][0] SA[1] = a[1][0]  

LeetCode演算法題-SqrtJava實現

這是悅樂書的第158次更新,第160篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第17題(順位題號是69)。 計算並返回x的平方根,其中x保證為非負整數。 由於返回型別是整數,因此將截斷十進位制數字,並僅返回結果的整數部分。例如: 輸入:4 輸出:2

演算法題4:迴文數python3實現

判斷一個整數是否是迴文數。迴文數是指正序(從左向右)和倒序(從右向左)讀都是一樣的整數。 示例 1: 輸入: 121 輸出: true 示例 2: 輸入: -121 輸出: false 解釋: 從左向右讀, 為 -121 。 從右向左讀, 為 121- 。因此它不是一個迴

演算法題3:兩數之和python3實現

給定一個整數陣列和一個目標值,找出陣列中和為目標值的兩個數。 你可以假設每個輸入只對應一種答案,且同樣的元素不能被重複利用。 示例: 給定 nums = [2, 7, 11, 15], target = 9 因為 nums[0] + nums[1] = 2 + 7 = 9 所以返回 [

找零問題Java實現——貪心演算法

貪心演算法也稱為貪婪演算法。 下述找零問題應用的方法就是貪心演算法。現在思考,有沒有更好的找零辦法,使找出的硬幣個數更少呢?也就是說,對於找零問題的這個例項,這個解是不是最優的呢?實際上,可以證明,就這些面額的硬幣來說,對於所有正整數的找零金額,貪心演算法都會輸出一個最優解。 貪心演算法在解

LeetCode演算法題-Merge Sorted ArrayJava實現

這是悅樂書的第161次更新,第163篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第20題(順位題號是88)。給定兩個排序的整數陣列nums1和nums2,將nums2中的元素合併到nums1中,並且作為一個排序的陣列。在nums1和nums2中初始化的元素個數分別為m和

LeetCode演算法題-Same TreeJava實現

這是悅樂書的第162次更新,第164篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第21題(順位題號是100)。給定兩個二叉樹,編寫一個函式來檢查它們是否相同。如果兩個二叉樹在結構上相同並且節點具有相同的值,則認為它們是相的。例如: 輸入: 1 1

LeetCode演算法題-Symmetric TreeJava實現

這是悅樂書的第163次更新,第165篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第22題(順位題號是101)。給定二叉樹,檢查它是否是自身的映象(即,圍繞其中心對稱)。 例如,這個二叉樹[1,2,2,3,4,4,3]是對稱的: 1 / \

LeetCode演算法題-Binary Tree Level Order Traversal IIJava實現

這是悅樂書的第165次更新,第167篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第24題(順位題號是107)。給定二叉樹,返回其節點值的自下而上級別順序遍歷(即從左到右,逐層逐層)。例如: 給定二叉樹[3,9,20,null,null,15,7], 3

信公眾號支付/退款java環境開發介紹

開發之前翻閱了很多帖子,結合自己的實際開發情況,將微信支付/退款 流程以及code貼出,希望通過這一篇帖子就能解決你的問題,有不清楚的直接留言,我會及時回覆(ง •̀_•́)ง   一些說明:xxxUtils為工具類,Constant為常量類 為方便開發,所用和微信支付相關co

LeetCode演算法題-Balanced Binary TreeJava實現

這是悅樂書的第167次更新,第169篇原創 01 看題和準備 今天介紹的是LeetCode演算法題中Easy級別的第26題(順位題號是110)。給定二叉樹,判斷它是否是高度平衡的。對於此問題,高度平衡二叉樹定義為:一個二叉樹,其中每個節點的兩個子樹的深度從不相差超過1。例如: