首页 > 代码库 > 短链(ShortURL)的Java实现

短链(ShortURL)的Java实现

什么叫短链或短址?

顾名思义,就是把长的 URL 转成短的 URL, 现在提供这种服务的有很多公司,我们以google家的 URL shortener 服务: http://goo.gl/ 为例。 首先我们到http://goo.gl/,然后把本文博客的地址http://blog.csdn.net/beiyeqingteng 输入进去,最后它会返回一个更短的URL,http://goo.gl/Jfs6q 。

新浪微博为什么使用短链?

  1. 无论多长的微博,都能够转成固定长短的短链,防止某些连接太长影响用户输入其他内容;
  2. 所有短链在算法上无法直接解链,必须经过新浪的服务器,把链接系统控制到自己的手上。这对网络内容审察来说作用极其大,如果有人发的微博包含敏感内容,新浪就不予中转;
  3. 重新组织链接网页的内容,方便用户在手机端查看;
  4. 由于长链中可能会包含#或者@这些特殊字符,给客户端的字符串处理带来压力,编码可以消除这些特殊符号;
  5. 由于所有链接都要经新浪的服务器,因此服务器保存有所有的链接,方便进行数据挖掘和统计分析。

Java实现

 1 package com.wanda.restful.framework.test.shorturl; 2  3 import java.security.MessageDigest; 4  5 /** 6  * @version v1.0.0 7  * @author: wangyang 8  * Date: 2016-9-8 Time: 15:32 9  */10 public class Encript {11     //十六进制下数字到字符的映射数组12     private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"};13 14     /**把inputString加密*/15     public static String md5(String inputStr){16         return encodeByMD5(inputStr);17     }18 19     /**20      * 验证输入的密码是否正确21      * @param password 真正的密码(加密后的真密码)22      * @param inputString 输入的字符串23      * @return 验证结果,boolean类型24      */25     public static boolean authenticatePassword(String password,String inputString){26         if(password.equals(encodeByMD5(inputString))){27             return true;28         }else{29             return false;30         }31     }32 33     /**对字符串进行MD5编码*/34     private static String encodeByMD5(String originString){35         if (originString!=null) {36             try {37                 //创建具有指定算法名称的信息摘要38                 MessageDigest md5 = MessageDigest.getInstance("MD5");39                 //使用指定的字节数组对摘要进行最后更新,然后完成摘要计算40                 byte[] results = md5.digest(originString.getBytes());41                 //将得到的字节数组变成字符串返回42                 String result = byteArrayToHexString(results);43                 return result;44             } catch (Exception e) {45                 e.printStackTrace();46             }47         }48         return null;49     }50 51     /**52      * 轮换字节数组为十六进制字符串53      * @param b 字节数组54      * @return 十六进制字符串55      *56      */57     private static String byteArrayToHexString(byte[] b){58         StringBuffer resultSb = new StringBuffer();59         for(int i=0;i<b.length;i++){60             resultSb.append(byteToHexString(b[i]));61         }62         return resultSb.toString();63     }64 65     //将一个字节转化成十六进制形式的字符串66     private static String byteToHexString(byte b){67         int n = b;68         if(n<0)69             n=256+n;70         int d1 = n/16;71         int d2 = n%16;72         return hexDigits[d1] + hexDigits[d2];73     }74 }

 

 1 package com.wanda.restful.framework.test.shorturl; 2  3 /** 4  * Generator ShortUrl 5  * 数据库中需要保存长链与短链之间的关系,通过访问短链跳转到长链接 6  * 7  * @version v1.0.0 8  * @author: wangyang 9  * Date: 2016-9-8 Time: 15:4210  */11 public class ShortUrlGenerator {12     public static void main(String[] args) {13         String sLongUrl = "http://www.baidu.com";14         for (String shortUrl : shortUrl(sLongUrl)) {15             System.out.println(shortUrl);16         }17     }18 19     public static String[] shortUrl(String url) {20         // 可以自定义生成 MD5 加密字符传前的混合 KEY21         String key = "wangyang";22         // 要使用生成 URL 的字符23         String[] chars = new String[]{"a", "b", "c", "d", "e", "f", "g", "h",24                 "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t",25                 "u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5",26                 "6", "7", "8", "9", "A", "B", "C", "D", "E", "F", "G", "H",27                 "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T",28                 "U", "V", "W", "X", "Y", "Z"29         };30         // 对传入网址进行 MD5 加密31         String sMD5EncryptResult = (Encript.md5(key + url));32         String hex = sMD5EncryptResult;33         String[] resUrl = new String[4];34         //得到 4组短链接字符串35         for (int i = 0; i < 4; i++) {36             // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算37             String sTempSubString = hex.substring(i * 8, i * 8 + 8);38             // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界39             long lHexLong = 0x3FFFFFFF & Long.parseLong(sTempSubString, 16);40             String outChars = "";41             //循环获得每组6位的字符串42             for (int j = 0; j < 6; j++) {43                 // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引(具体需要看chars数组的长度   以防下标溢出,注意起点为0)44                 long index = 0x0000003D & lHexLong;45                 // 把取得的字符相加46                 outChars += chars[(int) index];47                 // 每次循环按位右移 5 位48                 lHexLong = lHexLong >> 5;49             }50             // 把字符串存入对应索引的输出数组51             resUrl[i] = outChars;52         }53         return resUrl;54     }55 }

 

参考资料

  • 短址(short URL)原理及其实现
  • 关于微博内容中的短地址ShortURL

短链(ShortURL)的Java实现