中英文url解码vc++源程序

首页 > 代码库 > 中英文url解码vc++源程序

2024-08-03 03:15:25 222人阅读

本文主要讨论中文url解码实现问题,没有详细讲解url编码,utf-8编码.想对编解码问题有更加详细的了解,请查阅相关资料
url编码:实质字符ascii码的十六进制。只是稍微有些变动，需要在前面加上"%"。比如"\"，它的ascii码是92，92的十六进制是5c，所以"\"的url编码就是%5c。
UTF-8 编码是UNICODE的一种变长字符编码，由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。如果UNICODE字符由2个字节表示，则编码成UTF-8很可能需要3个字节，而如果UNICODE字符由4个字节表示，则编码成UTF-8可能需要6个字节。
这里我们只需要知道utf－8对一个英文字符采用一个字节进行编码，对一个中文字符采用三个字节进行编码。现在对如下url编码进行解码实现。
url编码:MFC%E8%8B%B1%E6%96%87%E6%89%8B%E5%86%8C.chm
源代码在windows xp sp2 + vc++6.0测试通过（改进过的代码）。

#include <afx.h>
#include <iostream>
void UTF8ToGB(CString& str);

void ANSIToGB(char* str,int n)
{
 ASSERT(str!=NULL); // 保证传进来的参数不能为NULL
 wchar_t szwchar = 0;
 CString  szResult,szhead = "", szend = "";
 CString szrst;
 char ch, hex[2] = "";
 int ix = 0;
 szResult = str;
 int imax = szResult.GetLength();
 int ih = szResult.Find("%", 0);
 int ie = szResult.ReverseFind('%');
 szhead = szResult.Left(ih);
 //szend = szResault.Right(imax - ie - 3);
 szResult = "";
 ix = ih;
 CString strTemp;
 bool bIsHaveUTF8 = false;
 while (ch = *(str + ix))
 {
  
  if (ch == '%')
  {
   hex[0] = *(str + ix + 1);
   hex[1] = *(str + ix + 2);
   sscanf(hex, "%x", &szwchar);
   szrst += szwchar;
   ix+=3;
            bIsHaveUTF8 = true;
  }
  else
  {
   if(bIsHaveUTF8)
   {
     UTF8ToGB(szrst);
     strTemp+=szrst;
     szrst="";
     bIsHaveUTF8 = false;
   }
   // 取出不必转换的字符
   strTemp += *(str + ix);
   ix++;
  }
 }
 
 szResult = szhead + strTemp;
 memset(str,0,n);
 strcpy(str,szResult);

}

void UTF8ToGB(CString& szstr)
{
 WCHAR* strSrc;

 TCHAR* szRes;
 int i = MultiByteToWideChar(CP_UTF8, 0, szstr, -1, NULL, 0);
 strSrc = http://www.mamicode.com/new WCHAR[i + 1];>

中英文url解码vc++源程序

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 中英文url解码vc++源程序

中英文url解码vc++源程序

看完仍有疑问？有类似问题直接问程序猿