首页 > 代码库 > Powerbuilder编程技巧 如何获取网页的HTML源码

Powerbuilder编程技巧 如何获取网页的HTML源码

直接使用的三种方式 
1、  PB内部对象 Inet object 
2、  API 函数 
3、  Ole中的Microsfot Web 游览器对象 

一、Inet object: 
1、Inet object 
       The Inet object provides the ability to display a Web page in the default browser, access the HTML for a specified page, and send data to a CGI, ISAPI, or NSAPI program.。以上是PB helper的阐明,翻译成中文就是:供给了在Windows缺省阅读器中显示WEB页,以及向支撑CGI,ISAPI,NSAPI的利用程序发送数据的才能。似乎还是不好懂得如何获取html,我也不懂得,假如你不知道她必需和另外一个对象 InternetResult object一起应用的话。 

2、InternetResult object 
    好吧,我们持续看看InternetResult object 是什么东西,简略的说我们可以把它看作一个buffer,用于吸收异步数据传输的对象,就是说,它是一个buffer,用于接受并寄存html代码的东西,这回轻易懂得了吧。 
    InternetResult object无法直接使用,比如直接定义 
                InternetResult  lnet_ InternetResult //这是非法的,我们看一下它的help 
       The InternetResult object acts as a buffer,齿轮泵, receiving and caching asynchronous data, as it is returned using the Internet in response to the GetURL and PostURL function calls. The InternetResult object also provides the ability to process this data. 
       To use an InternetResult object, create a standard class user object that defines an InternetData function to process the passed HTML. 
    我们看斜体字部分,helper告知我们必须创建一个standard class来使用它,为什么要这么麻烦,我的理解是,实际上这里是借助创建一个use object 来实现一个新的“线程”。然后用这个新的对象来接受   GetURL返回的数据??新的线程来完成异步数据吸收,否则会阻塞现有利用。 

3、又一个必需要解释的东西Internetdata 
   这个是InternetResult的一个函数,尺度的写法是:servicereference.InternetData (Blob data )。好吧,很愉快我们有了一个函数了,pb又来了,蒸馏设备,这个函数是不能直接被使用的,它不会返回任何东西。算了,我们不贴help了,反正这是一个覆盖函数。假如你使用的是6.5以下的版本,你必须在的internetResult的继续对象上定义函数InternetData()作为基类中的同名函数的笼罩函数。该笼罩函数必须包括一个类型为blob的参数采取传值方法传递,其返回值必需是Integer类型.在函数体中处置data参数.。如果应用7.0以上的版本,那体系会主动帮你创立这个笼罩函数,电厂脱硫,你只要在里面些代码就可以了。 

4、开端代码吧 
       1)创立一个InternetResult 的 standard class 并取名为n_internetresult。 
       2)在n_internetresult中创立一个实例变量 string is_data 
       3) 在n_internetresult:internetdata()函数写上如下代码 
                     is_data = http://www.mamicode.com/string(data , EncodingUTF8!)
这里必须阐明,string指定字符集只有在9.0版本后才有效,假如在这之前的版本上应用,恭喜你,只能直接调用api函数来转换了 
       4)好了,随意弄个窗口,再随意弄个按钮,在按钮里写一下代码 
              n_internetresult n_ir 
              inet inet_base 
              string ls_url = ‘http://www.google.com’ 

               inet_base.GetURL(ls_url , n_ir) 
              messagebox(‘www.google.com:html’, n_ir.is_data) 
   5) 你可以运行它了 

5、很主要,必需要阐明的一些规矩 
       1)Inet无法获取大于65535的源码,它会直接截断它,很愁闷吧。 
         2)有些网站会断定游览器,你将无法获取它的源码。 相关的主题文章:

    • 两种爱情
    • 大海风云
    • 宗教修行者

Powerbuilder编程技巧 如何获取网页的HTML源码