博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
JAVA抓取一个HTML源代码
阅读量:4955 次
发布时间:2019-06-12

本文共 1662 字,大约阅读时间需要 5 分钟。

  1.   
  2. package com.hyq.src;   
  3.   
  4. import java.io.InputStream;   
  5. import java.net.URL;   
  6.   
  7.   
  8. public class Test {   
  9.        
  10.     /**  
  11.      * @param args  
  12.      */  
  13.     public static void main(String[] args) {   
  14.         try{   
  15.             Test.testNetStream();   
  16.         }catch(Exception e){   
  17.             e.printStackTrace();   
  18.         }   
  19.     }    
  20.     public static void testNetStream()throws Exception{   
  21.         URL url=new URL("http://www.imust.cn/");   
  22.         InputStream in=url.openStream();   
  23.         byte[] b=new byte[100000];   
  24.         in.read(b);   
  25.         in.close();   
  26.         String s=new String(b);   
  27.         System.out.println(s);   
  28.     }   
  29. }  
package com.hyq.src;import java.io.InputStream;import java.net.URL;public class Test {		/**	 * @param args	 */	public static void main(String[] args) {		try{			Test.testNetStream();		}catch(Exception e){			e.printStackTrace();		}	} 	public static void testNetStream()throws Exception{		URL url=new URL("http://www.imust.cn/");		InputStream in=url.openStream();		byte[] b=new byte[100000];		in.read(b);		in.close();		String s=new String(b);		System.out.println(s);	}}

Java代码  
  1.   
  2. package com.hyq.src;   
  3.   
  4. import java.io.BufferedReader;   
  5. import java.io.InputStreamReader;   
  6. import java.net.URL;   
  7. import java.net.URLConnection;   
  8.   
  9.   
  10.   
  11. public class Test {   
  12.        
  13.     public static void main(String[] args)   
  14.     {   
  15.         System.out.println(Test.getHtmlSource("http://sports.163.com/zc/"));   
  16.     }   
  17.        
  18.     public static String getHtmlSource(String url){   
  19.         StringBuffer stb=new StringBuffer();   
  20.         try{   
  21.             URLConnection uc=new URL(url).openConnection();   
  22.             BufferedReader br=new BufferedReader(new InputStreamReader(uc.getInputStream(),"gb2312"));   
  23.             String temp=null;   
  24.             while((temp=br.readLine())!=null){   
  25.                 stb.append(temp).append("\n");   
  26.             }   
  27.             br.close();   
  28.                
  29.         }catch(Exception e){   
  30.             e.printStackTrace();   
  31.         }   
  32.         return stb.toString();   
  33.            
  34.     }   
  35.   
  36.        
  37. }  

转载于:https://www.cnblogs.com/wlly216/archive/2011/09/22/2185609.html

你可能感兴趣的文章
前端小笔记
查看>>
《人人都是产品经理》书籍目录
查看>>
如何在git bash中运行mysql
查看>>
OO第三阶段总结
查看>>
构建之法阅读笔记02
查看>>
初学差分约束
查看>>
HEVC编码学习(一)HM配置
查看>>
通过Spark SQL关联查询两个HDFS上的文件操作
查看>>
DataTable和 DataRow的 区别与联系
查看>>
检索COM 类工厂中CLSID 为 {00024500-0000-0000-C000-000000000046}的组件时失败
查看>>
mysql数据库中数据类型
查看>>
Fireworks基本使用
查看>>
两台电脑间的消息传输
查看>>
Linux 标准 I/O 库
查看>>
.net Tuple特性
查看>>
Java基础常见英语词汇
查看>>
iOS并发编程笔记【转】
查看>>
泛型 T的定义<1>
查看>>
thinkphp dispaly和fetch的区别
查看>>
08号团队-团队任务5:项目总结会
查看>>