C# 抓取网页中的信息,该怎么处理
C# 抓取网页中的信息
现在我想从ip138网站上直接获取地理位置信息,需要抓取网页中指定的字符串和图片,请问如何实现指定位置抓取。
------解决方案--------------------
没有指定抓取这一说,需要你抓取网页内容后,使用正则表达式获取你想要的文本部分。
------解决方案--------------------
你把你的网页抓取为字符串,然后对进字符串进行查找就可以的,或者直接抓取为html文件,然后进行Dom操作了
------解决方案--------------------
http://iframe.ip138.com/ic.asp直接SubString不就得了 还正则干什么啊 只要是html不变就行拜
------解决方案--------------------
只能先抓取所有的信息 然后你在截取就是了
------解决方案--------------------
httprequest 和 httpresponse
参考
http://msdn.microsoft.com/zh-cn/library/system.web.httprequest(VS.80).aspx
然后字符串截取。
------解决方案--------------------
如
找到
然后再找结尾的,
遇到图片,先找出图片的url, 然后再用
下载下来
这样可以不?
现在我想从ip138网站上直接获取地理位置信息,需要抓取网页中指定的字符串和图片,请问如何实现指定位置抓取。
C#
图片
------解决方案--------------------
没有指定抓取这一说,需要你抓取网页内容后,使用正则表达式获取你想要的文本部分。
------解决方案--------------------
你把你的网页抓取为字符串,然后对进字符串进行查找就可以的,或者直接抓取为html文件,然后进行Dom操作了
------解决方案--------------------
http://iframe.ip138.com/ic.asp直接SubString不就得了 还正则干什么啊 只要是html不变就行拜
------解决方案--------------------
只能先抓取所有的信息 然后你在截取就是了
------解决方案--------------------
httprequest 和 httpresponse
参考
http://msdn.microsoft.com/zh-cn/library/system.web.httprequest(VS.80).aspx
然后字符串截取。
------解决方案--------------------
如
<TD align="center">卡号归属地</td><!-- <td width="138" align="center">卡号归属地</TD> -->
<TD class="tdc2" align="center">广东 广州</TD>
</TR>
<TR class=tdc bgcolor=#EFF1F3>
找到
string html = "<TD align="center">卡号归属地</td><!-- <td width="138" align="center">卡号归属地</TD> -->
<TD class="tdc2" align="center">广东 广州</TD>
</TR>
<TR class=tdc bgcolor=#EFF1F3>
"
int begin = html.IndexOf("<TD align="center">卡号归属地</td><!-- <td width="138" align="center">卡号归属地</TD> -->
<TD class="tdc2" align="center">");
然后再找结尾的,
遇到图片,先找出图片的url, 然后再用
System.Net.WebClient wc = new System.Net.WebClient();
wc.DownloadFile("img.url", "save.path");
下载下来
这样可以不?