彪悍乡里人 txt:上网机器人程序怎么编写VB

来源:百度文库 编辑:高校问答 时间:2024/04/28 06:24:56
想编一个程序能够自动上网,读取网页某一部份数据保存至数据库。
我看过《自动上网抓数据的机器人》一文,也想用他的办法,不用字符串搜索,直接分析HTML网页各元素对象。但是该文对HTML对象介绍不全面,不知哪里有全面一些的资料。
正则表达式还是针对网页字符的操作,我想直接访问HTML网页各元素对象,这样比较准确,效率也比较高,但我不了解HTML的对象成员如:HTMLDivElement、HTMLDivPosition、HTMLDocument、HTMLElementCollection、HTMLBody(还有好多)还有它们的子成员等等。相互间是什么关系,如何调用。最好是有关这些内容的详细介绍,哪位大侠能够提供在下先谢谢了!

用正则表达式啊。遇到链接的时候。。就把链接地址取出来。

/<a(.*) href="(.*?)"(.*)>(.*?)<\/a>/