以下是一个基于Go 1.19的站点模板爬虫的示例代码:
package mainimport ("fmt""io/ioutil""net/http""regexp"
)func main() {// 站点URLurl := "http://example.com"// 发起HTTP GET请求resp, err := http.Get(url)if err != nil {fmt.Printf("请求失败:%v", err)return}defer resp.Body.Close()// 读取响应的HTML内容html, err := ioutil.ReadAll(resp.Body)if err != nil {fmt.Printf("读取响应失败:%v", err)return}// 使用正则表达式提取模板re := regexp.MustCompile(`<title>(.*?)</title>`)matches := re.FindSubmatch(html)if len(matches) > 1 {template := string(matches[1])fmt.Printf("站点模板:%s\n", template)} else {fmt.Println("未找到站点模板")}
}
这个示例代码演示了使用Go标准库进行简单的HTTP GET请求,然后使用正则表达式提取站点模板。你可以根据实际需求修改正则表达式或者使用其他的HTML解析库来提取更多内容。