当前位置: 首页 > 后端技术 > Python

Huginn监听网页变化并推送

时间:2023-03-25 23:35:01 Python

以图灵社区每周专页为例:https://www.ituring.com.cn/tag/36527抓取内容该页面将更新三本半价电子书周一,先分析一下页面的xpath,找出其中的规律。复制粘贴后可以看到三本书的xpath为://*[@id="tag-book"]/div/ul/li[1]/div[2]/h4/a//*[@id="tag-book"]/div/ul/li[2]/div[2]/h4/a//*[@id="tag-book"]/div/ul/li[3]/div[2]/h4/a只有中间的li[]内容不同。所以options部分和xpath部分可以用li[*]来匹配所有的case。可以这样写:{"expected_update_period_in_days":"2","url":"https://www.ituring.com.cn/tag/36527","type":"html","mode":"on_change","extract":{"url":{"xpath":"//*[@id=\"tag-book\"]/div/ul/li[*]/div[2]/h4/a","value":"@href"},"title":{"xpath":"//*[@id=\"tag-book\"]/div/ul/li[*]/div[2]/h4/a","value":"@title"}}}使用slack代理推送推送的内容。选项部分:{“webhook_url”:“https://hooks.slack.com/services/xxxx/xxxxxxxx”,“频道”:“#book”,“用户名”:“Huginn”,“消息”:“{{title}}https://www.ituring.com.cn{{url}}","icon":""}效果