Ruby实现网页图片抓取(中韩女足第二场比赛)这样也行?

随心笔谈9个月前更新 admin
207 00
🌐 经济型:买域名、轻量云服务器、用途:游戏 网站等 《腾讯云》特点:特价机便宜 适合初学者用 点我优惠购买
🚀 拓展型:买域名、轻量云服务器、用途:游戏 网站等 《阿里云》特点:中档服务器便宜 域名备案事多 点我优惠购买
🛡️ 稳定型:买域名、轻量云服务器、用途:游戏 网站等 《西部数码》 特点:比上两家略贵但是稳定性超好事也少 点我优惠购买

文章摘要

该文章介绍了一个使用Nokogiri和open-uri库开发的模块,用于从指定URL的评论页面下载XMZ格式的内容。该模块通过循环访问从1到141的评论页面,提取图片URL并下载。具体来说,它从`http://www.xxx.com`的共享评论页面抓取HTML,遍历页面中的图片并下载到公共文件夹`public/meizi/`中。文章还提供了一个自定义函数`download_img`,用于从图片URL下载并保存图片。整体流程自动化,主要目的是高效下载并存储图片。


module CommonHelper

require ‘nokogiri’
require ‘open-uri’

def down_load_xmz
site_url=”http://www.xxx.com”

for index_page in 1..141
doc_html=Nokogiri::HTML(open(site_url+’/share/comment-page-‘+index_page.to_s))
doc_html.css(“#comments p img”).each do |item_img|
puts item_img[:src]
download_img(item_img[:src])
end
end
end

########下载图片
def download_img(img_url)
begin
img_file=open(img_url) { |f| f.read }
file_name=img_url.split(‘/’).last
#puts file_name
open(“public/meizi/”+file_name, “wb”) { |f| f.write(img_file) }
return “/public/meizi/”+file_name
rescue=> err
puts err
return ”
end
end

end

© 版权声明

相关文章