文章摘要
该文章介绍了一个使用Nokogiri和open-uri库开发的模块,用于从指定URL的评论页面下载XMZ格式的内容。该模块通过循环访问从1到141的评论页面,提取图片URL并下载。具体来说,它从`http://www.xxx.com`的共享评论页面抓取HTML,遍历页面中的图片并下载到公共文件夹`public/meizi/`中。文章还提供了一个自定义函数`download_img`,用于从图片URL下载并保存图片。整体流程自动化,主要目的是高效下载并存储图片。
module CommonHelper
module CommonHelper
require ‘nokogiri’
require ‘open-uri’
def down_load_xmz
site_url=”http://www.xxx.com”
for index_page in 1..141
doc_html=Nokogiri::HTML(open(site_url+’/share/comment-page-‘+index_page.to_s))
doc_html.css(“#comments p img”).each do |item_img|
puts item_img[:src]
download_img(item_img[:src])
end
end
end
########下载图片
def download_img(img_url)
begin
img_file=open(img_url) { |f| f.read }
file_name=img_url.split(‘/’).last
#puts file_name
open(“public/meizi/”+file_name, “wb”) { |f| f.write(img_file) }
return “/public/meizi/”+file_name
rescue=> err
puts err
return ”
end
end
end
© 版权声明
文章版权归作者所有,未经允许请勿转载。



