亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > python爬蟲智能翻頁批量下載文件的實例詳解

python爬蟲智能翻頁批量下載文件的實例詳解

熱門標簽:滴滴地圖標注公司 江門智能電話機器人 如何申請400電話代理 杭州房產地圖標注 智能電話機器人調研 天津塘沽區地圖標注 地圖標注可以遠程操作嗎 甘肅高頻外呼系統 400電話在線如何申請

python爬蟲遇到爬取文件內容時,需要一頁頁的翻頁爬取,這樣很是麻煩,其實可以獲取每個列表信息下的文件名和文件鏈接,讓文件名和文件鏈接處理為列表,保存后下載,實現智能翻頁批量下載文件,本文以以京客隆為例,批量下載文件,如財務資料,他的每一份報告都是一份pdf格式的文檔。以此頁面為目標,下載他每個分類的文件python爬蟲實戰之智能翻頁批量下載文件。

1、引入庫

import requests
import pandas as pd
from lxml import etree
import re
import os

2、解析初始頁面

baseUrl ='http://www.jkl.com.cn/cn/invest.aspx' # 爬取頁面的數據
heade ={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/81.0.4044.92 Safari/537.36'
}
res =requests.get(url=baseUrl,headers=heade).text  
# print(res.text)
html = etree.HTML(res)
res =requests.get(url=baseUrl,headers=heade).text  #  設置變量接受 基礎頁的響應數據
# print(res.text)
html = etree.HTML(res)

3、獲得投資關系的分類名稱和url地址

data_name = html.xpath('//div[@class="infoLis"]//a/text()') # 投資者列表的名字
data_link = html.xpath('//div[@class="infoLis"]//@href')  # 全部列表的鏈接
name = [data_name.strip() for data_name in data_name]  # 通過for循環去掉空字符
link = ['http://www.jkl.com.cn/cn/'+ data_link for data_link in data_link] # 拼接字符串
# 合并為字典,方便保存文件
file = dict(zip(name,link))

4、每個列表信息,保存一個文件夾

for name,link in file.items():
  name=name.replace('/','.')
  name=name.replace('...','報表')
  # 上面的把文件名帶特許字符的 強制轉換為我們想要的文本類型
  path = 'E:/'+ name
  if not os.path.exists(path):
    os.mkdir(path)
    #建立儲存位置

5、對列表的每個項目鏈接進行解析,拿到尾頁

  res_list = requests.get(url = link, headers = heade).text
  list_html = etree.HTML(res_list)
  # print(html_erJi) 解析每個分類的鏈接
  weiYe = list_html.xpath('//a[text()="尾頁"]/@href')
  # print(html_weiye)
  # 拿到尾頁信息
  if weiYe !=[]:
    # 正則提取尾頁信息
    get_weiYe =re.search("(\d+)'\)",html_weiye[0])
    get_yeMa = get_html_weiYe.group(1)
  else:
    get_yeMa=1
  # print(get_html_yeMa) 看看是不是提取成功

6、獲取每個列表信息下的文件名和文件鏈接

  for get_yeMa in range(1,int(get_yeMa)+1): # 翻頁
    yaMa= {
    '__EVENTTARGET': 'AspNetPager1',
    '__EVENTARGUMENT': get_yeMa
    }
    get_lei_html = requests.get(url = link, headers = heade, params = yaMa).text
    res3 =etree.HTML(get_lei_html)
    # print(res3)
    pdf_name = res3.xpath('//div[@class="newsLis"]//li/a/text()')
    # print(pdf_name)
    pdf_url = res3.xpath('//div[@class="newsLis"]//li//@href')

7、讓文件名和文件鏈接處理為列表,保存后下載

 pdf_names = [pdf_name.strip() for pdf_name in pdf_name]
 # print(pdf_names)
 if all(pdf_url):
      pdf_urls = ['http://www.jkl.com.cn'+pdf_url for pdf_url in pdf_url]
      # print(pdf_url)
      pdf_data=dict(zip(pdf_names,pdf_urls))  # pdf地址和名字整合為字典
      for pdfName,pdfUrl in pdf_data.items():
        pdfName =pdfName.replace('/','.')
        res_pdf= requests.get(url =pdfUrl,headers=heade).content
        houZui = pdfUrl.split('.')[-1]
        pdf_pash = path + '/' + pdfName + '.'+ houZui  # 
        # print(pdf_pash)
        with open(pdf_pash,'wb') as f:
          f.write(res_pdf)
          print(pdfName,'下載成功')

到此這篇關于python爬蟲智能翻頁批量下載文件的實例詳解的文章就介紹到這了,更多相關python爬蟲實戰之智能翻頁批量下載文件內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python 批量下載陰陽師網站壁紙
  • Python爬蟲之批量下載喜馬拉雅音頻
  • 用python批量下載apk
  • 用python爬蟲批量下載pdf的實現
  • python 批量下載bilibili視頻的gui程序
  • Python爬蟲實戰之批量下載快手平臺視頻數據

標簽:漢中 廊坊 德宏 河池 長春 東莞 臨汾 重慶

巨人網絡通訊聲明:本文標題《python爬蟲智能翻頁批量下載文件的實例詳解》,本文關鍵詞  python,爬蟲,智能,翻頁,批量,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python爬蟲智能翻頁批量下載文件的實例詳解》相關的同類信息!
  • 本頁收集關于python爬蟲智能翻頁批量下載文件的實例詳解的相關信息資訊供網民參考!
  • 推薦文章
    欧美电影免费看大全| 国产麻豆精品高清在线播放| 99久久精品国产国产毛片| 尤物视频网站在线观看| 亚洲天堂在线播放| 久久久成人网| 成人a级高清视频在线观看| 99色视频在线观看| 日韩在线观看视频网站| 精品国产一区二区三区精东影业| 国产不卡在线看| 91麻豆国产| 亚洲爆爽| 欧美国产日韩一区二区三区| 亚洲精品永久一区| 99热视热频这里只有精品| 可以免费在线看黄的网站| 日韩在线观看免费完整版视频| 夜夜操天天爽| 久久福利影视| 日韩中文字幕在线播放| 日韩中文字幕在线播放| 一级女性全黄久久生活片| 国产一区二区精品尤物| 97视频免费在线观看| 国产一区免费在线观看| 色综合久久天天综线观看| 亚洲天堂在线播放| 999精品在线| 国产成人女人在线视频观看| 成人高清视频免费观看| 精品视频一区二区三区| 国产91精品一区二区| 成人免费观看男女羞羞视频| 国产伦精品一区二区三区无广告| 一级毛片视频播放| 欧美大片a一级毛片视频| 国产亚洲免费观看| 国产麻豆精品| 久久福利影视| 欧美日本免费| 99色视频在线| 美女免费黄网站| 日韩综合| 欧美激情一区二区三区在线播放 | 91麻豆国产福利精品| 国产麻豆精品| 日本在线播放一区| 国产91精品系列在线观看| 日韩欧美一二三区| 日本伦理黄色大片在线观看网站| 亚欧乱色一区二区三区| 日韩中文字幕一区| 国产综合成人观看在线| 青青青草视频在线观看| 免费国产在线观看不卡| 日韩在线观看视频网站| 亚洲天堂免费| 精品在线观看国产| 欧美大片毛片aaa免费看| 欧美日本免费| 99久久视频| 欧美a级大片| a级精品九九九大片免费看| 国产a视频| 999精品视频在线| 成人免费网站久久久| 99久久精品国产高清一区二区| 国产精品自拍在线观看| 精品国产亚洲人成在线| 免费国产一级特黄aa大片在线| 国产视频一区二区在线观看| a级毛片免费观看网站| 天堂网中文字幕| 精品视频在线看| 欧美激情一区二区三区在线| 国产高清视频免费观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美国产日韩在线| 午夜在线亚洲男人午在线| 色综合久久手机在线| 91麻豆精品国产高清在线| 毛片成人永久免费视频| 中文字幕97| 天天做日日爱| 欧美另类videosbestsex高清 | a级毛片免费观看网站| 国产福利免费视频| 青青久久网| 日韩av成人| 欧美激情一区二区三区在线 | 天堂网中文字幕| 香蕉视频亚洲一级| 精品视频免费在线| 韩国三级视频网站| 欧美另类videosbestsex视频| 久久精品免视看国产明星| 国产精品自拍亚洲| 日韩中文字幕在线观看视频| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 高清一级做a爱过程不卡视频| 免费国产在线观看| 久久成人性色生活片| 精品视频一区二区三区| 国产国产人免费视频成69堂| 日韩avdvd| 麻豆网站在线看| 成人影视在线播放| 国产麻豆精品免费视频| 天堂网中文字幕| 日韩免费片| 成人免费观看网欧美片| 国产视频久久久久| 亚洲精品影院| 日韩av成人| 99久久精品国产片| 日本在线不卡视频| 九九久久国产精品| 九九热国产视频| 国产网站麻豆精品视频| 日韩一级黄色片| 欧美一区二区三区性| 日韩av片免费播放| 欧美a级片视频| 久久成人亚洲| 国产一区免费在线观看| 国产高清在线精品一区a| 精品国产一区二区三区久久久狼 | 国产一区免费在线观看| 日韩一级精品视频在线观看| 色综合久久手机在线| 欧美a级片视频| 国产亚洲免费观看| 可以免费看毛片的网站| 国产视频一区二区三区四区| 一级女人毛片人一女人| 亚洲精品影院一区二区| 国产不卡在线观看| 精品视频在线看 | 免费毛片播放| 日韩女人做爰大片| 国产a免费观看| 91麻豆精品国产自产在线| 日本特黄特色aa大片免费| 国产一区免费在线观看| 日本免费看视频| 你懂的在线观看视频| 日本伦理片网站| 夜夜操网| 成人免费福利片在线观看| 黄视频网站在线观看| 免费毛片播放| 可以免费在线看黄的网站| 日韩字幕在线| 成人a大片在线观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 91麻豆国产| 亚洲精品影院久久久久久| 国产不卡在线播放| 精品视频一区二区三区免费| 你懂的日韩| 91麻豆精品国产片在线观看| 97视频免费在线| 成人高清免费| 中文字幕Aⅴ资源网| 精品国产一区二区三区久久久狼 | 青青久热| 一a一级片| 久久久久久久男人的天堂| 国产福利免费视频| 欧美另类videosbestsex高清| 欧美1区| 久草免费资源| 九九久久99| 国产激情一区二区三区| 国产精品自拍一区| 成人在免费观看视频国产| 日韩中文字幕一区| 九九精品久久久久久久久| 久久久成人网| 欧美另类videosbestsex高清| 日本伦理黄色大片在线观看网站| 成人免费观看的视频黄页| 亚洲女初尝黑人巨高清在线观看| 欧美激情一区二区三区在线| 欧美1卡一卡二卡三新区| 青青久久精品国产免费看| 中文字幕Aⅴ资源网| 久久久久久久网| 日本免费看视频| 国产伦精品一区三区视频 | 精品视频在线观看一区二区三区| 成人免费一级毛片在线播放视频| 免费毛片播放| 可以免费看毛片的网站| 免费国产在线观看| 999精品视频在线| 久久99中文字幕| 成人免费福利片在线观看| 高清一级片|