亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > Python爬蟲之爬取某文庫文檔數據

Python爬蟲之爬取某文庫文檔數據

熱門標簽:房產電銷外呼系統 地圖標注微信發送位置不顯示 南京銷售外呼系統軟件 浙江電銷卡外呼系統好用嗎 蓋州市地圖標注 上海機器人外呼系統哪家好 315電話機器人廣告 地圖制圖標注位置改變是移位嗎 地圖標注的意義點

一、基本開發環境

Python 3.6

Pycharm

二、相關模塊的使用

import os
import requests
import time
import re
import json
from docx import Document
from docx.shared import Cm

安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。

三、目標網頁分析

網站的文檔內容,都是以圖片形式存在的。它有自己的數據接口

接口鏈接:

https://openapi.book118.com/getPreview.html?project_id=1aid=272112230t=f2c66902d6b63726d8e08b557fef90fbview_token=SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1page=1callback=jQuery18304186406662159248_1614492889385_=1614492889486

接口的請求參數

四、整體思路

  • 請求網頁返回response數據(字符串)
  • 通過re模塊匹配提取中間的數據(列表)索引取0(字符串)
  • 通過json模塊是把提取出來的數據轉換成json模塊
  • 通過遍歷獲取每張圖片的url地址
  • 保存圖片到本地文件夾
  • 把圖片保存到word文檔
  • 爬蟲代碼實現

五、爬蟲代碼實現

def download():
    content = 0
    for page in range(1, 96, 6):
        # 給定 2秒延時
        time.sleep(2)
        # 獲取時間戳
        now_time = int(time.time() * 1000)
        url = 'https://openapi.book118.com/getPreview.html'
        # 請求參數
        params = {
            'project_id': '1',
            'aid': '272112230',
            't': 'f2c66902d6b63726d8e08b557fef90fb',
            'view_token': 'SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1',
            'page': f'{page}',
            '_': now_time,
        }
        # 請求頭
        headers = {
            'Host': 'openapi.book118.com',
            'Referer': 'https://max.book118.com/html/2020/0427/8026036013002110.shtm',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
        }
        response = requests.get(url=url, params=params, headers=headers)
        # 使用正則表達式提取內容
        result = re.findall('jsonpReturn\((.*?)\)', response.text)[0]
        # 字符串轉json數據
        json_data = json.loads(result)['data']
        # 字典值的遍歷
        for value in json_data.values():
            content += 1
            # 拼接圖片url
            img_url = 'http:' + value
            print(img_url)
            headers_1 = {
                'Host': 'view-cache.book118.com',
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
            }
            # 請求圖片url地址 獲取content二進制數據
            img_content = requests.get(url=img_url, headers=headers_1).content
            # 文件名
            img_name = str(content) + '.jpg'
            # 保存路徑
            filename = 'img\\'
            # 以二進制方式保存 (圖片、音頻、視頻等文件都是以二進制的方式保存)
            with open(filename + img_name, mode='wb') as f:
                f.write(img_content)

注意點:

1、一定要給延時,不然后面接口數據會請求不到。

2、請求圖片url的時候headers參數需要寫完整,否則保存圖片是無法打開的

3、命名最好是給定數字,1.jpg、2.jpg 這樣,方便后續保存到word

爬蟲部分的代碼還是比較簡單的,沒有什么特別的難度。

爬取這些文檔,都是需要打印或者查詢所以要把這些單張的圖片都保存到word文檔里面。

六、寫入文檔

def save_picture():
    document = Document()
    path = './img/'
    lis = os.listdir(path)
    c = []
    for li in lis:
        index = li.replace('.jpg', '')
        c.append(index)
    c_1 = sorted(list(map(int, c)))
    print(c_1)
    new_files = [(str(i) + '.jpg') for i in c_1]
    for num in new_files:
        img_path = path + num
        document.add_picture(img_path, width=Cm(17), height=Cm(24))
        document.save('tu.doc')  # 保存文檔
        os.remove(img_path)  # 刪除保存在本地的圖片

到此這篇關于Python爬蟲之爬取某文庫文檔數據的文章就介紹到這了,更多相關python爬取文檔數據內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python爬取股票信息,并可視化數據的示例
  • Python爬取數據并實現可視化代碼解析
  • python如何爬取網站數據并進行數據可視化
  • 高考要來啦!用Python爬取歷年高考數據并分析
  • 單身狗福利?Python爬取某婚戀網征婚數據
  • Python爬蟲之自動爬取某車之家各車銷售數據
  • Python爬蟲之爬取2020女團選秀數據
  • python爬蟲之教你如何爬取地理數據
  • Python爬蟲實戰之爬取京東商品數據并實實現數據可視化

標簽:雙鴨山 貴州 陽泉 克拉瑪依 赤峰 臨汾 日照 金華

巨人網絡通訊聲明:本文標題《Python爬蟲之爬取某文庫文檔數據》,本文關鍵詞  Python,爬蟲,之爬,取某,文庫,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲之爬取某文庫文檔數據》相關的同類信息!
  • 本頁收集關于Python爬蟲之爬取某文庫文檔數據的相關信息資訊供網民參考!
  • 推薦文章
    欧美a级片免费看| 你懂的日韩| 久久国产精品只做精品| 日本在线不卡免费视频一区| 日韩在线观看网站| 国产成人精品综合| 成人免费观看视频| 国产美女在线观看| 99久久精品国产国产毛片| a级毛片免费全部播放| 精品视频在线观看一区二区三区| 国产高清在线精品一区a| 欧美另类videosbestsex高清 | 久久国产一久久高清| 日韩专区亚洲综合久久| 美女免费精品视频在线观看| 精品国产三级a∨在线观看| 日韩综合| 欧美1区2区3区| 亚洲精品中文字幕久久久久久| 可以在线看黄的网站| 亚洲精品中文字幕久久久久久| 天天色色色| 日韩女人做爰大片| 黄色免费三级| 香蕉视频久久| 一级女性大黄生活片免费| 国产a毛片| 你懂的日韩| 欧美大片毛片aaa免费看| 国产一区二区福利久久| 韩国毛片免费| a级精品九九九大片免费看| 国产伦久视频免费观看视频| 日韩一级黄色大片| 国产精品1024在线永久免费| 99久久网站| 日本特黄特黄aaaaa大片| 毛片高清| 精品国产一级毛片| 99色播| 免费国产在线观看| 精品视频在线观看视频免费视频| 久久精品人人做人人爽97| 一级片片| 999久久狠狠免费精品| 999久久狠狠免费精品| 久久精品大片| 日本免费看视频| 国产亚洲精品aaa大片| 午夜在线亚洲男人午在线| a级黄色毛片免费播放视频| 香蕉视频一级| 国产a视频精品免费观看| 999精品视频在线| 色综合久久天天综合绕观看| 精品国产香蕉伊思人在线又爽又黄| 一本高清在线| 国产成人精品综合在线| 日韩综合| 国产福利免费观看| 国产伦久视频免费观看 视频| 国产伦精品一区二区三区无广告 | 成人免费观看视频| 亚欧乱色一区二区三区| 久久国产影院| 国产成人精品综合| 免费的黄色小视频| 精品视频在线看| 青草国产在线观看| 国产精品自拍亚洲| 四虎久久影院| 国产福利免费视频| 日本免费乱人伦在线观看| 亚洲 男人 天堂| 精品久久久久久免费影院| 久久国产精品自线拍免费| 一级毛片视频免费| 亚欧成人乱码一区二区| 99色视频在线| 欧美激情在线精品video| 国产网站免费视频| 四虎影视久久久| 一级女性全黄生活片免费| 亚欧乱色一区二区三区| 欧美大片aaaa一级毛片| 青青青草视频在线观看| 精品在线观看国产| 精品视频一区二区三区免费| 精品国产香蕉在线播出| 天天做日日爱| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | a级毛片免费全部播放| 欧美日本免费| 成人免费观看视频| 91麻豆精品国产片在线观看| 九九干| 91麻豆国产福利精品| 国产国语对白一级毛片| a级精品九九九大片免费看| 国产激情一区二区三区| 精品国产亚洲一区二区三区| 久久国产一久久高清| 精品久久久久久影院免费| 日本伦理网站| 黄视频网站免费观看| 欧美大片毛片aaa免费看| 91麻豆精品国产自产在线观看一区| 国产成人啪精品| 欧美大片aaaa一级毛片| 国产一区二区精品久久91| 四虎影视库| 成人a级高清视频在线观看| 999精品影视在线观看| 成人在免费观看视频国产| 99热精品一区| 深夜做爰性大片中文| 二级片在线观看| 91麻豆精品国产片在线观看 | 国产美女在线观看| 国产成人精品综合| 欧美大片a一级毛片视频| 一级女人毛片人一女人| 久久精品欧美一区二区| 午夜在线亚洲男人午在线| 四虎论坛| 国产一级生活片| 黄视频网站免费| 欧美另类videosbestsex久久| 色综合久久天天综合绕观看| 毛片电影网| 久久精品欧美一区二区| 99热精品一区| 国产a毛片| 国产成人精品综合久久久| 精品久久久久久综合网| 国产麻豆精品| 一级毛片看真人在线视频| 精品国产亚一区二区三区| 欧美一级视| 麻豆午夜视频| 99久久精品国产麻豆| 精品视频在线观看免费| 四虎影视久久| 午夜在线亚洲| 九九精品影院| 国产伦精品一区三区视频| 欧美一级视频免费| 精品国产一区二区三区免费 | 二级片在线观看| 国产欧美精品午夜在线播放| 欧美日本免费| 一级片片| 高清一级淫片a级中文字幕| 精品久久久久久中文| 日韩在线观看免费完整版视频| 欧美激情一区二区三区在线播放 | 台湾毛片| 韩国三级香港三级日本三级la | 日韩av东京社区男人的天堂| 国产一区二区精品久久| 日韩女人做爰大片| 黄色福利片| 国产综合成人观看在线| 九九免费精品视频| 天天做日日爱夜夜爽| 夜夜操天天爽| 成人免费观看视频| 中文字幕97| 欧美国产日韩精品| 成人免费福利片在线观看| 九九九网站| 韩国三级一区| 青青青草影院| 成人在免费观看视频国产| 青青久久国产成人免费网站| 成人a大片在线观看| 999精品在线| 国产麻豆精品高清在线播放| 日韩字幕在线| 国产国语对白一级毛片| 国产韩国精品一区二区三区| 欧美a免费| 国产原创中文字幕| 国产91精品系列在线观看| 国产成人精品综合| 午夜在线亚洲男人午在线| 国产亚洲免费观看| 天天做人人爱夜夜爽2020毛片| 九九精品影院| 午夜欧美成人香蕉剧场| 99色播| 成人a大片在线观看| 亚久久伊人精品青青草原2020| 沈樵在线观看福利| 国产原创中文字幕| 美女被草网站| 一级片片| 国产美女在线一区二区三区| 亚洲天堂免费观看|