亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > Python爬蟲之爬取某文庫文檔數據

Python爬蟲之爬取某文庫文檔數據

熱門標簽:房產電銷外呼系統 地圖標注微信發送位置不顯示 南京銷售外呼系統軟件 浙江電銷卡外呼系統好用嗎 蓋州市地圖標注 上海機器人外呼系統哪家好 315電話機器人廣告 地圖制圖標注位置改變是移位嗎 地圖標注的意義點

一、基本開發環境

Python 3.6

Pycharm

二、相關模塊的使用

import os
import requests
import time
import re
import json
from docx import Document
from docx.shared import Cm

安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。

三、目標網頁分析

網站的文檔內容,都是以圖片形式存在的。它有自己的數據接口

接口鏈接:

https://openapi.book118.com/getPreview.html?project_id=1aid=272112230t=f2c66902d6b63726d8e08b557fef90fbview_token=SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1page=1callback=jQuery18304186406662159248_1614492889385_=1614492889486

接口的請求參數

四、整體思路

  • 請求網頁返回response數據(字符串)
  • 通過re模塊匹配提取中間的數據(列表)索引取0(字符串)
  • 通過json模塊是把提取出來的數據轉換成json模塊
  • 通過遍歷獲取每張圖片的url地址
  • 保存圖片到本地文件夾
  • 把圖片保存到word文檔
  • 爬蟲代碼實現

五、爬蟲代碼實現

def download():
    content = 0
    for page in range(1, 96, 6):
        # 給定 2秒延時
        time.sleep(2)
        # 獲取時間戳
        now_time = int(time.time() * 1000)
        url = 'https://openapi.book118.com/getPreview.html'
        # 請求參數
        params = {
            'project_id': '1',
            'aid': '272112230',
            't': 'f2c66902d6b63726d8e08b557fef90fb',
            'view_token': 'SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1',
            'page': f'{page}',
            '_': now_time,
        }
        # 請求頭
        headers = {
            'Host': 'openapi.book118.com',
            'Referer': 'https://max.book118.com/html/2020/0427/8026036013002110.shtm',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
        }
        response = requests.get(url=url, params=params, headers=headers)
        # 使用正則表達式提取內容
        result = re.findall('jsonpReturn\((.*?)\)', response.text)[0]
        # 字符串轉json數據
        json_data = json.loads(result)['data']
        # 字典值的遍歷
        for value in json_data.values():
            content += 1
            # 拼接圖片url
            img_url = 'http:' + value
            print(img_url)
            headers_1 = {
                'Host': 'view-cache.book118.com',
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
            }
            # 請求圖片url地址 獲取content二進制數據
            img_content = requests.get(url=img_url, headers=headers_1).content
            # 文件名
            img_name = str(content) + '.jpg'
            # 保存路徑
            filename = 'img\\'
            # 以二進制方式保存 (圖片、音頻、視頻等文件都是以二進制的方式保存)
            with open(filename + img_name, mode='wb') as f:
                f.write(img_content)

注意點:

1、一定要給延時,不然后面接口數據會請求不到。

2、請求圖片url的時候headers參數需要寫完整,否則保存圖片是無法打開的

3、命名最好是給定數字,1.jpg、2.jpg 這樣,方便后續保存到word

爬蟲部分的代碼還是比較簡單的,沒有什么特別的難度。

爬取這些文檔,都是需要打印或者查詢所以要把這些單張的圖片都保存到word文檔里面。

六、寫入文檔

def save_picture():
    document = Document()
    path = './img/'
    lis = os.listdir(path)
    c = []
    for li in lis:
        index = li.replace('.jpg', '')
        c.append(index)
    c_1 = sorted(list(map(int, c)))
    print(c_1)
    new_files = [(str(i) + '.jpg') for i in c_1]
    for num in new_files:
        img_path = path + num
        document.add_picture(img_path, width=Cm(17), height=Cm(24))
        document.save('tu.doc')  # 保存文檔
        os.remove(img_path)  # 刪除保存在本地的圖片

到此這篇關于Python爬蟲之爬取某文庫文檔數據的文章就介紹到這了,更多相關python爬取文檔數據內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python爬取股票信息,并可視化數據的示例
  • Python爬取數據并實現可視化代碼解析
  • python如何爬取網站數據并進行數據可視化
  • 高考要來啦!用Python爬取歷年高考數據并分析
  • 單身狗福利?Python爬取某婚戀網征婚數據
  • Python爬蟲之自動爬取某車之家各車銷售數據
  • Python爬蟲之爬取2020女團選秀數據
  • python爬蟲之教你如何爬取地理數據
  • Python爬蟲實戰之爬取京東商品數據并實實現數據可視化

標簽:雙鴨山 貴州 陽泉 克拉瑪依 赤峰 臨汾 日照 金華

巨人網絡通訊聲明:本文標題《Python爬蟲之爬取某文庫文檔數據》,本文關鍵詞  Python,爬蟲,之爬,取某,文庫,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲之爬取某文庫文檔數據》相關的同類信息!
  • 本頁收集關于Python爬蟲之爬取某文庫文檔數據的相關信息資訊供網民參考!
  • 推薦文章
    国产不卡精品一区二区三区| 四虎影视库国产精品一区| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 久久精品人人做人人爽97| a级黄色毛片免费播放视频| 日韩中文字幕一区| 午夜欧美福利| 国产国产人免费视频成69堂| 精品在线观看国产| 一级片片| 夜夜操天天爽| 精品国产一区二区三区国产馆| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 深夜做爰性大片中文| 91麻豆精品国产高清在线| 日韩中文字幕在线观看视频| 成人免费一级纶理片| 麻豆网站在线免费观看| 色综合久久天天综合| 国产不卡精品一区二区三区| 九九免费精品视频| 国产视频一区二区三区四区| 亚久久伊人精品青青草原2020| 日本在线www| 韩国毛片基地| a级精品九九九大片免费看| 国产伦精品一区二区三区在线观看| 天天做日日爱夜夜爽| 欧美日本韩国| 日韩字幕在线| 99久久精品国产片| 一级毛片视频免费| 欧美大片a一级毛片视频| 国产麻豆精品| 国产不卡福利| 午夜激情视频在线播放| 国产麻豆精品| 免费毛片播放| 国产91精品一区| 欧美爱爱动态| 日本伦理片网站| 亚洲第一视频在线播放| 欧美a级片视频| 999久久狠狠免费精品| 国产成人欧美一区二区三区的| 久久久久久久网| 国产精品12| 午夜久久网| 青青青草影院| 精品在线视频播放| 成人a大片在线观看| 99色视频在线观看| 国产不卡在线播放| 成人免费网站视频ww| 亚洲 国产精品 日韩| 国产美女在线观看| 亚洲天堂免费观看| 亚洲 国产精品 日韩| 久久精品大片| 成人高清免费| 国产不卡高清在线观看视频| 日本免费乱理伦片在线观看2018| 国产一区二区精品久久| 精品视频免费在线| 欧美另类videosbestsex高清| 国产美女在线一区二区三区| 国产91丝袜在线播放0| 天天色色色| 国产91精品一区二区| 美女免费毛片| 午夜欧美福利| 久草免费在线色站| 国产精品1024永久免费视频 | 成人影院一区二区三区| 高清一级片| 国产成人女人在线视频观看| 999精品在线| 精品在线观看国产| 国产麻豆精品| 国产网站免费视频| 色综合久久天天综线观看| 一a一级片| 九九久久国产精品| 国产高清在线精品一区二区| 国产麻豆精品免费密入口| 国产91丝袜在线播放0| 国产亚洲免费观看| 999精品在线| 国产伦精品一区三区视频| 精品国产一区二区三区免费| 成人av在线播放| 国产不卡精品一区二区三区| 国产成a人片在线观看视频| 国产麻豆精品视频| 精品久久久久久中文| 日韩一级精品视频在线观看| 亚洲天堂在线播放| 天堂网中文字幕| 欧美一区二区三区性| 国产视频一区二区在线播放| 国产不卡精品一区二区三区| 成人免费一级毛片在线播放视频| 日本伦理网站| 国产网站免费视频| 成人免费一级毛片在线播放视频| 亚久久伊人精品青青草原2020| 黄色免费三级| 黄视频网站免费看| 国产原创视频在线| 91麻豆精品国产高清在线| 国产高清在线精品一区二区| 成人a大片在线观看| 久久久久久久免费视频| 亚欧成人乱码一区二区| a级毛片免费全部播放| 国产精品自拍在线| 91麻豆精品国产综合久久久| 九九精品在线| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 欧美另类videosbestsex| 日韩欧美一及在线播放| 99久久网站| 国产精品1024永久免费视频 | 色综合久久天天综线观看| 99热精品在线| 亚洲第一视频在线播放| 欧美大片aaaa一级毛片| 日韩欧美一二三区| 日本特黄特色aa大片免费| 精品国产三级a∨在线观看| 久草免费在线视频| 精品视频在线看| 黄视频网站在线免费观看| 日韩一级黄色| 四虎久久精品国产| 日本特黄一级| 国产成人啪精品视频免费软件| 国产网站免费| 国产福利免费观看| 国产网站在线| 四虎影视库| 久久国产一久久高清| 91麻豆国产福利精品| 国产不卡在线播放| 精品视频在线观看免费| 精品国产一区二区三区久| 国产不卡精品一区二区三区| 国产极品白嫩美女在线观看看| 国产不卡在线观看| 午夜在线观看视频免费 成人| 亚洲第一页乱| 国产成人女人在线视频观看| 日日日夜夜操| 国产91视频网| 国产不卡高清在线观看视频| 国产成人欧美一区二区三区的| 国产91精品一区| 精品国产一区二区三区免费| 91麻豆精品国产自产在线观看一区| 天堂网中文字幕| 欧美激情伊人| 欧美日本二区| 日本伦理网站| 欧美一区二区三区在线观看| 精品视频一区二区三区免费| 成人免费一级纶理片| 99久久精品国产国产毛片| 欧美大片aaaa一级毛片| 国产激情一区二区三区| 韩国三级视频在线观看| 国产一区二区福利久久| 毛片电影网| 欧美a级成人淫片免费看| 久久精品免视看国产成人2021| 精品视频免费在线| 日本伦理网站| 成人a大片在线观看| 国产精品免费久久| 亚欧视频在线| 成人a大片高清在线观看| 99热热久久| 精品美女| 欧美日本韩国| 一级女性大黄生活片免费| 国产91精品一区| 韩国三级视频网站| 亚洲精品中文一区不卡| 午夜欧美成人久久久久久| 国产不卡在线看| 黄视频网站免费看| 国产不卡福利| 沈樵在线观看福利| 美国一区二区三区| 日本免费乱理伦片在线观看2018| 欧美a级成人淫片免费看| 99久久网站| 999久久66久6只有精品| 精品久久久久久影院免费| 日韩一级黄色| 99久久精品国产高清一区二区|