亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > scrapy+flask+html打造搜索引擎的示例代碼

scrapy+flask+html打造搜索引擎的示例代碼

熱門標簽:西青語音電銷機器人哪家好 南昌地圖標注 百應電話機器人總部 電梯新時達系統外呼顯示e 旅游廁所地圖標注怎么弄 地圖標注與注銷 成都呼叫中心外呼系統哪家強 宿州電話機器人哪家好 無錫智能外呼系統好用嗎

1.預備知識

python語言,scrapy爬蟲基礎,json模塊,flask后端

2.抓取CSDN數據接口

使用谷歌抓包工具抓取CSDN搜索引擎的接口

2.1 查看CSDN搜索引擎主頁

查看CSDN搜索引擎主頁https://so.csdn.net/,截圖如下:

2.2測試CSDN搜索引擎的功能

測試CSDN搜索引擎的功能,嘗試輸入參數之后,查看返回的文章信息列表,測試如下:


經過測試發現,CSDN搜索引擎的主要功能是,搜索所有跟python有關的文章,然后根據文章熱度,點贊量,留言數進行一個綜合排序,展示給用戶排序后的文章結果。這樣來說,我們的主要任務就是利用抓包抓取到前后端傳輸數據的接口,通過接口,來實現整個搜索引擎的效果。

2.3查看更多相關文章的信息

讓我們把前端滑輪移到最后,發現并沒有頁數的標簽,而是通過自動加載數據來呈現,效果如下:



在不刷新整個頁面的基礎上加載新的數據,這很容易讓我們聯想到ajax異步請求。
異步請求通常就是利用ajax技術,能在不更新整個頁面的前提下維護數據。這使得Web應用程序更為迅捷地回應用戶動作,并避免了在網絡上發送那些沒有改變的信息。
接下來我們嘗試利用谷歌瀏覽器抓取異步請求的信息。

2.4抓取ajax異步請求數據

使用谷歌瀏覽器抓取ajax異步請求數據
為了避免干擾因素,我們在抓包前需要點擊clear按鈕,清空當前的抓包記錄


將滑塊移動到最后,使前端頁面自動加載數據,分析數據加載時抓取到的數據包信息。通過多次分析驗證,發現結果有一個get請求攜帶著大量的刷新時的數據。如下圖所示:


是JSON格式的數據,這里簡單介紹一下JSON格式的數據。
JSON 是前后端傳輸數據最常見的用法之一,是從 web 服務器上讀取 JSON 數據(作為文件或作為 HttpRequest),將 JSON 數據轉換為 JavaScript 對象,然后在網頁中使用該數據。
通過分析,我們可以發現數據是存放在result_vos列表下的各個字典中的,我們可以使用循環,然后通過dict[“xxx”]的方式來提取數據。

2.5 分析url地址


我們發現這個GET請求攜帶了大量的未知參數,通過經驗分析,以及英語首字母,我們可以猜測P是page(頁),Q是query(查詢)的意思,其他xxx=-1應該是默認值,我們暫時按照這個猜測進行刪減參數。
測試結果截圖:


通過測試,發現猜測正確,只保留了q、t、p三個參數,依然可以訪問到傳輸的數據內容(事實上,這里t參數也可以刪除,同學們可以自行測試)
這樣,這條url對應的重要參數都分析出來了,鏈接如下:
https://so.csdn.net/api/v3/search?q=pythont=allp=2
跟我們猜測的一樣,q是代表查詢,p是代表page,這樣我們已經獲取到CSDN引擎的核心API,我們可以通過這條API來實現搜索引擎的功能。
至此,抓包分析過程結束。

3. 使用scrapy爬取CSDN數據接口

3.1 start_requests

使用start_requests函數進行構造20頁的url列表。
這里start_requests方法必須返回一個可迭代對象(iterable)。該對象包含了spider用于抓取的第一個Request。
當spider開始抓取并且未指定start_urls時,該方法將會被調用。該方法僅僅會被scrapy調用一次,因此可以將其實現為url生成器。
使用scrapy.Request可以發送一個GET請求,傳送到指定的函數進行處理。
詳細代碼操作如下:

 # 重寫start_urls的方法
    def start_requests(self):
        # 這里是控制CSDN的文章類型
        input_text = input('請輸入要爬取的CSDN類型:')
        # 是控制爬取文章頁數
        for i in range(1,31):
            start_url = 'https://so.csdn.net/api/v3/search?q={}p={}'.format(input_text,i)
            yield scrapy.Request(
                url=start_url,
                callback=self.parse
            )

3.2使用parse函數提取數據

這里需要掌握幾個重要的方法應用

  • response.text 請求返回的響應的字符串格式的數據
  • json.loads() loads方法是將str轉化為dict格式數據
  • json.dumps() dumps方法是將dict格式的數據轉化為str

具體代碼操作如下:

data_dict = json.loads(response.text)

使用循環遍歷json數據中的各個具體直播間數據的信息,新建一個item字典進行數據存儲,然后使用yield傳遞給引擎進行相應的處理
代碼操作如下:

def parse(self, response):
   # response.request.headers
   print(response.request.headers)
   data_dict = json.loads(response.text)
    for data in data_dict['result_vos']:
            item = {}
         # 標題
         item['title'] = data['title'].replace('em>','').replace('/em>','')
         # 作者
         item['author_label'] = data['nickname']
         # 瀏覽量
         item['view'] = data['view']
         # 點贊量
         item['zan'] = data['digg']
         # 地址鏈接
         item['link_url'] = data['url']

3.3保存成CSV文件

import csv
定義csv文件需要的列標題
headers = ['title','author_label','view','zan','jianjie' ,'link_url']
每次調用pipline的時候,都會運行一遍
class Day02Pipeline:
    def process_item(self, item, spider):
        文件默認保存到當前目錄下的douyu.csv中
這里a是追加操作
        with open('csdn.csv', 'a', encoding='utf-8', newline='') as fa:
            保存headers規定的列名內容
            writer = csv.DictWriter(fa, headers)
            writer.writerow(item)
            print(item)
      return item

3.4 運行結果

最后,我們來查看一下運行結果,以及保存好的csv文件
終端運行結果如下:



至此,爬蟲實驗結束。

4. 效果展示

4.1 flask后端展示

搭建過程略
(入門級搭建,沒有用企業級開發流程,后期可以考慮出flask的教程)
展示結構如下:


flask入門可自行百度

4.2 效果展示


點擊搜索后:


左上角的搜索頁面是入口頁面。

好了,這樣簡易版的搜索引擎就搭建好了。更多相關scrapy+flask+html搜索引擎內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Mysql實現簡易版搜索引擎的示例代碼
  • MySQL全文索引實現簡單版搜索引擎實例代碼
  • 詳細介紹基于MySQL的搜索引擎MySQL-Fullltext
  • python基于搜索引擎實現文章查重功能
  • Python實戰之手寫一個搜索引擎
  • Python大批量搜索引擎圖像爬蟲工具詳解
  • 360搜索引擎自動收錄php改寫方案
  • php記錄搜索引擎爬行記錄的實現代碼
  • Python無損音樂搜索引擎實現代碼
  • 基于 Mysql 實現一個簡易版搜索引擎

標簽:辛集 雅安 濰坊 許昌 渭南 贛州 七臺河 西安

巨人網絡通訊聲明:本文標題《scrapy+flask+html打造搜索引擎的示例代碼》,本文關鍵詞  scrapy+flask+html,打造,搜索引擎,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《scrapy+flask+html打造搜索引擎的示例代碼》相關的同類信息!
  • 本頁收集關于scrapy+flask+html打造搜索引擎的示例代碼的相關信息資訊供網民參考!
  • 推薦文章
    久久国产一久久高清| 国产一区精品| 国产成+人+综合+亚洲不卡| 精品视频一区二区三区免费| 美女免费精品高清毛片在线视| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 中文字幕Aⅴ资源网| 精品视频在线观看一区二区| 精品国产三级a| 国产一区二区高清视频| 欧美爱色| 欧美爱色| 韩国三级一区| 你懂的福利视频| 成人a大片在线观看| 91麻豆精品国产自产在线观看一区| 久久国产一久久高清| 国产精品免费久久| 国产亚洲精品成人a在线| 国产一区二区精品久久91| 精品视频一区二区| 黄色福利| 欧美激情影院| 精品视频一区二区三区免费| 国产视频一区二区在线播放| 亚洲 激情| 日本特黄特色aa大片免费| 麻豆系列国产剧在线观看| 精品国产一区二区三区久| 99久久网站| 日本特黄特黄aaaaa大片| 色综合久久天天综合绕观看| 国产亚洲精品成人a在线| 欧美另类videosbestsex久久| 久久成人亚洲| 欧美激情影院| 青青久久精品| 999久久66久6只有精品| 日韩av成人| 久久99中文字幕| 精品视频一区二区| 深夜做爰性大片中文| 亚洲第一视频在线播放| 国产一区二区精品久久91| 韩国三级一区| 韩国三级视频网站| 日韩一级黄色| 国产不卡在线观看视频| 国产亚洲男人的天堂在线观看| 日本在线播放一区| 四虎论坛| 亚欧乱色一区二区三区| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 日韩一级黄色| 日韩在线观看免费完整版视频| 成人高清免费| 日本伦理片网站| 日韩在线观看视频免费| 亚洲精品永久一区| 国产视频久久久久| 欧美激情一区二区三区在线播放| 天天做人人爱夜夜爽2020毛片| 欧美国产日韩一区二区三区| 成人影视在线播放| 九九精品在线| 国产91精品一区二区| 日韩免费在线视频| 久久99这里只有精品国产| 中文字幕Aⅴ资源网| 高清一级毛片一本到免费观看| 免费的黄视频| 久久精品欧美一区二区| 精品在线视频播放| 国产精品自拍亚洲| 国产国产人免费视频成69堂| 999久久久免费精品国产牛牛| 久久99中文字幕| 午夜激情视频在线观看| 台湾毛片| 美女免费精品高清毛片在线视| 国产91精品一区二区| 国产网站免费| 欧美一级视| 免费的黄视频| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 亚飞与亚基在线观看| 欧美一级视频免费观看| 国产一区二区精品在线观看| 国产精品自拍在线观看| 国产a毛片| 国产亚洲男人的天堂在线观看| 欧美国产日韩一区二区三区| 九九久久99综合一区二区| 国产一区二区精品在线观看| 亚洲精品中文字幕久久久久久| 国产精品免费久久| 久久精品免视看国产成人2021| 在线观看成人网 | 午夜在线影院| 精品视频一区二区三区免费| 欧美激情一区二区三区视频高清| 日本在线不卡视频| 国产91精品系列在线观看| 九九久久国产精品大片| 欧美激情中文字幕一区二区| 日韩av成人| 91麻豆精品国产自产在线观看一区| 免费国产在线视频| 日韩av片免费播放| 九九热国产视频| 免费国产在线视频| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 精品久久久久久中文字幕一区 | 精品视频一区二区| 成人免费一级纶理片| 亚飞与亚基在线观看| 午夜家庭影院| 精品国产一区二区三区精东影业 | 天天做日日爱夜夜爽| 91麻豆精品国产片在线观看| 久草免费在线视频| 青青青草影院 | 欧美日本二区| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 一级毛片视频免费| 四虎影视库| 日本在线不卡视频| 精品视频在线观看免费| 欧美另类videosbestsex久久| 欧美大片一区| 成人影院一区二区三区| 台湾毛片| 久久国产精品永久免费网站| 亚洲www美色| 四虎论坛| 亚洲第一色在线| 美女免费精品高清毛片在线视| 九九久久99综合一区二区| 中文字幕一区二区三区 精品| 精品国产亚一区二区三区| 欧美日本免费| 成人影院一区二区三区| 天堂网中文字幕| 中文字幕Aⅴ资源网| 久草免费在线观看| 可以免费看毛片的网站| 久久久久久久网| 日韩中文字幕在线观看视频| 免费国产在线视频| 毛片高清| 高清一级毛片一本到免费观看| 99久久网站| 国产美女在线一区二区三区| 九九精品久久| 黄视频网站在线免费观看| 国产麻豆精品视频| 亚欧乱色一区二区三区| 高清一级毛片一本到免费观看| 999久久66久6只有精品| 国产精品1024在线永久免费| 免费一级生活片| 中文字幕一区二区三区精彩视频| 国产福利免费视频| 中文字幕Aⅴ资源网| 91麻豆国产福利精品| 91麻豆精品国产自产在线观看一区| 午夜家庭影院| 欧美1区| 日本在线不卡视频| 国产麻豆精品视频| 黄色免费三级| 国产网站免费在线观看| 国产国语在线播放视频| 深夜做爰性大片中文| 欧美一区二区三区性| 久久成人亚洲| 91麻豆精品国产片在线观看| 欧美激情一区二区三区视频高清| 日韩av片免费播放| 日韩免费片| 日日日夜夜操| 国产一区二区高清视频| 国产不卡在线观看视频| 成人免费网站久久久| 一级女性全黄久久生活片| 999精品视频在线| 成人影视在线播放| 国产综合91天堂亚洲国产| 青青青草视频在线观看| 中文字幕一区二区三区 精品| 久久久成人网| 国产成人精品综合久久久| 天堂网中文字幕| 久久精品欧美一区二区| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美大片一区| 可以免费看毛片的网站| 欧美a级大片| 99热精品在线| 国产美女在线一区二区三区|
    • <ins id="t74b6"><ul id="t74b6"><ins id="t74b6"></ins></ul></ins>