亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > 教你如何利用Python批量翻譯英文Word文檔并保留格式

教你如何利用Python批量翻譯英文Word文檔并保留格式

熱門標簽:激戰2地圖標注 公司電話機器人 陜西金融外呼系統 哈爾濱ai外呼系統定制 廣告地圖標注app 海南400電話如何申請 白銀外呼系統 騰訊外呼線路 唐山智能外呼系統一般多少錢

一、需求描述

手上有大量外文文檔(本案例以5份為例,分別命名為 test1.docx test2.docx 以此類推),其中一份如下:

基本需求「批量將這些文檔的內容全部翻譯成中文,并轉存到新的文件中」,效果如下:

高級需求:基本需求滿足的同時,要求 「保留原文檔的格式」,效果如下:

二、邏輯梳理

2.1 翻譯 API

本需求的核心是翻譯,策略是利用網絡的翻譯 API,這里推薦百度翻譯開放平臺,不考慮并發數的話可以用標準版,免費使用不限字符量

百度翻譯開放平臺:http://api.fanyi.baidu.com/api/trans/product/index

在使用百度的通用翻譯 API 之前需要完成以下工作:

1.使用百度賬號登錄百度翻譯開放平臺(http://api.fanyi.baidu.com);

2.注冊成為開發者,獲得APPID;

3.進行開發者認證(如僅需標準版可跳過);

4.開通通用翻譯API服務:開通鏈接

5.參考技術文檔和Demo編寫代碼

完成后在個人頁面在即可看到 ID 和密鑰,這個很重要!下面給出整理好的通用翻譯 API 的 demo,已經對輸出做簡單修改,代碼拿走就能用!

可以看到,測試內容準確的被翻譯出來,注意如果需要多次訪問 API,免費版有并發數和時間限制,可以用 time 模塊睡眠一秒

2.2 格式修改

高級需求的難點就是保留格式,簡單來說原文檔的頁面格式和段落格式是什么,翻譯后對應的部分就是什么。

基于上述的邏輯關系,只需要獲取原文檔的對應內容再賦值給新翻譯的文檔即可。(暫時只能滿足頁面設置和段落設置的統一,針對一段中特定詞語的格式修改,保證精確性需要基于自然語言處理NLP,本文暫不涉及)

2.2.1 頁面樣式

頁面樣式只要包括邊距、方向、高度、寬度等等,從原文檔中可以看到,采取的是窄邊距。但我們無需知道窄邊距四個方向應該如何設置,只需要在代碼中呈現新舊文檔的變量傳遞即可,具體如下

2.2.2 段落樣式

段落樣式包括對齊、縮進、間距等等,原文檔中采取了段后縮進,標題是居中對齊。這些設置在變量傳遞中能夠很好完成。如果原文檔中沒有設置的變量值為 None

2.2.3 文字塊樣式修改

對于字號、加粗、斜體、顏色等樣式調整,采取的策略是建立空列表,遍歷原文檔每一段每一個文字塊,獲取相應屬性并放到各自的列表中,對同一段而言,其包含的文字塊屬性最多的選項賦值給翻譯后文檔的對應段落(如同一段全部或大部分的文字是加粗,則翻譯后對應段落所有文字塊均設置為加粗) 對NLP感興趣的讀者可自行嘗試如何高度還原英文文檔中某些特定詞語的樣式修改,并在翻譯后的文檔中體現出來

上面的代碼不包含對字體的設置,因為沒必要把英文的字體傳遞給中文文檔。對中文字體的設置之前的文章有提到過,比較復雜,直接見代碼:

from docx.oxml.ns import qn
 
run.font.name = '微軟雅黑'
r = run._element.rPr.rFonts
r.set(qn('w:eastAsia'), '微軟雅黑')

2.3 整體實現步驟

現在每個部分操作均以完成,考慮到本例中有多個文檔均需要翻譯,故全部邏輯如下:

1.利用 glob 模塊批處理框架可獲取某個文件的絕對路徑

2.由 python-docx 完成 Word 文件實例化后對段落進行解析

3.解析出的段落文本交給百度通用翻譯 API,解析返回的 Json 格式結果(上面的修改 demo 中已經完成了這一步)并重新寫入新的文件

4.同個文件全部解析、翻譯并寫入新文件后保存文件

三、代碼實現

導入需要的模塊,除翻譯 demo 中需要的庫外還需要 glob 庫批量獲取文件、python-docx 讀取文件、time 模塊控制訪問并發。為什么要 os 模塊見下文:

import requests
import random
import json
from hashlib import md5
import time
from docx import Document
import glob
import os

對原 demo 的部分內容進行保留,涉及到 query 參數的代碼需要移動到后面的循環中。保留的部分:

效果如下

獲取到段落文本后,可以將段落文本賦值給 query 參數,調用 API demo 的后續代碼。輸出結果的同時用 add_paragraph 將結果寫入新文檔

最后保存成新文件,期望命名為 原文件名_translated 的形式,可用 os.path.basename 方法獲取并經字符串拼接達到目的:

wordfile_new.save(path + r'\\' + os.path.basename(file)[:-5] + '_translated.docx')

單個文件操作完成后將讀取和創建文件的代碼塊放到批處理框架內:

完成了上面的內容后,基本需求就完成了。根據我們梳理的對樣式的修改知識,再把樣式調整的代碼加進來就行了,最終完整代碼如下:

代碼運行完畢后得到五個新的翻譯后文件

翻譯效果如下,可以看到英文被翻譯成中文,并且樣式大部分保留!

至此,所有文檔都被成功翻譯,當然這是機器翻譯的,具體應用時還需要對關鍵部分進一步人工調整,不過整體來說還是一次成功的Python辦公自動化嘗試!

您可能感興趣的文章:
  • python做翻譯軟件詳解,小白也看得明白
  • 告別網頁搜索!教你用python實現一款屬于自己的翻譯詞典軟件
  • 用 Python 寫的文檔批量翻譯工具效果竟然超出想象
  • python爬蟲之爬取百度翻譯
  • 三大Python翻譯神器再也不用擔心學不好英語

標簽:上海 常德 益陽 黑龍江 惠州 黔西 鷹潭 四川

巨人網絡通訊聲明:本文標題《教你如何利用Python批量翻譯英文Word文檔并保留格式》,本文關鍵詞  教你,如何,利用,Python,批量,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《教你如何利用Python批量翻譯英文Word文檔并保留格式》相關的同類信息!
  • 本頁收集關于教你如何利用Python批量翻譯英文Word文檔并保留格式的相關信息資訊供網民參考!
  • 推薦文章
    日韩中文字幕一区二区不卡| 免费一级片在线观看| 精品视频在线观看一区二区 | 青青久热| 午夜家庭影院| 日韩欧美一及在线播放| 国产一区二区精品久久91| 麻豆系列 在线视频| 精品国产亚洲一区二区三区| 国产成人精品综合| 中文字幕97| 91麻豆精品国产自产在线| 91麻豆精品国产片在线观看| 精品国产亚洲一区二区三区| 色综合久久天天综合观看| 国产麻豆精品| 国产精品12| 成人免费一级纶理片| 亚洲第一页乱| 日本在线www| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 欧美一区二区三区性| 成人高清护士在线播放| 成人免费福利片在线观看| 一级女性全黄久久生活片| 日日日夜夜操| 天天做人人爱夜夜爽2020毛片| 精品在线视频播放| 成人av在线播放| 美女被草网站| 尤物视频网站在线观看| 91麻豆精品国产自产在线| 欧美a级片视频| 精品国产一区二区三区国产馆| 一级片免费在线观看视频| 亚洲女初尝黑人巨高清在线观看| 久久国产精品只做精品| 成人高清免费| 成人a大片在线观看| 亚洲精品中文字幕久久久久久| 999久久久免费精品国产牛牛| 中文字幕一区二区三区 精品| 四虎论坛| 欧美1区| 国产伦精品一区二区三区无广告| 国产精品12| 亚洲www美色| 国产精品1024永久免费视频 | 国产成人精品在线| 九九热国产视频| 国产伦久视频免费观看视频| 日本特黄特黄aaaaa大片| 久久国产精品自由自在| 国产不卡精品一区二区三区| 99色吧| 国产麻豆精品免费密入口| 亚洲第一色在线| 台湾毛片| 精品国产香蕉在线播出 | 黄色免费网站在线| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 国产一级强片在线观看| 韩国毛片 免费| 精品视频在线观看一区二区| 日韩在线观看视频免费| 99热精品在线| 午夜在线亚洲| 欧美国产日韩在线| 九九久久国产精品| 国产精品1024永久免费视频 | 精品视频在线观看一区二区三区| 欧美国产日韩一区二区三区| 欧美激情一区二区三区在线| 亚飞与亚基在线观看| 欧美另类videosbestsex| 青青久久精品国产免费看| 台湾毛片| 一级毛片看真人在线视频| 国产网站免费观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 久久成人综合网| 免费一级片在线| 日本免费看视频| 午夜激情视频在线观看| 欧美激情一区二区三区在线播放 | 欧美激情一区二区三区在线 | 日本伦理网站| 亚洲第一页乱| 天天做日日爱| 精品国产一区二区三区久久久狼| 国产91丝袜在线播放0| 国产一区二区福利久久| 午夜欧美成人香蕉剧场| 国产一区二区精品| 日本在线播放一区| 黄色免费网站在线| 国产伦精品一区二区三区无广告 | 国产一区二区精品| 精品国产一区二区三区精东影业 | 久久国产精品自线拍免费| 国产原创中文字幕| 一级片片| 亚洲精品中文一区不卡| 国产91精品系列在线观看| 色综合久久天天综合| 亚洲天堂免费观看| 九九九国产| 亚洲第一页色| 999精品视频在线| 九九久久国产精品| 天天做日日干| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 黄视频网站免费观看| 国产欧美精品午夜在线播放| 欧美a级片免费看| 美国一区二区三区| 久久国产影视免费精品| 精品国产亚洲一区二区三区| 精品国产一区二区三区久久久蜜臀 | 四虎影视久久久| 免费的黄色小视频| 免费的黄视频| 欧美1区| 香蕉视频久久| 国产a视频| 国产视频一区二区在线播放| 一本高清在线| 久久国产精品自线拍免费| 91麻豆精品国产自产在线观看一区| 韩国三级香港三级日本三级la | 国产网站在线| 999精品影视在线观看| 美女免费毛片| 亚欧乱色一区二区三区| 国产91丝袜高跟系列| 黄视频网站在线看| 久久国产影院| 欧美另类videosbestsex视频| 国产伦理精品| 欧美另类videosbestsex视频| 精品视频在线看| 国产网站免费| 日韩欧美一及在线播放| 色综合久久天天综线观看| 成人免费网站视频ww| 日韩在线观看免费| 免费一级片在线观看| 精品久久久久久综合网| 欧美国产日韩在线| 精品国产香蕉伊思人在线又爽又黄| 精品视频在线观看一区二区| 成人在免费观看视频国产| 欧美另类videosbestsex视频| 欧美国产日韩在线| 九九精品久久| 精品久久久久久综合网| 香蕉视频久久| 日韩综合| 国产国语在线播放视频| 日日日夜夜操| 99热视热频这里只有精品| 国产91丝袜在线播放0| 国产高清在线精品一区a| 国产欧美精品午夜在线播放| 国产网站在线| 精品国产一区二区三区国产馆| 亚洲精品永久一区| 国产高清在线精品一区二区| 黄色福利片| 久草免费在线视频| 国产精品1024在线永久免费| 精品国产一区二区三区免费 | 日本特黄特色aaa大片免费| 久久国产精品自线拍免费| 免费国产在线观看| 亚洲 国产精品 日韩| 国产一区二区精品久久| 国产韩国精品一区二区三区| 久久国产影视免费精品| 国产不卡在线观看视频| 青草国产在线观看| 尤物视频网站在线| 欧美另类videosbestsex高清| 日本在线www| 青青久久精品| 国产网站免费| 成人高清免费| 二级片在线观看| 国产精品免费久久| 免费国产在线观看不卡| 亚洲精品久久玖玖玖玖| 久久精品道一区二区三区| 精品视频在线看 | 欧美激情中文字幕一区二区| 午夜在线亚洲| 高清一级片| 成人a级高清视频在线观看| 四虎久久精品国产| 国产不卡在线观看| 欧美国产日韩精品|