當前位置:首頁 » 編程語言 » pythonhtml轉pdf

pythonhtml轉pdf

發布時間: 2022-05-14 08:15:41

1. python下面有什麼生成pdf文件的庫

可以使用 pdfkit
功能:
1.wkhtmltopdf主要用於HTML生成PDF。
2.pdfkit是基於wkhtmltopdf的python封裝,支持URL,本地文件,文本內容到PDF的轉換,其最終還是調用wkhtmltopdf命令。是目前接觸到的python生成pdf效果較好的。

2. python十大必學模塊是什麼

這個不能一概而論的,據說python目前高達27萬+個庫,看你學習的方向必學模塊也有不同,簡單列舉:

1、網路通用方面:

  • urllib-網路庫

  • requests-網路庫

  • pycurl– 網路庫

  • httplib2– 網路庫

  • RoboBrowser– 瀏覽網頁

  • MechanicalSoup-一個與網站自動交互Python庫

  • socket– 底層網路介面

    2、爬蟲方面:

  • grab– 爬蟲框架

  • scrapy– 網路爬蟲框架,不支持Python3

  • pyspider–爬蟲系統。

  • cola– 爬蟲框架

  • portia– 可視化爬蟲

  • 3、HTML/XML解析方面:

  • lxml– 高效HTML/ XML處理庫

  • cssselect– 解析DOM樹和CSS選擇器。

  • pyquery– 解析DOM樹和jQuery選擇器。

  • html5lib– 根據WHATWG規范生成HTML/ XML文檔的DOM

  • feedparser– 解析RSS/ATOM feeds。

  • MarkupSafe– 為XML/HTML/XHTML提供了安全轉義的字元串。

  • xhtml2pdf– 將HTML/CSS轉換為PDF。

  • untangle– XML文件轉Python對象

  • 4、文件處理方面:

  • xpinyin– 將中國漢字轉為拼音

  • tablib– 數據導出為XLS、CSV、JSON、等格式的模塊

  • textract– 從文件中提取文本

  • messytables– 解析表格數據

  • rows– 常用數據介面

  • Office

  • python-docx– 讀取,查詢和修改docx文件

  • xlwt/xlrd– 從Excel文件讀取寫入數據和格式信息

  • PDF

  • Markdown

  • Python-Markdown– 一個用Python實現的John Gruber的Markdown。

3. python中如何將word轉換成pdf

推薦下面免費的方法轉成PDF試試:
方法一:使用虛擬列印機pdf factory即可,而且其他格式文件只要是能夠列印,選擇這個虛擬列印機,都可以做成PDF文件,很簡單實用;最簡單而且實用的使用虛擬列印機pdf factory即可,可以把任意只要能夠列印的格式文件都可以做成PDF文件,並且可以把多個文件通過列印之後合成一個PDF文件。
pdfFactory Pro(虛擬列印機)是一個無須 Acrobat 創建 Adobe PDF 文件的列印機驅動程序。pdfFactory Pro(虛擬列印機)提供的創建 PDF 文件的方法比其他方法更方便和高效。 功能包括: 多個文檔整合到一個 PDF 文件中; 內嵌字體; 通過 E-mail 發送; 預覽; 自動壓縮優化。
PDF Factory是pdf虛擬列印機軟體,下載安裝好PDF Factory後,我們在列印機控制面板中就可以找到一台由pdf Factory虛擬出來的列印機,可以把任何可以列印的文件轉換成pdf文件。用任何可以支持列印輸出的軟體,把需要處理的文件逐個列印到這個虛擬列印機,全部列印完成後可把結果保存成一個pdf文件。甚至可以把不同軟體格式的文件,如word、excel、photoshop等任何可以支持列印的文件,列印到同一個pdf文件。
在列印之前,在PDF Factory Pro裡面設置一下PDF的打開、列印等許可權即可實現加密等目的;
在列印之前,在設置裡面,就把載入所有的系統字體選中。
在列印界面出來後,可以在左側設置水印。然後再保存PDF文件。
列印完畢後,下載一個Adobe Reader,然後安裝,可以很流暢的閱讀PDF文件。
方法二:使用專門的轉換軟體,把文件轉成PDF文件;
方法三:用其他虛擬列印機轉成PDF文件。
方法四:用WPS本身自帶的轉換功能轉成PDF文件。
方法五:其他例如在線轉換的方法等;

4. python輸出word內容

程序導出word文檔的方法
將web/html內容導出為world文檔,再java中有很多解決方案,比如使用Jacob、Apache POI、Java2Word、iText等各種方式,以及使用freemarker這樣的模板引擎這樣的方式。php中也有一些相應的方法,但在python中將web/html內容生成world文檔的方法是很少的。其中最不好解決的就是如何將使用js代碼非同步獲取填充的數據,圖片導出到word文檔中。
1. unoconv
功能:
1.支持將本地html文檔轉換為docx格式的文檔,所以需要先將網頁中的html文件保存到本地,再調用unoconv進行轉換。轉換效果也不錯,使用方法非常簡單。
\# 安裝
sudo apt-get install unoconv
\# 使用
unoconv -f pdf *.odt
unoconv -f doc *.odt
unoconv -f html *.odt

缺點:
1.只能對靜態html進行轉換,對於頁面中有使用ajax非同步獲取數據的地方也不能轉換(主要是要保證從web頁面保存下來的html文件中有數據)。
2.只能對html進行轉換,如果頁面中有使用echarts,highcharts等js代碼生成的圖片,是無法將這些圖片轉換到word文檔中;
3.生成的word文檔內容格式不容易控制。
2. python-docx
功能:
1.python-docx是一個可以讀寫word文檔的python庫。
使用方法:
1.獲取網頁中的數據,使用python手動排版添加到word文檔中。
from docx import Document
from docx.shared import Inches
document = Document()
document.add_heading('Document Title', 0)
p = document.add_paragraph('A plain paragraph having some ')
p.add_run('bold').bold = True
p.add_run(' and some ')
p.add_run('italic.').italic = True
document.add_heading('Heading, level 1', level=1)
document.add_paragraph('Intense quote', style='IntenseQuote')
document.add_paragraph(
'first item in unordered list', style='ListBullet'
)
document.add_paragraph(
'first item in ordered list', style='ListNumber'
)
document.add_picture('monty-truth.png', width=Inches(1.25))
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
for item in recordset:
row_cells = table.add_row().cells
row_cells[0].text = str(item.qty)
row_cells[1].text = str(item.id)
row_cells[2].text = item.desc
document.add_page_break()
document.save('demo.docx')
from docx import Document
from docx.shared import Inches
document = Document()
for row in range(9):
t = document.add_table(rows=1,cols=1,style = 'Table Grid')
t.autofit = False #很重要!
w = float(row) / 2.0
t.columns[0].width = Inches(w)
document.save('table-step.docx')

缺點:
1.功能非常弱。有很多限制比如不支持模板等,只能生成簡單格式的word文檔。
程序導出PDF文檔方法
1.pdfkit
功能:
1.wkhtmltopdf主要用於HTML生成PDF。
2.pdfkit是基於wkhtmltopdf的python封裝,支持URL,本地文件,文本內容到PDF的轉換,其最終還是調用wkhtmltopdf命令。是目前接觸到的python生成pdf效果較好的。
優點:
1.wkhtmltopdf:利用webkit內核將HTML轉為PDF
webkit是一個高效、開源的瀏覽器內核,包括Chrome和Safari在內的瀏覽器都使用了這個內核。Chrome列印當前網頁的功能,其中有一個選項就是直接「保存為 PDF」。
2.wkhtmltopdf使用webkit內核的PDF渲染引擎來將HTML頁面轉換為PDF。高保真,轉換質量很好,且使用非常簡單。
使用方法:
\# 安裝
pip install pdfkit
\# 使用
import pdfkit
pdfkit.from_url('', 'out.pdf')
pdfkit.from_file('test.html', 'out.pdf')
pdfkit.from_string('Hello!', 'out.pdf')

缺點:
1.對使用echarts,highcharts這樣的js代碼生成的圖標無法轉換為pdf(因為它的功能主要是將html轉換為pdf,而不是將js轉換為pdf)。對於純靜態頁面的轉換效果還是不錯的。
2.其他
其他生成pdf的插件還有:weasyprint,reportlab,PyPDF2等,經簡單試驗都不如pdfkit效果好,且有些用法復雜。

5. python將word轉成pdf

Word批量轉PDF工具(word轉pdf軟體)是一款快捷高效的WORD無損轉PDF格式工具。你只需選擇WORD目錄和要生成的PDF目錄,然後單擊"開始轉換"即可完成批量轉換。
經過不斷地優化與升級,目前Word批量轉PDF工具已經成功地實現了基於超線程技術的pdf文件批量轉換技術,多個Word文件實現批量一鍵轉換,輕鬆快捷。

6. Python編寫程序

主要用到while循環和rece 方法

fromfunctoolsimportrece

sum=0
n=1

x=int(input())
n_value=x
while(n_value>10**(-10)):
sum=sum+n_value
n+=1
#計算第n項的值
n_value=x**n/rece(lambdax,y:x*y,range(1,n+1))

print(sum)

7. python 有沒有將 html 文件轉換為 pdf 的庫

python 有沒有將 html 文件轉換為 pdf 的庫
說明:將以下腳本拷貝到vi中,保存,修改許可權執行,得到你想要的結果。

#!/bin/bash
cd /etc/named
cp honey.com.zone /tmp/honey.com.zone.bk
awk '/^@ IN NS nsl.honey.com./ {print "@ IN NS nsl.ashaur.com";next} \
/^www IN A 192.168.1.7/ {print "www IN A 192.168.1.6";next} \
{print}' honey.com.zone >/tmp/honey.com.zone.tmp
cp /tmp/honey.com.zone.tmp /etc/named/honey.com.zone

8. python編寫代碼,網頁表格轉換為pdf。按照要求寫出完整代碼就行不要求能否成功運行,有償!

這個問題有解決么,我也想問

9. Python可以用來自動化辦公 實現批量Word轉pdf嗎

這里需要導入幾個模塊
from win32com.client import Dispatch # 沒有的話輸入pip install pywin32命令 即可安裝
from os import walk
import os

os是用於文件處理常用的模塊,至於Dispatch,它是提供了一個介面, win32提供了多種word轉換為其他文件的介面,其中FileFormat=17是轉換為pdf格式.
之後轉換文件邏輯也很簡單,首先需要提取出文件名,word文件的後綴是doc或docx,那麼將後綴名替換為pdf即可轉換,這里用到replace方法,即replace(『docx』,『pdf』).replace(『doc』,『pdf』)因為有可能後綴是doc,所以需要2次判斷。
值得注意的是,轉換的文件夾事先要存在,否則會報錯誤。
下面是項目的源代碼
復制代碼
from win32com.client import Dispatch # pip install pywin32
from os import walk
import os
wdFormatPDF = 17 # win32提供了多種word轉換為其他文件的介面,其中FileFormat=17是轉換為pdf
def doc2pdf(input_file, input_file_name, output_dir):
try:
word = Dispatch('Word.Application')
doc = word.Documents.Open(input_file)
except Exception as e:
print("word無法打開, 發生如下錯誤:\n{}".format(e))
try:
pdf_file_name = input_file_name.replace(".docx", ".pdf").replace(".doc", ".pdf")
pdf_file = os.path.join(output_dir, pdf_file_name)
doc.SaveAs(pdf_file, FileFormat=wdFormatPDF)
doc.Close()
word.Quit()
print("成功轉換\"{}\"".format(input_file_name))
print()
except Exception as e:
print("文件保存失敗, 發生如下錯誤:\n{}".format(e))
if __name__ == "__main__":
path_in=input("請輸入word文件夾的路徑(絕對路徑) 要保證存在 建議復制粘貼")
path_out=input("請輸入pdf文件夾的路徑(絕對路徑) 要保證存在 建議復制粘貼")
doc_files = []
directory = path_in# word文件夾
output_dir =path_out # pdf文件夾
for root, _, filenames in walk(directory): # 第2個返回值是dirs, 用不上使用_佔位
for file in filenames:
if file.endswith(".doc") or file.endswith(".docx"):
print("轉換{}中......".format(file))
doc2pdf(os.path.join(root, file), file, output_dir)
復制代碼

10. python怎麼轉成pdf

方法一:使用虛擬列印機pdf factory即可,而且其他格式文件只要是能夠列印,選擇這個虛擬列印機,都可以做成PDF文件,很簡單實用;
方法二:用其他虛擬列印機轉成PDF文件。
方法三:使用專門的轉換軟體,把文件轉成PDF文件。

熱點內容
android敏捷開發 發布:2025-05-11 11:56:49 瀏覽:79
腳本pon 發布:2025-05-11 11:52:27 瀏覽:825
ct5推薦哪個配置 發布:2025-05-11 11:47:45 瀏覽:741
領購未上傳發票 發布:2025-05-11 11:43:27 瀏覽:716
查看華為雲伺服器的ip地址 發布:2025-05-11 11:24:44 瀏覽:235
長沙銀行密碼多少 發布:2025-05-11 11:24:38 瀏覽:671
緩存手機視頻合並軟體哪個好 發布:2025-05-11 11:22:30 瀏覽:698
伺服器c盤怎麼清除 發布:2025-05-11 11:16:33 瀏覽:39
動態估演算法 發布:2025-05-11 11:06:19 瀏覽:923
sql2008使用教程 發布:2025-05-11 10:53:16 瀏覽:315