[C#] 網頁Html轉PDF檔(一行程式碼解決)
網頁轉PDF檔做法很多(Convert HTML to PDF in .NET)
這邊紀錄一下老外最多人加分的那篇做法,使用wkhtmtopdf(採GPL授權)可以省很多程式碼
首先到官網 https://wkhtmltopdf.org/
找installer.exe下載,這邊Demo我是下載wkhtmltopdf-0.9.9-installer.exe
下載完後執行安裝它
選擇要安裝的路徑
安裝完成
(如果要解除安裝的話,就到剛剛安裝的資料夾下找uninstall.exe執行即可)
接著看它的原始使用方式
在安裝路徑下有個wkhtmltopdf.exe檔
到命令提示字元(開始→執行→cmd)
輸入
這邊就抓中國MSDN論壇網頁轉PDF為例
按下Enter轉換完成
打開剛剛轉換完成的PDF檔
該文字的地方就是文字,該圖片的地方就是圖片,該超連結的地方就是超連結
既然知道底層使用方式,那就可以使用
System.Diagnostics.Process.Start 方法 (String, String)
第一個參數傳執行檔路徑,第二個傳參數(URL和PDF檔的存放路徑)
如下:
protected void Button1_Click(object sender, EventArgs e)
{
//因為是兩個argument,所以記得要空格
System.Diagnostics.Process.Start(@"D:\wkhtmltopdf\wkhtmltopdf.exe", @"http://msdn.microsoft.com/zh-cn D:\myFileName.pdf");
}
此小工具不會像WinForm的WebBrowser控制項一樣會共用IE瀏覽器的Cookie
而且要抓的網頁來源不一定要URL,也可以像這樣直接抓本機上的Html檔轉PDF (如果你的網站是後台網站,可以用這招抓後台網頁)
protected void Button1_Click(object sender, EventArgs e)
{
System.Diagnostics.Process.Start(@"D:\wkhtmltopdf\wkhtmltopdf.exe", @"D:\index.html D:\myFileName.pdf");
}
只是抓本機的Html轉成PDF後,圖片會不見這點要注意
相關討論:
如何得知 System.Diagnostics.Process.Start 完畢後的訊息?
國外討論:
Calling wkhtmltopdf to generate PDF from HTML
另外GridView匯出PDF的話,請參考:
ASP.NET 輕鬆轉 GridView 資料轉檔到 PDF - 使用 iTextSharp
請注意使用iTextSharp預設不支援中文字和背景色
中文字的解決方案:GridView透過iTextSharp輸出PDF中文問題
2011.11.29 好人做到底
把ASP.net C#的Code補完
using System;
using System.Collections.Generic;
using System.Linq;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;
/*要引用以下命名空間*/
using System.Diagnostics;
using System.IO;
public partial class _Default : System.Web.UI.Page
{
//Button的Click事件(把Url的網頁內容轉成PDF)
protected void btn_execute_Click(object sender, EventArgs e)
{
//因為Web 是多執行緒環境,避免甲產生的文件被乙下載去,所以檔名都用唯一
string fileNameWithOutExtention = Guid.NewGuid().ToString();
//執行wkhtmltopdf.exe
Process p = System.Diagnostics.Process.Start(@"D:\wkhtmltopdf\wkhtmltopdf.exe", @"http://msdn.microsoft.com/zh-cn D:\" + fileNameWithOutExtention + ".pdf");
//若不加這一行,程式就會馬上執行下一句而抓不到檔案發生例外:System.IO.FileNotFoundException: 找不到檔案 ''。
p.WaitForExit();
//把檔案讀進串流
FileStream fs = new FileStream(@"D:\" + fileNameWithOutExtention + ".pdf", FileMode.Open);
byte[] file = new byte[fs.Length];
fs.Read(file, 0, file.Length);
fs.Close();
//Response給用戶端下載
Response.Clear();
Response.AddHeader("content-disposition", "attachment; filename="+fileNameWithOutExtention+".pdf");//強制下載
Response.ContentType = "application/octet-stream";
Response.BinaryWrite(file);
}
}
2013.9.20 追記:
今天才發現此程式已經被包裝成.dll,可以在.net程式碼叫用:參考HTML轉PDF - 使用Pechkin套件 by 黑暗執行緒
然後根據之前同事經驗,直接使用wkhtmltopdf.exe產PDF,可能在64位元作業系統上產不出來。
在ASP.net MVC中使用的話,請見:[ASP.net MVC] 在Web專案上使用Pechkin套件將網頁轉成PDF檔