Java HtmlDecode

html decode in java

這個問題是從爬文抓下來的html資料,有一些特殊的html編碼,

為了將這些編碼轉成人看得懂的文字,而找特別去找Java是否能夠將Html編碼成中文字,如〜→〜

先從網路找,online的html decode工具。

http://www.opinionatedgeek.com/dotnet/tools/htmlencode/decode.aspx

 

接著再用google查html decode java

就找到

http://stackoverflow.com/questions/994331/java-how-to-decode-html-character-entities-in-java-like-httputility-htmldecode

 

接著去使用他的函式,

import org.apache.commons.lang.StringEscapeUtils;

StringEscapeUtils.unescapeHtml(htmlDecodeString);