我正在处理来自一些 RSS 源的新闻文章,并希望在基于 Java 的 Web 应用程序上显示标题。
一些提要的标题中包含编码字符,例如
Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach
可能还有其他编码字符。使用 Java(并且无需定义要搜索/替换的字符)如何替换所有编码字符,以便我可以在网站上正确显示标题。例如
Arsenal’s trip to Vitoria a ‘more difficult’ test than reverse Europa League tie, warns hosts’ coach
请您参考如下方法:
Apache Commons Lang对此提供支持(org.apache.commons:commons-lang3:3.9):
运行:
import org.apache.commons.lang.StringEscapeUtils;
public class Escape {
public static void main(String[] args) {
System.out.println(StringEscapeUtils.unescapeXml("Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach"));
}
}
按预期给出:
Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach