IT源码网

java之RSS feed 替换编码字符

bonelee 2024年09月07日 程序员 47 0

我正在处理来自一些 RSS 源的新闻文章,并希望在基于 Java 的 Web 应用程序上显示标题。

一些提要的标题中包含编码字符,例如

Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach

可能还有其他编码字符。使用 Java(并且无需定义要搜索/替换的字符)如何替换所有编码字符,以便我可以在网站上正确显示标题。例如

Arsenal’s trip to Vitoria a ‘more difficult’ test than reverse Europa League tie, warns hosts’ coach

请您参考如下方法:

Apache Commons Lang对此提供支持(org.apache.commons:commons-lang3:3.9):

运行:

import org.apache.commons.lang.StringEscapeUtils; 
 
public class Escape { 
 
    public static void main(String[] args) { 
        System.out.println(StringEscapeUtils.unescapeXml("Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach")); 
    } 
} 

按预期给出:

Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach


评论关闭
IT源码网

微信公众号号:IT虾米 (左侧二维码扫一扫)欢迎添加!