博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
java正则表达式去除html标签,Java中正则表达式去除html标签
阅读量:6157 次
发布时间:2019-06-21

本文共 1527 字,大约阅读时间需要 5 分钟。

昆明达内培训的小编知道,Java中正则表达式去除html的标签,主要目的更精确的显示内容,比如前一段时间在做类似于博客中发布文章功能,当编辑器中输入内容后会将样式标签也传入后台并且保存数据库,但是在显示摘要的时候,比如显示正文的前50字作为摘要,那么这时需要去除所有html标签,然后在截取50字,所以就通过了Java正则表达式实现了如下方法,代码如下:

注:这是Java正则表达式去除html标签方法。

private static final String regEx_script =

"

private static final String regEx_style =

"

private static final String regEx_html =

"<[^>]+>"; //定义HTML标签的正则表达式

private static final String regEx_space =

"\\s*|\t|\r|\n";//定义空格回车换行符

private static final String regEx_w =

"]*?>[\\s\\S]*?<\\/w[^>]*?>";//定义所有w标签

/**

* @param htmlStr

* @return删除Html标签

* @author LongJin

*/

public static String delHTMLTag(String

htmlStr) {

Pattern p_w = Pattern.compile(regEx_w,

Pattern.CASE_INSENSITIVE);

Matcher m_w = p_w.matcher(htmlStr);

htmlStr = m_w.replaceAll("");

//过滤script标签

Pattern p_script =

Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);

Matcher m_script = p_script.matcher(htmlStr);

htmlStr =

m_script.replaceAll(""); //过滤script标签

Pattern p_style =

Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);

Matcher m_style =

p_style.matcher(htmlStr);

htmlStr =

m_style.replaceAll(""); //过滤style标签

Pattern p_html =

Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);

Matcher m_html =

p_html.matcher(htmlStr);

htmlStr =

m_html.replaceAll(""); //过滤html标签

Pattern p_space =

Pattern.compile(regEx_space, Pattern.CASE_INSENSITIVE);

Matcher m_space =

p_space.matcher(htmlStr);

htmlStr =

m_space.replaceAll(""); //过滤空格回车标签

htmlStr = htmlStr.replaceAll("

", ""); //过滤

return htmlStr.trim(); //返回文本字符串

}

了解详情请登陆昆明达内IT培训官网(km.tedu.cn)!

转载地址:http://bkifa.baihongyu.com/

你可能感兴趣的文章
java反编译工具(Java Decompiler)
查看>>
Android开发之自定义对话框
查看>>
微信Access Token 缓存方法
查看>>
Eclipsed的SVN插件不能识别之前工作空间的项目
查看>>
Linux 查看iptables状态-重启
查看>>
amazeui学习笔记一(开始使用2)--布局示例layouts
查看>>
c#中lock的使用(用于预约超出限额的流程)
查看>>
ODI基于源表时间戳字段获取增量数据
查看>>
并发容器之CopyOnWriteArrayList(转载)
查看>>
什么是AAC音频格式 AAC-LC 和 AAC-HE的区别是什么
查看>>
原创:goldengate从11.2升级到12.1.2
查看>>
Quartz
查看>>
正则表达式的语法规则
查看>>
C#一个关于委托和事件通俗易懂的例子
查看>>
类似于SVN的文档内容差异对比工具winmerge
查看>>
Cause: java.sql.SQLException: The user specified as a definer ('root'@'%') does not exist
查看>>
quratz线程
查看>>
execnet: rapid multi-Python deployment
查看>>
windows修改3389端口
查看>>
关于JavaScript词法
查看>>