建站常识

ASP正则表达式表格仅保留标签去除style,span,p等

发布时间 | 2017/12/28  点击 | 

在为上海中小企业进行网站网站开发时,遇到类似表格客户添加时不好处理的问题,客户有时候添加会从word里面直接复制过来,后台添加时编辑器会有很多无用的代码,通过在百度上面寻找,找一个一个比较不错的例子,现在分析给大家,<p style="......"></p>这样的标签,都替换为<p></p>去掉样式表,asp代码的正则表达式怎么写呢,求助 '用法 RHtml=SimpleHTML(html,"p,img,a,span")

'用法 RHtml=SimpleHTML(html,"p,img,a,span")
Function SimpleHTML(content,tags)
    If tags="" Then tags="p,br"
    SimpleHTML = RegReplace("<(\/?)("& Replace(tags,",","|") &")([^>]*)>",content&"","[$1$2$3]")
    SimpleHTML = RegReplace("<[^>]*>",SimpleHTML,"")
    SimpleHTML = RegReplace("\[(\/?)("& Replace(tags,",","|") &")([^\]]*)\]",SimpleHTML,"<$1$2$3>")
End Function
 
'生成一个正则表达式对象
Function REObject( reg, m)
    Dim re:Set re=new RegExp
    re.Pattern = reg
    If InStr(1, m, "g", 1)>0 Then re.Global = True
    If InStr(1, m, "i", 1)>0 Then re.IgnoreCase = True
    If InStr(1, m, "m", 1)>0 Then re.MultiLine = True
    Set REObject=re
End Function
 
Function RegReplace( reg, str, rstr)
    RegReplace=RegExpReplace(reg,"ig",str,rstr)
End Function
 
'正则替换字符串
Function RegExpReplace( reg, m, str, rstr)
    RegExpReplace=REObject(reg, m).Replace(str,rstr)
End Function

后面几个是用到的函数 会将html代码中非指定的标签全部去除,如果要去除标签内的属性,需要修改下simplehtml这个函数,把$3去掉

相关信息