一篇关于表格的正则表达式讨论(表格)

西沉的红日,把缕缕落寂的橘红涂满天际。夕阳下,沧桑古老的小道上充满着迷离的格调,显得格外的幽静。天地万物似乎都酣醉在这片凝固着却极短暂的美丽之中,止住了一切声响。
看过许多UBB代码,包括JS,ASP,JSP的,一直没发现表格的UBB,虽然可以直接用HTML模式实现相同表格功能,但对于某些开放的站点来说开放HTML模式终究是不合适的,故一直想实现表格的UBB。 我的设想是在HTML编辑器(HTML,FRONTPAGE,DW)中作好表格,把<替换为[,>替换为],直接复制HTML并提交发布。 可惜经过实践,发现很难。因为表格的HTML标记和其他元素的HTML标记差别很明显,主要原因TD,TR,特别是TABLE都能嵌套。其实我遇到的关键问题在于我不会写不包含某个单词或语句(非单字符)的正则,譬如下面标记
QUOTE:
[TABLE][TR][TD]哈哈[TABLE][TR][TD]的[/TD][/TR][/TABLE][/TD][/TR][/TABLE]
你要匹配正确[TD]*[/TD]你就得必须保证*不包括[TABLE][TR][TD]等,注意不能用[^\[]*?啊,因为用他无法匹配正确的[/TD]的,所以问题在与我怎么保证这个*不包括[TABLE][TR][TD]呢,(我不会写)。所以我: 退一步,先用\[td[^\]]*?\][^\[]*?\[table找到最后一个(其实最内层的)表格,然后把最内层的表格转为HTML标记,然后循环从头开始再来一次,一直到所有标记被替换。这个理论上是可以实现的。我用JSP正在实验,需要时间,希望有兴趣朋友用ASP,PHP实验一下。 因为我急用,所以我又退了一步,就是直接查找][TABLE]等标记然后替换,有4个表达式,[TABLE][TR][TD]、[/TD][/TR][TR][TD]、[/TD][TD]、[/TD][/TR][TABLE],大家知道,UBB需要把/R/N替换成<BR>的,于是我用上面作出的正则查找并替换掉所有[TABLE]和[TR]和[TD]和[/TD]和[/TR]和[/TABLE]中的换行。其实这个表达式比下面表达式就多了这个替换换行功能,其不足之处是很明显的,就是不能完善的剔除非配套的标记,必须保证所有TABLE标记是正确配套的(有TBODY的再改改就是了),否则乱套。总这一步我实践还不错。 再退一步,其实没法退了,就是直接单个查找替换[TABLE]等标记,这是最苯的方法了,也是效果最不好的,因为大家知道在HTML编辑器里的表格标记中好多换行的,而UBB是为换行转为<BR>的,所以这个方法实现了会发现好多空行的,而且这个方法和上面那一步一个共同缺点就是更不能剔除非配套标记。
附我写的退一步后的正则:(我用JSP)
QUOTE:
\\[(table)([^\\[]*?)\\][^\\[]*?\\[tr\\][^\\[]*?\\[td([^\\[]*)\\]|\\[\\/(td)\\][^\\[]*?\\[\\/tr\\][^\\[]*?\\[tr\\][^\\[]*?\\[td([^\\[]*)\\]|\\[\\/(td)\\][^\\[]*?\\[td([^\\[]*)\\]|\\[\\/(td)\\][^\\[]*?\\[\\/tr\\][^\\[]*?\\[\\/table\\]
我想如果是管理员发布信息什么的,能保证表格标记的正确的话用这个还可以的。其实如果有人想捣乱的话,再严谨的UBB也不能防止的啊。
欢迎有兴趣者来此讨论,提出更好建议,打造最好最全的UBB。
[Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

以上就是一篇关于表格的正则表达式讨论(表格)。点了盘鱼翅炒饭,换了三双筷子没找见一块鱼翅,厨师解释说“我叫鱼翅”。更多关于一篇关于表格的正则表达式讨论(表格)请关注haodaima.com其它相关文章!

您可能有感兴趣的文章
13道一篇关于JavaScript正则表达式的面试题

一篇关于日期正则表达式的思路详解

一篇关于IE的RegExp.exec的问题

一篇关于内容的分离,正则抽出图片(一定要加精哦)

一个一篇关于正则表达式的问题