清理 Teleport 中的 tppabs 标记
  • 首页 > 电脑网络
  • 作者: Joseffu
  • 2016年1月7日 9:19 星期四
  • 浏览:4931 次
  • 字号:   
  • 评论:0 条  
  • 时间:2016-1-7 9:19   浏览:4931  

    Teleport Ultra 是懒人扒站必备软件,但最大缺点是标注了 tppabs 原始地址,这是完全用不到的,也是爱扒站的人最不喜欢看到的。解决办法是可以使用一些编辑软件,如 DW、Notepad++、Editplus 等的批量替换功能,通过正则表达式删除这些标记。具体做法如下:


    HTML 文件中,使用以下代码全部替换为“空”(替换时注意勾选:使用正则表达式):

    \btppabs="h[^"]*" 

    CSS、JS 文件中,链接的图片文件 tpa 原始地址(HTTPS 协议则用 https),使用以下代码:

    \/\*tpa=http://[^\s]*\/

    全部替换为空值。 


    有时候因为各种原因,Teleport 无法下载成功的资源(尤其是超链接中的JS口令),会有一些乱码的提示信息,字符无法正常显示,替换方法是:

    href="javascript:if\(confirm\('htt[^"]*"
    全部替换为:
    href=""

    即把这类超链接都替换成空值,也可以替换为其他需要的。


    开头结尾匹配内容替换:

    \b开头字符.*?结尾字符\b


    正则表达式替换超链接为空值:

    (href=")[^"]*(")
    替换成:
    $1$2


    这些替换工作做好后,扒下来的网站副本代码就干净多了。

    另外,这些替换工作完成后,还需要做一些格式上的普通替换,JS可能会出现异常(附带了原有网址),如排除麻烦,可能手工重新下载一次。

    昵称  邮箱  主页 
    表情1 表情2 表情3 表情4 表情5 表情6 表情7 表情8 表情9 表情10 表情11 表情12 表情13 表情14 表情15 表情16 表情17 表情18 表情19 表情20 表情21
    40 + 89 =
    Copyright © 2004-2024  Joseffu Online 博客首页 鲁ICP备2021023008号-1 繁体中文
  • 日志:296 篇
  • 评论:226 条
  • 微语:25 条
  • 友链:18 个
  • 分类:5 个
  • 标签:29 个
  • 建站:2004-11-22

    已运行