首页 > 代码库 > Groovy脚本检查html坏链接
Groovy脚本检查html坏链接
这些天在搞Gradle翻译,因为原译者在翻译的同时也把文件进行了整理,并且把翻译过的章节放到新的文件夹中,导致可能有些超链接未改正过来变成死链接。
本想在网上找个工具来检查的,百度了几个工具要么太大要么要安装,懒得弄那么多,于是用Groovy写了一个脚本。此脚本仅检查本地超链接,代码如下:
if (args.size() != 1) { printf("Please specify a folder or HTML file path...") return } def file = new File(args[0]) if(file.isFile()) { if(!args[0].toLowerCase().endsWith(".html")) { return } checkHtml(file) } else if (file.isDirectory()) { def errorLinks = new HashMap<String, List<String>>() file.eachFileMatch( ~/.*\.html/, { checkHtml(it, errorLinks) }) errorLinks.each {name, links -> println "file: " + name links.each { println "href:\t" + it } } } void checkHtml(File file, HashMap<String, List<String>> errorlinks) { def matches = file.text.findAll('href=http://www.mamicode.com/"([^#(http)].+?)("|#)')>
运行时传入一个地址。如果是HTML文件,则检查该文件。如果是目录,则检查里面的HTML文件,其他文件不检查。然后把有错误的文件及其超链接在最后打印出来,正确的不打印。Groovy脚本检查html坏链接
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。