heavenm
发表于 2018-8-17 01:41:14
(?i)(f|https?:\/\/)(?:\w+\.)?(\w+)((?:\.\w+(?:.cn)?$)|(?:\.\w+(?:.cn)?))好像这个可以完美处理
heavenm
发表于 2018-8-17 01:45:36
(?i)(f|https?:\/\/)(?:\w+\.)?((?:\w+\.\w+(?:.cn)?$)|(?:\w+\.\w+(?:.cn)?))
跟AFAN学习的改进版本,这样子显示感觉更适用!
志艺风云
发表于 2018-8-17 14:31:02
heavenm 发表于 2018-8-17 01:45
(?i)(f|https?:\/\/)(?:\w+\.)?((?:\w+\.\w+(?:.cn)?$)|(?:\w+\.\w+(?:.cn) ...
如果不能正确分解这两个网址,可能都不正确
http://qqq.www.eee.example.com.cc:1234/test/test.htm#part1
https://qqq.www.eee.example.com.cc:1234/test/test.asp?f=search
协议:http:
子域名:qqq.www.eee
主域名:example.com.cc
端口:1234
路径:test/test.htm
锚/查询:part1/f=search
如果只要qqq.www.eee.example.com.cc还有可能,这个再分解就难咯。
heavenm
发表于 2018-8-17 21:43:13
志艺风云 发表于 2018-8-17 14:31
如果不能正确分解这两个网址,可能都不正确
http://qqq.www.eee.example.com.cc:1234/test/test.htm#par ...
没有com.cc这个域名后缀
我只听说过二级域名,没见过三级,甚至四级域名过!
志艺风云
发表于 2018-8-18 02:27:38
你百度一下 域名
haijie1223
发表于 2018-8-18 09:20:57
(?:f|https?://|https?://\w+?\.|\w+?\.)?([^\.\?\+:/]+(?:\.cn|\.com|\.edu|\.gov|\.int|\.mil|\.net|\.org|\.biz|\.info|\.pro|\.name|\.museum|\.coop|\.aero|\.xxx|\.idv|\.al|\.dz|\.af|\.ar|\.ae|\.aw|\.om|\.az|\.eg|\.et|\.ie|\.ee|\.ad|\.ao|\.ai|\.ag|\.at|\.au|\.mo|\.bb|\.pg|\.bs|\.pk|\.py|\.ps|\.bh|\.pa|\.br|\.by|\.bm|\.bg|\.mp|\.bj|\.be|\.is|\.pr|\.ba|\.pl|\.bo|\.bz|\.bw|\.bt|\.bf|\.bi|\.bv|\.kp|\.gq|\.dk|\.de|\.tl|\.tp|\.tg|\.dm|\.do|\.ru|\.ec|\.er|\.fr|\.fo|\.pf|\.gf|\.tf|\.va|\.ph|\.fj|\.fi|\.cv|\.fk|\.gm|\.cg|\.cd|\.co|\.cr|\.gg|\.gd|\.gl|\.ge|\.cu|\.gp|\.gu|\.gy|\.kz|\.ht|\.kr|\.nl|\.an|\.hm|\.hn|\.ki|\.dj|\.kg|\.gn|\.gw|\.ca|\.gh|\.ga|\.kh|\.cz|\.zw|\.cm|\.qa|\.ky|\.km|\.ci|\.kw|\.cc|\.hr|\.ke|\.ck|\.lv|\.ls|\.la|\.lb|\.lt|\.lr|\.ly|\.li|\.re|\.lu|\.rw|\.ro|\.mg|\.im|\.mv|\.mt|\.mw|\.my|\.ml|\.mk|\.mh|\.mq|\.yt|\.mu|\.mr|\.us|\.um|\.as|\.vi|\.mn|\.ms|\.bd|\.pe|\.fm|\.mm|\.md|\.ma|\.mc|\.mz|\.mx|\.nr|\.np|\.ni|\.ne|\.ng|\.nu|\.no|\.nf|\.na|\.za|\.aq|\.gs|\.eu|\.pw|\.pn|\.pt|\.jp|\.se|\.ch|\.sv|\.ws|\.yu|\.sl|\.sn|\.cy|\.sc|\.sa|\.cx|\.st|\.sh|\.kn|\.lc|\.sm|\.pm|\.vc|\.lk|\.sk|\.si|\.sj|\.sz|\.sd|\.sr|\.sb|\.so|\.tj|\.tw|\.th|\.tz|\.to|\.tc|\.tt|\.tn|\.tv|\.tr|\.tm|\.tk|\.wf|\.vu|\.gt|\.ve|\.bn|\.ug|\.ua|\.uy|\.uz|\.es|\.eh|\.gr|\.hk|\.sg|\.nc|\.nz|\.hu|\.sy|\.jm|\.am|\.ac|\.ye|\.iq|\.ir|\.il|\.it|\.in|\.id|\.uk|\.vg|\.io|\.jo|\.vn|\.zm|\.je|\.td|\.gi|\.cl|\.cf|\.yr|\.ac\.cn|\.ah\.cn|\.bj\.cn|\.com\.cn|\.cq\.cn|\.fj\.cn|\.gd\.cn|\.gov\.cn|\.gs\.cn|\.gx\.cn|\.gz\.cn|\.ha\.cn|\.hb\.cn|\.he\.cn|\.hi\.cn|\.hk\.cn|\.hl\.cn|\.hn\.cn|\.jl\.cn|\.js\.cn|\.jx\.cn|\.ln\.cn|\.mo\.cn|\.net\.cn|\.nm\.cn|\.nx\.cn|\.org\.cn))(?:[^\.\w]|/|$|\v)
haijie1223
发表于 2018-8-18 09:21:20
你得把上面的后缀全部添加进去才可以
heavenm
发表于 2018-9-16 00:33:44
haijie1223 发表于 2018-8-18 09:20
(?:f|https?://|https?://\w+?\.|\w+?\.)?([^\.\?\+:/]+(?:\.cn|\.com|\.edu|\.gov|\.int|\.mil|\.net|\.or ...
这个可以匹配三级,四级域名,但是我想了半天,想不到
怎么把协议匹配出来
怎么匹配HTTP://出来?
HTTP://
xxx.com
haijie1223
发表于 2018-9-16 22:03:27
heavenm 发表于 2018-9-16 00:33
这个可以匹配三级,四级域名,但是我想了半天,想不到
怎么把协议匹配出来
不懂你的意思
heavenm
发表于 2018-9-20 01:26:28
haijie1223 发表于 2018-9-16 22:03
不懂你的意思
现在匹配返回的结果只有 XXX.COM
能不能返回
协议
HTTP:// 和 XXX.COM
这两个结果哈!
haijie1223
发表于 2018-9-20 07:13:07
(?:f|(https?://)|(https?://)\w+?\.|\w+?\.)?([^\.\?\+:/]+(?:\.cn|\.com|\.edu|\.gov|\.int|\.mil|\.net|\.org|\.biz|\.info|\.pro|\.name|\.museum|\.coop|\.aero|\.xxx|\.idv|\.al|\.dz|\.af|\.ar|\.ae|\.aw|\.om|\.az|\.eg|\.et|\.ie|\.ee|\.ad|\.ao|\.ai|\.ag|\.at|\.au|\.mo|\.bb|\.pg|\.bs|\.pk|\.py|\.ps|\.bh|\.pa|\.br|\.by|\.bm|\.bg|\.mp|\.bj|\.be|\.is|\.pr|\.ba|\.pl|\.bo|\.bz|\.bw|\.bt|\.bf|\.bi|\.bv|\.kp|\.gq|\.dk|\.de|\.tl|\.tp|\.tg|\.dm|\.do|\.ru|\.ec|\.er|\.fr|\.fo|\.pf|\.gf|\.tf|\.va|\.ph|\.fj|\.fi|\.cv|\.fk|\.gm|\.cg|\.cd|\.co|\.cr|\.gg|\.gd|\.gl|\.ge|\.cu|\.gp|\.gu|\.gy|\.kz|\.ht|\.kr|\.nl|\.an|\.hm|\.hn|\.ki|\.dj|\.kg|\.gn|\.gw|\.ca|\.gh|\.ga|\.kh|\.cz|\.zw|\.cm|\.qa|\.ky|\.km|\.ci|\.kw|\.cc|\.hr|\.ke|\.ck|\.lv|\.ls|\.la|\.lb|\.lt|\.lr|\.ly|\.li|\.re|\.lu|\.rw|\.ro|\.mg|\.im|\.mv|\.mt|\.mw|\.my|\.ml|\.mk|\.mh|\.mq|\.yt|\.mu|\.mr|\.us|\.um|\.as|\.vi|\.mn|\.ms|\.bd|\.pe|\.fm|\.mm|\.md|\.ma|\.mc|\.mz|\.mx|\.nr|\.np|\.ni|\.ne|\.ng|\.nu|\.no|\.nf|\.na|\.za|\.aq|\.gs|\.eu|\.pw|\.pn|\.pt|\.jp|\.se|\.ch|\.sv|\.ws|\.yu|\.sl|\.sn|\.cy|\.sc|\.sa|\.cx|\.st|\.sh|\.kn|\.lc|\.sm|\.pm|\.vc|\.lk|\.sk|\.si|\.sj|\.sz|\.sd|\.sr|\.sb|\.so|\.tj|\.tw|\.th|\.tz|\.to|\.tc|\.tt|\.tn|\.tv|\.tr|\.tm|\.tk|\.wf|\.vu|\.gt|\.ve|\.bn|\.ug|\.ua|\.uy|\.uz|\.es|\.eh|\.gr|\.hk|\.sg|\.nc|\.nz|\.hu|\.sy|\.jm|\.am|\.ac|\.ye|\.iq|\.ir|\.il|\.it|\.in|\.id|\.uk|\.vg|\.io|\.jo|\.vn|\.zm|\.je|\.td|\.gi|\.cl|\.cf|\.yr|\.ac\.cn|\.ah\.cn|\.bj\.cn|\.com\.cn|\.cq\.cn|\.fj\.cn|\.gd\.cn|\.gov\.cn|\.gs\.cn|\.gx\.cn|\.gz\.cn|\.ha\.cn|\.hb\.cn|\.he\.cn|\.hi\.cn|\.hk\.cn|\.hl\.cn|\.hn\.cn|\.jl\.cn|\.js\.cn|\.jx\.cn|\.ln\.cn|\.mo\.cn|\.net\.cn|\.nm\.cn|\.nx\.cn|\.org\.cn))(?:[^\.\w]|/|$|\v)
heavenm
发表于 2018-9-21 15:03:41
haijie1223 发表于 2018-9-20 07:13
(?:f|(https?://)|(https?://)\w+?\.|\w+?\.)?([^\.\?\+:/]+(?:\.cn|\.com|\.edu|\.gov|\.int|\.mil|\.net| ...
(https?://).*?([^\.\?\+:/]++(?:\.cn|\.com|\.edu|\.gov|\.int|\.mil|\.net|\.org|\.biz|\.info|\.pro|\.name|\.museum|\.coop|\.aero|\.xxx|\.idv|\.al|\.dz|\.af|\.ar|\.ae|\.aw|\.om|\.az|\.eg|\.et|\.ie|\.ee|\.ad|\.ao|\.ai|\.ag|\.at|\.au|\.mo|\.bb|\.pg|\.bs|\.pk|\.py|\.ps|\.bh|\.pa|\.br|\.by|\.bm|\.bg|\.mp|\.bj|\.be|\.is|\.pr|\.ba|\.pl|\.bo|\.bz|\.bw|\.bt|\.bf|\.bi|\.bv|\.kp|\.gq|\.dk|\.de|\.tl|\.tp|\.tg|\.dm|\.do|\.ru|\.ec|\.er|\.fr|\.fo|\.pf|\.gf|\.tf|\.va|\.ph|\.fj|\.fi|\.cv|\.fk|\.gm|\.cg|\.cd|\.co|\.cr|\.gg|\.gd|\.gl|\.ge|\.cu|\.gp|\.gu|\.gy|\.kz|\.ht|\.kr|\.nl|\.an|\.hm|\.hn|\.ki|\.dj|\.kg|\.gn|\.gw|\.ca|\.gh|\.ga|\.kh|\.cz|\.zw|\.cm|\.qa|\.ky|\.km|\.ci|\.kw|\.cc|\.hr|\.ke|\.ck|\.lv|\.ls|\.la|\.lb|\.lt|\.lr|\.ly|\.li|\.re|\.lu|\.rw|\.ro|\.mg|\.im|\.mv|\.mt|\.mw|\.my|\.ml|\.mk|\.mh|\.mq|\.yt|\.mu|\.mr|\.us|\.um|\.as|\.vi|\.mn|\.ms|\.bd|\.pe|\.fm|\.mm|\.md|\.ma|\.mc|\.mz|\.mx|\.nr|\.np|\.ni|\.ne|\.ng|\.nu|\.no|\.nf|\.na|\.za|\.aq|\.gs|\.eu|\.pw|\.pn|\.pt|\.jp|\.se|\.ch|\.sv|\.ws|\.yu|\.sl|\.sn|\.cy|\.sc|\.sa|\.cx|\.st|\.sh|\.kn|\.lc|\.sm|\.pm|\.vc|\.lk|\.sk|\.si|\.sj|\.sz|\.sd|\.sr|\.sb|\.so|\.tj|\.tw|\.th|\.tz|\.to|\.tc|\.tt|\.tn|\.tv|\.tr|\.tm|\.tk|\.wf|\.vu|\.gt|\.ve|\.bn|\.ug|\.ua|\.uy|\.uz|\.es|\.eh|\.gr|\.hk|\.sg|\.nc|\.nz|\.hu|\.sy|\.jm|\.am|\.ac|\.ye|\.iq|\.ir|\.il|\.it|\.in|\.id|\.uk|\.vg|\.io|\.jo|\.vn|\.zm|\.je|\.td|\.gi|\.cl|\.cf|\.yr|\.ac\.cn|\.ah\.cn|\.bj\.cn|\.com\.cn|\.cq\.cn|\.fj\.cn|\.gd\.cn|\.gov\.cn|\.gs\.cn|\.gx\.cn|\.gz\.cn|\.ha\.cn|\.hb\.cn|\.he\.cn|\.hi\.cn|\.hk\.cn|\.hl\.cn|\.hn\.cn|\.jl\.cn|\.js\.cn|\.jx\.cn|\.ln\.cn|\.mo\.cn|\.net\.cn|\.nm\.cn|\.nx\.cn|\.org\.cn))(?:[^\.\w]|/|$|\v)
返回结果还是有问题,修改了下
其实前面只要特别简单就能处理搞定了
(https?://).*?
感觉现在蛮完美的了
heavenm
发表于 2018-9-21 15:15:24
这个东东的作用是为了清理域名的COOKIE!
Func _IEEx_ClearCookie($_object, $_mode = 0)
Local $_url
If IsObj($_object) Then
$_url = $_object.locationurl
Else
$_url = $_object
EndIf
$_url = StringRegExp($_url, '(https?://).*?([^\.\?\+:/]++(?:\.cn|\.com|\.edu|\.gov|\.int|\.mil|\.net|\.org|\.biz|\.info|\.pro|\.name|\.museum|\.coop|\.aero|\.xxx|\.idv|\.al|\.dz|\.af|\.ar|\.ae|\.aw|\.om|\.az|\.eg|\.et|\.ie|\.ee|\.ad|\.ao|\.ai|\.ag|\.at|\.au|\.mo|\.bb|\.pg|\.bs|\.pk|\.py|\.ps|\.bh|\.pa|\.br|\.by|\.bm|\.bg|\.mp|\.bj|\.be|\.is|\.pr|\.ba|\.pl|\.bo|\.bz|\.bw|\.bt|\.bf|\.bi|\.bv|\.kp|\.gq|\.dk|\.de|\.tl|\.tp|\.tg|\.dm|\.do|\.ru|\.ec|\.er|\.fr|\.fo|\.pf|\.gf|\.tf|\.va|\.ph|\.fj|\.fi|\.cv|\.fk|\.gm|\.cg|\.cd|\.co|\.cr|\.gg|\.gd|\.gl|\.ge|\.cu|\.gp|\.gu|\.gy|\.kz|\.ht|\.kr|\.nl|\.an|\.hm|\.hn|\.ki|\.dj|\.kg|\.gn|\.gw|\.ca|\.gh|\.ga|\.kh|\.cz|\.zw|\.cm|\.qa|\.ky|\.km|\.ci|\.kw|\.cc|\.hr|\.ke|\.ck|\.lv|\.ls|\.la|\.lb|\.lt|\.lr|\.ly|\.li|\.re|\.lu|\.rw|\.ro|\.mg|\.im|\.mv|\.mt|\.mw|\.my|\.ml|\.mk|\.mh|\.mq|\.yt|\.mu|\.mr|\.us|\.um|\.as|\.vi|\.mn|\.ms|\.bd|\.pe|\.fm|\.mm|\.md|\.ma|\.mc|\.mz|\.mx|\.nr|\.np|\.ni|\.ne|\.ng|\.nu|\.no|\.nf|\.na|\.za|\.aq|\.gs|\.eu|\.pw|\.pn|\.pt|\.jp|\.se|\.ch|\.sv|\.ws|\.yu|\.sl|\.sn|\.cy|\.sc|\.sa|\.cx|\.st|\.sh|\.kn|\.lc|\.sm|\.pm|\.vc|\.lk|\.sk|\.si|\.sj|\.sz|\.sd|\.sr|\.sb|\.so|\.tj|\.tw|\.th|\.tz|\.to|\.tc|\.tt|\.tn|\.tv|\.tr|\.tm|\.tk|\.wf|\.vu|\.gt|\.ve|\.bn|\.ug|\.ua|\.uy|\.uz|\.es|\.eh|\.gr|\.hk|\.sg|\.nc|\.nz|\.hu|\.sy|\.jm|\.am|\.ac|\.ye|\.iq|\.ir|\.il|\.it|\.in|\.id|\.uk|\.vg|\.io|\.jo|\.vn|\.zm|\.je|\.td|\.gi|\.cl|\.cf|\.yr|\.ac\.cn|\.ah\.cn|\.bj\.cn|\.com\.cn|\.cq\.cn|\.fj\.cn|\.gd\.cn|\.gov\.cn|\.gs\.cn|\.gx\.cn|\.gz\.cn|\.ha\.cn|\.hb\.cn|\.he\.cn|\.hi\.cn|\.hk\.cn|\.hl\.cn|\.hn\.cn|\.jl\.cn|\.js\.cn|\.jx\.cn|\.ln\.cn|\.mo\.cn|\.net\.cn|\.nm\.cn|\.nx\.cn|\.org\.cn))(?:[^\.\w]|/|$|\v)', 3)
Switch $_mode
Case 0
RunWait('RunDll32.exe InetCpl.cpl,ClearMyTracksByProcess 255')
Return 1
Case 1
$__cookie = $_object.document.cookie
Case 2
$__cookie = _WinINet_InternetGetCookieEx($_url & $_url, Null, 8192)
EndSwitch
$__cookie = StringRegExp($__cookie, "\S*=", 3)
If @error Then Return 0
For $i = 0 To UBound($__cookie) - 1
Switch $_mode
Case 1
$_object.document.cookie = $__cookie[$i] & '; Domain=' & $_url & '; Expires=Thu, 01-Jan-1970 00:00:10 GMT; Path=/'
Case 2
_WinINet_InternetSetCookie($_url & $_url, $__cookie[$i] & '; Expires=Thu, 01-Jan-1970 00:00:10 GMT; Path=/')
EndSwitch
Next
EndFunc ;==>_IEEx_ClearCookie
heavenm
发表于 2018-9-21 15:16:17
可以清除浏览器的COOKIE,不过好像清除掉,刷新还是在!不是很好用!
heavenm
发表于 2018-9-23 21:37:55
本帖最后由 heavenm 于 2018-9-23 21:40 编辑
Func _IEEx_ClearCookie($_object, $_mode = 0)
Local $_url
If IsObj($_object) Then
$_url = $_object.locationurl
Else
$_url = $_object
EndIf
$_url = StringRegExp($_url, '(https?://).*?([^\.\?\+:/]++(?:\.cn|\.com|\.edu|\.gov|\.int|\.mil|\.net|\.org|\.biz|\.info|\.pro|\.name|\.museum|\.coop|\.aero|\.xxx|\.idv|\.al|\.dz|\.af|\.ar|\.ae|\.aw|\.om|\.az|\.eg|\.et|\.ie|\.ee|\.ad|\.ao|\.ai|\.ag|\.at|\.au|\.mo|\.bb|\.pg|\.bs|\.pk|\.py|\.ps|\.bh|\.pa|\.br|\.by|\.bm|\.bg|\.mp|\.bj|\.be|\.is|\.pr|\.ba|\.pl|\.bo|\.bz|\.bw|\.bt|\.bf|\.bi|\.bv|\.kp|\.gq|\.dk|\.de|\.tl|\.tp|\.tg|\.dm|\.do|\.ru|\.ec|\.er|\.fr|\.fo|\.pf|\.gf|\.tf|\.va|\.ph|\.fj|\.fi|\.cv|\.fk|\.gm|\.cg|\.cd|\.co|\.cr|\.gg|\.gd|\.gl|\.ge|\.cu|\.gp|\.gu|\.gy|\.kz|\.ht|\.kr|\.nl|\.an|\.hm|\.hn|\.ki|\.dj|\.kg|\.gn|\.gw|\.ca|\.gh|\.ga|\.kh|\.cz|\.zw|\.cm|\.qa|\.ky|\.km|\.ci|\.kw|\.cc|\.hr|\.ke|\.ck|\.lv|\.ls|\.la|\.lb|\.lt|\.lr|\.ly|\.li|\.re|\.lu|\.rw|\.ro|\.mg|\.im|\.mv|\.mt|\.mw|\.my|\.ml|\.mk|\.mh|\.mq|\.yt|\.mu|\.mr|\.us|\.um|\.as|\.vi|\.mn|\.ms|\.bd|\.pe|\.fm|\.mm|\.md|\.ma|\.mc|\.mz|\.mx|\.nr|\.np|\.ni|\.ne|\.ng|\.nu|\.no|\.nf|\.na|\.za|\.aq|\.gs|\.eu|\.pw|\.pn|\.pt|\.jp|\.se|\.ch|\.sv|\.ws|\.yu|\.sl|\.sn|\.cy|\.sc|\.sa|\.cx|\.st|\.sh|\.kn|\.lc|\.sm|\.pm|\.vc|\.lk|\.sk|\.si|\.sj|\.sz|\.sd|\.sr|\.sb|\.so|\.tj|\.tw|\.th|\.tz|\.to|\.tc|\.tt|\.tn|\.tv|\.tr|\.tm|\.tk|\.wf|\.vu|\.gt|\.ve|\.bn|\.ug|\.ua|\.uy|\.uz|\.es|\.eh|\.gr|\.hk|\.sg|\.nc|\.nz|\.hu|\.sy|\.jm|\.am|\.ac|\.ye|\.iq|\.ir|\.il|\.it|\.in|\.id|\.uk|\.vg|\.io|\.jo|\.vn|\.zm|\.je|\.td|\.gi|\.cl|\.cf|\.yr|\.ac\.cn|\.ah\.cn|\.bj\.cn|\.com\.cn|\.cq\.cn|\.fj\.cn|\.gd\.cn|\.gov\.cn|\.gs\.cn|\.gx\.cn|\.gz\.cn|\.ha\.cn|\.hb\.cn|\.he\.cn|\.hi\.cn|\.hk\.cn|\.hl\.cn|\.hn\.cn|\.jl\.cn|\.js\.cn|\.jx\.cn|\.ln\.cn|\.mo\.cn|\.net\.cn|\.nm\.cn|\.nx\.cn|\.org\.cn))(?:[^\.\w]|/|$|\v)', 3);正则由,haijie1223提供!
Switch $_mode
Case 0
RunWait('RunDll32.exe InetCpl.cpl,ClearMyTracksByProcess 255')
Return 1
Case 1
$__cookie = $_object.document.cookie
Case 2
$__cookie = _WinINet_InternetGetCookieEx($_url & $_url, Null, 8192)
EndSwitch
$__cookie = StringRegExp($__cookie, "\S*=", 3)
If @error Then Return 0
For $i = 0 To UBound($__cookie) - 1
Switch $_mode
Case 1
$_object.document.cookie = $__cookie[$i] & '; Domain=' & $_url & '; Expires=Thu, 01-Jan-1970 00:00:10 GMT; Path=/'
Case 2
_WinINet_InternetSetCookie($_url & $_url, $__cookie[$i] & '; Expires=Thu, 01-Jan-1970 00:00:10 GMT; Path=/')
EndSwitch
Next
EndFunc ;==>_IEEx_ClearCookie