请问大侠们提取TXT文件里的网址然后保存如何写?(求好心人帮忙)【已解决】
本帖最后由 liyonghk 于 2012-5-13 11:15 编辑请问大侠们提取TXT文件里的网址然后保存如何写?
程序大致的功能就是:
1.导入一个txt记事本进入。(里面有一些乱码和一些网址混在一起了,域名有带www的也有不带www的,后缀有com、org、net、com.cn的等等,PS:最好是后缀名可以自定义添加修改的!)
2.提取txt记事本里面的网址。
3.保存到另外一个txt记事本文件里。(保存的格式是一行一个网址)
这几个功能对于大侠们来说应该是小菜一碟,对于我这样的小菜来说就很难了,希望那位好心大侠出来帮我实现了,小弟先再次感谢这位好心大侠了!{:face (356):}
下面是TXT文本的部分内容,格式基本就是这样的,网址我全部用baidu代替了,这样应该不会影响什么!
529 baidu.com/(...)
530 www.baidu1.com/ ???????? (...) 185
531 baidu2.com/index.asp(...)
533 www.baidu3.com/(...)
534 www.baidu4.com.cn/ ????????? (...) 170
535 www.baidu5.com/(...)
536 www.baidu6.com/service.asp(...)
537 www.baidu7.com.cn/ ????????? (...) 124
538 baidu8.com/ ???????????????? (...) 293
539 www.baidu9.com/(...)
540 www.baidu10.net/ ??????????? (...) 197
549 www.baidu11.com/?from=sst ??????????? (...) 123
560 www.baidu12.com/list.asp?ProdId=003-C-03-049 ???????? (...) 206
569 www.baidu13.com.cn/?.3847589.html ??????????? (...) 384
570 www.baidu14.com/(...)
571 www.baidu15.com/ ????????? (...) 238
572 www.baidu16.gov.com.cn/ ??????????????? (...) 340
573 ww.baidu17.org/(...)
574 www.baidu18.com.cn/(...)
575 baidu19.com/ ??????????? (...) 396
576 baidu20.com/ ????????? (...) 323
577 www.baidu21.org.cn/index.htm ????????????? (...) 327
将你的TXT记事本的内容发上来看看,虽然你那几个问题对大师们来说简单,但是要大师们来猜你文本的内容却不简单。 回复 2# 天煞孤心
已经附上代码,谢谢你的提醒! 本帖最后由 afan 于 2012-5-8 16:43 编辑
#include <Array.au3>
Local $Str = _
'529 baidu.com/(...) ' & @CRLF & _
'530 www.baidu1.com/ ???????? (...) 185' & @CRLF & _
'531 baidu2.com/index.asp(...) ' & @CRLF & _
'533 www.baidu3.com/(...) ' & @CRLF & _
'534 www.baidu4.com.cn/ ????????? (...) 170' & @CRLF & _
'535 www.baidu5.com/(...) ' & @CRLF & _
'536 www.baidu6.com/service.asp(...) ' & @CRLF & _
'537 www.baidu7.com.cn/ ????????? (...) 124' & @CRLF & _
'538 baidu8.com/ ???????????????? (...) 293' & @CRLF & _
'539 www.baidu9.com/(...) ' & @CRLF & _
'540 www.baidu10.net/ ??????????? (...) 197' & @CRLF & _
'549 www.baidu11.com/?from=sst ??????????? (...) 123' & @CRLF & _
'560 www.baidu12.com/list.asp?ProdId=003-C-03-049 ???????? (...) 206' & @CRLF & _
'569 www.baidu13.com.cn/?.3847589.html ??????????? (...) 384' & @CRLF & _
'570 www.baidu14.com/(...) ' & @CRLF & _
'571 www.baidu15.com/ ????????? (...) 238' & @CRLF & _
'572 www.baidu16.gov.com.cn/ ??????????????? (...) 340' & @CRLF & _
'573 ww.baidu17.org/(...) ' & @CRLF & _
'574 www.baidu18.com.cn/(...) ' & @CRLF & _
'575 baidu19.com/ ??????????? (...) 396' & @CRLF & _
'576 baidu20.com/ ????????? (...) 323' & @CRLF & _
'577 www.baidu21.org.cn/index.htm ????????????? (...) 327'
;Local $str = FileRead('需提取的文档.txt') ;实际应用为读取文档
;MsgBox(0, '原字符串', $Str)
Local $shz = '(?:com|org|net|com.cn)' ;可以按格式修改后缀
Local $File = '提取网址.txt' ;输出文件
Local $Test = StringRegExp($str, '(?i)\H+?' & $shz, 3)
If @Error Then MsgBox(48, '错误', '未找到匹配的网址')
Local $sText = _ArrayToString($Test, @CRLF)
FileDelete($File)
FileWrite($File, $sText)
ShellExecute($File) 哈哈,学习了,谢谢afan 回复 4# afan
太感谢afan了,问题已经完美解决了!谢谢!!!!PS:有事耽误了,所以现在才回复道谢!
页:
[1]