liyonghk 发表于 2012-5-8 13:27:46

请问大侠们提取TXT文件里的网址然后保存如何写?(求好心人帮忙)【已解决】

本帖最后由 liyonghk 于 2012-5-13 11:15 编辑

请问大侠们提取TXT文件里的网址然后保存如何写?

程序大致的功能就是:
1.导入一个txt记事本进入。(里面有一些乱码和一些网址混在一起了,域名有带www的也有不带www的,后缀有com、org、net、com.cn的等等,PS:最好是后缀名可以自定义添加修改的!)
2.提取txt记事本里面的网址。
3.保存到另外一个txt记事本文件里。(保存的格式是一行一个网址)

这几个功能对于大侠们来说应该是小菜一碟,对于我这样的小菜来说就很难了,希望那位好心大侠出来帮我实现了,小弟先再次感谢这位好心大侠了!{:face (356):}


下面是TXT文本的部分内容,格式基本就是这样的,网址我全部用baidu代替了,这样应该不会影响什么!

529 baidu.com/(...)   
530 www.baidu1.com/ ???????? (...) 185
531 baidu2.com/index.asp(...)   
533 www.baidu3.com/(...)   
534 www.baidu4.com.cn/ ????????? (...) 170
535 www.baidu5.com/(...)   
536 www.baidu6.com/service.asp(...)   
537 www.baidu7.com.cn/ ????????? (...) 124
538 baidu8.com/ ???????????????? (...) 293
539 www.baidu9.com/(...)   
540 www.baidu10.net/ ??????????? (...) 197
549 www.baidu11.com/?from=sst ??????????? (...) 123
560 www.baidu12.com/list.asp?ProdId=003-C-03-049 ???????? (...) 206
569 www.baidu13.com.cn/?.3847589.html ??????????? (...) 384
570 www.baidu14.com/(...)   
571 www.baidu15.com/ ????????? (...) 238
572 www.baidu16.gov.com.cn/ ??????????????? (...) 340
573 ww.baidu17.org/(...)   
574 www.baidu18.com.cn/(...)   
575 baidu19.com/ ??????????? (...) 396
576 baidu20.com/ ????????? (...) 323
577 www.baidu21.org.cn/index.htm ????????????? (...) 327

天煞孤心 发表于 2012-5-8 13:48:32

将你的TXT记事本的内容发上来看看,虽然你那几个问题对大师们来说简单,但是要大师们来猜你文本的内容却不简单。

liyonghk 发表于 2012-5-8 14:14:55

回复 2# 天煞孤心

已经附上代码,谢谢你的提醒!

afan 发表于 2012-5-8 14:43:13

本帖最后由 afan 于 2012-5-8 16:43 编辑

#include <Array.au3>

Local $Str = _
                '529 baidu.com/(...)   ' & @CRLF & _
                '530 www.baidu1.com/ ???????? (...) 185' & @CRLF & _
                '531 baidu2.com/index.asp(...)   ' & @CRLF & _
                '533 www.baidu3.com/(...)   ' & @CRLF & _
                '534 www.baidu4.com.cn/ ????????? (...) 170' & @CRLF & _
                '535 www.baidu5.com/(...)   ' & @CRLF & _
                '536 www.baidu6.com/service.asp(...)   ' & @CRLF & _
                '537 www.baidu7.com.cn/ ????????? (...) 124' & @CRLF & _
                '538 baidu8.com/ ???????????????? (...) 293' & @CRLF & _
                '539 www.baidu9.com/(...)   ' & @CRLF & _
                '540 www.baidu10.net/ ??????????? (...) 197' & @CRLF & _
                '549 www.baidu11.com/?from=sst ??????????? (...) 123' & @CRLF & _
                '560 www.baidu12.com/list.asp?ProdId=003-C-03-049 ???????? (...) 206' & @CRLF & _
                '569 www.baidu13.com.cn/?.3847589.html ??????????? (...) 384' & @CRLF & _
                '570 www.baidu14.com/(...)   ' & @CRLF & _
                '571 www.baidu15.com/ ????????? (...) 238' & @CRLF & _
                '572 www.baidu16.gov.com.cn/ ??????????????? (...) 340' & @CRLF & _
                '573 ww.baidu17.org/(...)   ' & @CRLF & _
                '574 www.baidu18.com.cn/(...)   ' & @CRLF & _
                '575 baidu19.com/ ??????????? (...) 396' & @CRLF & _
                '576 baidu20.com/ ????????? (...) 323' & @CRLF & _
                '577 www.baidu21.org.cn/index.htm ????????????? (...) 327'

;Local $str = FileRead('需提取的文档.txt')        ;实际应用为读取文档
;MsgBox(0, '原字符串', $Str)


Local $shz = '(?:com|org|net|com.cn)'        ;可以按格式修改后缀
Local $File = '提取网址.txt'                ;输出文件

Local $Test = StringRegExp($str, '(?i)\H+?' & $shz, 3)
If @Error Then MsgBox(48, '错误', '未找到匹配的网址')
Local $sText = _ArrayToString($Test, @CRLF)
FileDelete($File)
FileWrite($File, $sText)
ShellExecute($File)

jingygr 发表于 2012-5-8 15:25:10

哈哈,学习了,谢谢afan

liyonghk 发表于 2012-5-13 11:11:49

回复 4# afan

太感谢afan了,问题已经完美解决了!谢谢!!!!PS:有事耽误了,所以现在才回复道谢!
页: [1]
查看完整版本: 请问大侠们提取TXT文件里的网址然后保存如何写?(求好心人帮忙)【已解决】