sex123 发表于 2014-8-16 10:47:48

求一正则

1.
http://www.ncbi.nlm.nih.gov/m/pubmed/334325/
网页里有 Full text: HighWire
想把HighWire 和对应的url提取出来。注意,不是所有的都是Full text: 也有 Free Full text:字样的,比如下面这个例子。
2.
http://www.ncbi.nlm.nih.gov/m/pubmed/3343252/
网页里有Free full text: HighWire
想把HighWire 和对应的url提取出来。
3.
http://www.ncbi.nlm.nih.gov/m/pubmed/25090459
网页里有 PMCID PMC4121133 Free Full Text
想把PMC4121133 提取出来。
4.
不是所有的网页都有这个full text字样,有的网页,没有这样的字样,就不用提取了。
如这个就没有
http://www.ncbi.nlm.nih.gov/m/pubmed/25090/

jtzxgfy 发表于 2014-8-18 19:51:08

1-2
text: <a href="(.*?)">HighWire<
3
<span>(PMC\d+)</span>

sex123 发表于 2014-8-18 20:23:14

1-2
text: HighWire<
3
(PMC\d+)
jtzxgfy 发表于 2014-8-18 19:51 http://www.autoitx.com/images/common/back.gif


    不一定都是highwire的
http://www.ncbi.nlm.nih.gov/m/pubmed/17355253/

wangms 发表于 2014-9-10 22:54:53

前来学习。。。。。。。。。。。。。。
页: [1]
查看完整版本: 求一正则