求一正则
1.http://www.ncbi.nlm.nih.gov/m/pubmed/334325/
网页里有 Full text: HighWire
想把HighWire 和对应的url提取出来。注意,不是所有的都是Full text: 也有 Free Full text:字样的,比如下面这个例子。
2.
http://www.ncbi.nlm.nih.gov/m/pubmed/3343252/
网页里有Free full text: HighWire
想把HighWire 和对应的url提取出来。
3.
http://www.ncbi.nlm.nih.gov/m/pubmed/25090459
网页里有 PMCID PMC4121133 Free Full Text
想把PMC4121133 提取出来。
4.
不是所有的网页都有这个full text字样,有的网页,没有这样的字样,就不用提取了。
如这个就没有
http://www.ncbi.nlm.nih.gov/m/pubmed/25090/ 1-2
text: <a href="(.*?)">HighWire<
3
<span>(PMC\d+)</span> 1-2
text: HighWire<
3
(PMC\d+)
jtzxgfy 发表于 2014-8-18 19:51 http://www.autoitx.com/images/common/back.gif
不一定都是highwire的
http://www.ncbi.nlm.nih.gov/m/pubmed/17355253/ 前来学习。。。。。。。。。。。。。。
页:
[1]