d12990 发表于 2013-10-16 15:29:17

100rmb 找兄弟写一个根据关键词在谷歌采集文章的脚本

大致功能如下:

用某个关键词,比如,“怎么零成本创业”,在谷歌搜索,然后在搜索结果里面采集符合要求的文章
具体要求:门户网站,百度,视频等大网站的不采集,只采集小网站的文章,只要是一篇完整的文章就行,不需要带图片,文章里面如果有网址 联系方式这些要能自动过滤,可以设置从第几页开始采,比如第5页,第10页。一个关键词 可以采集多篇文章,然后保存本地txt文件。 重新智能从谷歌采集,其他搜索引擎不要,大致功能就这样,程序只要能完成基本的功能就行,难看点没事,呵呵   
能做的兄弟 加我QQ:755373578

绿色风 发表于 2013-10-16 17:23:17

东西比较智能
单价比较低康

sdu123 发表于 2013-10-17 17:22:19

写个采集器不难   可是过滤出文章内容我就不精通了   毕竟每个网站过滤的正则不一样   期待高手吧

d12990 发表于 2013-10-17 20:20:21

期待高手,权当是练手吧

wuyaqi 发表于 2013-10-18 21:25:27

这么智能的过滤器不好做.就过滤器,我都可以开价5000了.

internew 发表于 2014-4-23 12:57:20

正在学习内
页: [1]
查看完整版本: 100rmb 找兄弟写一个根据关键词在谷歌采集文章的脚本