cashiba 发表于 2021-4-16 21:01:04

[已解决]用正则提取段落>

本帖最后由 cashiba 于 2021-4-17 01:56 编辑

  四、重点群体就业仍面临一定压力



  虽然当前就业形势总体稳定,但重点群体就业仍面临一定压力。3月份,由于节后大量外来人员集中进入劳动力市场,部分人员仍处于寻找工作期,外来农业户籍人口(主要是进城农民工)失业率比2月份上升0.1个百分点,达到5.4%。从青年群体就业情况看,由于青年人就业稳定性较弱,寻找工作时间更长,失业率有所上升。3月份,16—24岁青年失业率为13.6%,比2月份上升0.5个百分点。今年高校毕业生总量达909万人,再创历史新高,随着6月份毕业季的来临,青年人就业仍存在较大压力。



  今年以来,在疫情防控效果持续显现的情况下,投资消费持续恢复,特别是服务业有望稳步恢复,吸纳就业能力将明显增强。同时各类新产业、新业态、新模式发展壮大,各种各样的灵活就业模式拓展巩固,将有力推动就业形势保持稳定。下一步,要继续保持宏观政策的连续性、稳定性和可持续性,强化就业优先政策,狠抓政策落实,保持就业大局稳定。

如上,一篇文章有若干个"(序号)+(、)+(标题) + (内容段落)"这样的段组成的文章。想用正则分别获取出来。
对正则了解不精,获取序号标题比较简单,就是段落里比较多的空行及空白符不知道如何用正则表示出来


(?m)^\h*(.+?)\h*\、\h*(.+?)\v
写到这里,后面不知道怎么写了....
请路过的正则高手出手指点一下,谢谢!

附上A大的正则编辑工具保存的半成品文件,方便直接导入编辑。




afan 发表于 2021-4-16 21:21:51

试下

Highlight code by AuREHelper
(?s)(?<=^|\n)\h*(..?)\h*、\h*(\V*)\v*\s*(.*?)(?=\R+\h*..?、|$)


cashiba 发表于 2021-4-17 01:53:36

本帖最后由 cashiba 于 2021-4-17 02:00 编辑

afan 发表于 2021-4-16 21:21
试下A大这正则水平已经炉火纯青了,效果很好,这表达式写的,不明觉厉,一看就是高人,佩服佩服!
{:1_206:}
非常感谢!

页: [1]
查看完整版本: [已解决]用正则提取段落>