获取详细信息页具体内容。详细信息页主要分成两部分:基础信息和其他信息。由于不同信息类型会有不同的小标题,因此提取内容时,用if先进行判断有无该小标题,若有,则将内容赋值,若无,则将该小标题赋空值,防止因为无法找到该小标题,从而影响整页文书的爬取。
基础信息都在fullJudgement下面,直接提取出来即可,并放入Basic_Information列表中。
其他信息是在fullJudgement下面的paragraphs下面,所以要先将paragraphs提取出来,再一一将其他小标题提取出来,再放入Document_body列表中。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。