整体流程设计。在建立了商品提取的规则后,还要对电子商务网页对商品信息自动提取的整体流程进行设计,自动提取商品信息,要对电子商务网页中的标题信息进行预设处理,并将其划分为多个关键词后构建一个与领域相关的属性值特征词典。

再通过词典以及网页的整体统计特点对商品的属性信息以及所在的区域进行时表,最终在该区域内建立语义标题以及表格标题,将属性值所对应的商品信息自动抽取出来。

长春网站建设

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。