提取规则设计。通过分析电子商务网页,提出三条商品信息自动提取规则,分别为:

在电子商务网页中应当在标题位置添加商品规格信息中的部分关键属性数据以及前后缀;网页中商品的属性信息要统一为HTML格式的文本语义标题以及表格标题,并且在商品的属性说明区域中要将表格的子节点、文本内容节点适当的降低所占比例;商品的属性名以及相应属性数值的位置处于文件对象模型中的同一个文本节点中时,商品的属性名称后要加上自然语言中的分隔符号,通常情况下用冒号表示。

长春网站建设

通过对提取规则的设计可以有效的提高商品被相应的搜索引擎检索和收率的概率,使用户更加快速的提取到相应的商品信息,也有利于在电子商务网页中布局以及搜索引擎的美化。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。