文本信息提取技术。本文提出的Web页面自适应技术通过网页转换代理服务器来向目标Web应用程序请求资源, 每一次资源正确加载完成后, 网页转换系统需要执行Web页面信息提取任务, 其可以分解为Web页面文本提取和资源路径提取两项子任务。
Web应用程序整体的资源路径通常会定义在Web页面头部, 通过对页面头部进行HTML标签解析很容易能够获得。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。