文本信息提取技术。本文提出的Web页面自适应技术通过网页转换代理服务器来向目的Web应用程序请求资源, 每一次资源正确加载完成后, 网页转换系统需要实行Web页面信息提取任务, 其可以分解为Web页面文本提取和资源路径提取两项子任务。 Web应用程序整体的资源路径一般会概念在Web页面头部, 通过对页面头部进行HTML标签分析比较容易可以获得。