开放接口说明RxTask接口


 interface RxTask , 包含当前要执行的Task信息,也可以添加运行时的log信息和创建下个Rule的Task。

函数定义:

public void log(String logMessage);  

在使用在线开发环境时候,打印log信息到页面上以方便进行程序调试。Web2Data平台也支持用户在自己的抓取程序里使用log4j打印log信息,不过打印出的信息会记录在数据抓取引擎所在的服务器。

public void createNextRuleTask(RxTask task) throws RxCrawlerException;

在当前抓取程序时抓取的数据可以作为下一个Rule的输入数据,这时候使用该函数可以创建下一个Rule的任务。

public void createNextRuleTasks(RxTask[] tasks) throws RxCrawlerException;

在当前抓取程序时抓取的数据可以作为下一个Rule的输入数据,这时候使用该函数批量创建下一个Rule的多个任务,能够提高创建速度。

public void logScreen();

用户调用这个方法, 在在线编辑平台的控制台上会打印出一个URL, 用户点击这个URL后会显示当前爬虫机的屏幕截图

public int getAppSeq();

返回当前App的唯一标识序号

public int getScenarioIndex(); 

返回当前Scenario的唯一标识序号

public int getRuleIndex();

返回当前Rule的唯一标识序号

public String getScheduleType();

返回当前任务运行的类型,通过网页在线开发时候生成的任务为TEST, 后台JOB启动的为JOB, 通过Web Api生成调度的任务为API

public int getCrawlerSeq();

返回当前爬虫机引擎序号

public int getSessionIndex();

返回当前爬虫机Session序号

public String getCrawlerHostIP();

返回当前爬虫机IP地址

public int getTaskSeq();

返回当前任务唯一标识序号

public String getUserName();

如果当前App需要登录目标网站,返回用户名,否则为空

public String getPassword();

如果当前App需要登录目标网站,返回登录密码,否则为空

public int getSourceTaskSeq();

返回生成当前任务的任务序号

以下为得到任务输入数据参数V1, V2, V3, V4, V5, V6, V7, V8, V9

public String getV1();
public void setV1(String v1);
public String getV2();
public void setV2(String v2);
public String getV3();
public void setV3(String v3);
public String getV4();
public void setV4(String v4);
public String getV5();
public void setV5(String v5);
public String getV6();
public void setV6(String v6);
public String getV7();
public void setV7(String v7);
public String getV8();
public void setV8(String v8);
public String getV9();
public void setV9(String v9);