RapidMiner高级报表扩展上线!

 

RapidMiner高级报表扩展上线,数据科学家们可以利用RapidMiner自动化任何常规的Excel报表任务。现在,即使您没有使用过任何商业智能工具(如tableau、Qlik)的经验,您也可以利用该高级报表扩展从头开始创建一个全新的报表!

马上下载:
RapidMiner高级报表扩展

下面开始使用吧~

在Excel中创建模板

   

创建一个虚拟工作表,并添加所有需要的布局组件,图表,文本和数据区域。

我们可以使用任何格式,图表类型或颜色。 只有一件事很重要:我们需要预留空间来插入数据,之后我们用RapidMiner的数据覆盖表中的部分内容。 因此,如果我们有三名以上的员工,我们可在表格和图表之间留出更多的空间,或者将数据放入单独的工作表中,并在图表中引用。 插入一些虚拟值,以便您可以看到图表的变化。

 



在RapidMiner中创建流程加载数据


RapidMiner是将数据转化为任何图表格式的常用工具。 它可以读取不同的格式和来源,然后将数据处理成您需要的图表形态。

在下图右侧,您可以看到一个流程,它将来自四个不同来源的数据与多个联接和预处理步骤相结合,以匹配数据。 这样一个流程提供了我们需要的工作时间表数据。
当然,它可以简单到只包含一个单一的SQL查询语句,也可以复杂到涉及web services的调用,大数据,Hadoop分析和机器学习等等。 诀窍在于,我们可以利用RapidMiner的灵活性来获取我们要放入Excel表单的数据。

打开报表

    

一旦我们获得所需格式的数据,我们从扩展中添加一个Open Report(Excel)算子。您可以在算子树的右侧看到它。
我们需要将该算子指定两个文件:
在步骤1中创建并保存的模板文件,您可以使用参数form template file或tem输入端口。
可由target file参数指定,也可以使用tar输出端口。

文件的端口允许您在以后的流程中想要使用它时可以方便地处理文件。您甚至可以在RapidMiner流程中创建一个模板文件,或者将文件存储在RapidMiner Server的存储库中,以便在许多用户之间共享。如果要压缩结果或在RapidMiner Server Web Service或Web应用程序中返回为Web Service结果,则输出文件端口最为有用。

我们需要转到Open Report(Excel)算子的输入端口,以将我们想要的数据插入Excel文件中。我们将使用在内部子进程中传递到这些端口的数据进行实际的数据插入。 



插入表格数据


如果我们进入Open Report( Excel)算子的内部流程,我们可以添加Write Data Entry(Excel)算子,以将ExampleSet插入到Excel中。算子可以选择要使用的属性以及放置的位置。 因此,您可以通过索引来指定要插入的工作表,然后你指向一个填充范围。对于从步骤1的员工表,我们将其设置为B11:C13。选择fit to range,否则如果我们的数据不符合此范围,则该流程将失败。
我们将添加另一个这种类型的算子来输出第二个表。

插入数据

    

唯一缺少的是版本标签,让人们之后打开时知道这个报告展示的内容,因此,我们首先使用RapidMiner的核心功能中的Generate Macro算子来创建包含当前日期和时间的流程变量。然后,我们从高级报表扩展中添加一个Write Cell(Excel)算子并连接端口。虽然没有数据从Generate Macro算子流向Write Cell(Excel)算子,但连接确保在读取前首先执行Generate Macro算子并设置流程变量。

之后我们只需要将Write Cell(Excel)算子指向正确的填充位置,这在我们的例子中是F5。正确设置值和类型以进行下一步。

日期的注意点:日期格式存在多种样式。如果要写入日期到Excel,首先需要解析该值在RapidMiner中的日期格式。所以如果你输入像2017-03-29 23:59:59这样的值,你应该在Write Cell(Excel)算子的date format参数中输入“yyyy-MM-dd HH:mm:ss”,它将自动转换为Excel模板表格的正确格式。