RapidMiner 7.4 新特性

2017-02-27

后台执行


此功能仅适用于拥有大型许可证的用户。

可以在Studio的后台执行进程,同时在用户界面中处理不同的进程。

 

Odoo text and image block

后台监控

后台监视器显示后台进程的当前状态并提供对结果的访问。

 

Odoo text and image block

并行循环


RapidMiner现在具有新的并行循环算子,可以一次运行多个迭代,充分利用可用的CPU内核(达到RapidMiner许可证的限制),大大加快了您的流程。

新的并行循环算子。
新的并行循环值算子。
新的并行循环属性算子。
新的并行循环文件算子。

请注意,由于兼容性原因,已经存在的进程仍将使用这些旧算子!为了在这样的进程中使用新的算子,您需要用新的算子手动替换现有的算子。

 

存储库排序


现在,Repository面板允许在字母数字和时间顺序之间切换。

 

Odoo text and image block

授予扩展其他权限


具有大型许可证的用户现在可以向未签名的扩展授予额外的权限。可以通过设置对话框的启动部分中的切换来完成。默认情况下不启用这些权限,因为它们通过允许在系统中运行未知软件会增加安全风险。

 

Odoo text and image block

介绍 SparkRM

RapidMiner Radoop 7.4引入了SparkRM(可用于“企业”许可证)。使用SparkRM,RapidMiner Studio中存在的任何算子或进程都可以在Hadoop环境中并行运行,利用Spark作为执行框架。
新的SparkRM元算子中的用户定义的子进程(即可视化定义的代码)可以包含任何内存中的RapidMiner算子,包括来自扩展的算子。算子封装该子进程并将其推送到Hadoop,在Hadoop中,它在Spark内可能在多个Hadoop节点上自动执行。提供给SparkRM算子的输入数据被分区(根据属性的值,线性地或只是随机地)并且预先分发到Hadoop节点。然后RapidMiner子进程在所有这些分区上运行,潜在地在许多Hadoop节点中。执行后,如果是相干数据集,则结果将合并,否则返回为集合。

SparkRM打开了多种新的用例,现在可以通过Radoop本地解决Hadoop,特别是那些需要扩展,如文本分析,过程挖掘,时间序列分析或预测等。
Odoo text and image block
Odoo text and image block

支持Hadoop用户模拟(“代理”用户)

RapidMiner Radoop 7.4 支持Hadoop用户模拟,在使用RapidMiner Server连接到Hadoop集群时,大大简化了Radoop连接设置和管理。RapidMiner Server上的Radoop连接可以用Hadoop“代理”超级用户的密码来定义。当RapidMiner Studio用户登录RapidMiner Server时,RapidMiner对其进行身份验证。一旦登录,每当运行一个Radoop任务,超级用户将模仿RapidMiner用户,该任务将具有Hadoop中该用户被授予的权限。

这种方法减少了管理工作,因为RapidMiner Server中的单个Radoop连接可以被多个用户使用。这在多用户安装中将特别有用。