跳到主要内容

🔖 Palladian 扩展节点 2 分钟介绍

· 阅读需 2 分钟

Palladian 扩展 中有什么节点值得使用呢?

Palladian 是一个基于 Java 的工具包,它有一些 Internet 信息检索的节点。还有一些用于文本处理的节点。

他的付费方式比较特别: 如果您使用的是 KNIME AP 版本, 那么这个扩展就是免费的,如果你使用的是 KNIME Server/Hub 那么就是需要付费许可的

安装​

这个扩展原来是存在于 KNIME community extension 中, 后来因为包含了一些付费内容,所以放在 NodePit 上。 它的安装方法比较简单,和普通的 KNIME 官方扩展相比,需要一些额外的步骤。

  1. 在 KNIME 的选项中, File → Preferences → Install/Update → Available Software Sites ,单击 Add... 并粘贴更新站点。确保更新站点与您当前的 KNIME 版本匹配,例如 https://download.nodepit.com/4.7 对应于 KNIME 4.7 版本, 如果您 KNIME 是其他版本的,需要做相应的调整

  2. 按照正常的搜索安装 KNIME 扩展流程就可以下载安装了

节点简单介绍​

这个扩展的节点主要分为:

  1. Classification 分类
  2. Extraction 提取
  3. Geo 地理
  4. Images 图片
  5. Scoring 评分
  6. Testing 测试
  7. Web 网络

几个部分。基本上通过这些分类就知道里面有些什么功能节点了。

其中我用的比较多的是 Web 部分,尤其是 HTTP Retriever 相关节点。虽然 KNIME 也有 GET, POST 等节点,但在某些情况下,Palladian 的这些网络相关节点会更好用。比如,你获取了一篇页面,只想得到页面中的部分文字部分,那么你就可以使用 HTTP Retriever、HTML Node to Text、HTML Parser 等节点,最终以 XML 的形式进行处理。

另外有的朋友比较喜欢 Extraction 提取类别中的 Regex Extractor 正则表达式提取器, 对于正则表达式的使用的确更直观一点。

再其他的,我就没有那么太日常使用了。