StudentZero

V1

2023/01/12阅读:14主题:极客黑

CADD

工作流工具对化学信息学家很有用,例如 Knime、Pipeline Pilot(PP) 和 Orange。

就是用来说, 很难在 PP 中使用自定义的 conda env。当然,这些工作流工具本身提供了足够多的内部组件来完成许多分析任务。但是我仍希望有更多的灵活性来构建属于自己化学信息学管道工具。

最近我在 Mac 中更新了 Knime,发现可以在新版的 Knime 中使用用户定义的 conda env. 这是一个非常实用的功能。

下面我们尝试在非常简单的工作流程中使用它。

  • 你需要准备
    • 一个 sdf 文件
    • 一个 conda env, 并安装了 rdkit 模块

流程图

Node: conda env

Conda 环境验证可以选择本地 conda env 进行工作流。用户可以很容易地选择环境。

Node: SDF Reader config

Node: python script

然后,我在 python 脚本节点中定义了 flow valiable,如下所示。

并在节点中写了一些代码。

# Copy input to output
output_table_1 = input_table_1.copy()
from rdkit import Chem
from rdkit.Chem import Descriptors
output_table_1['ROMol'] = output_table_1['Molecule'].apply(Chem.MolFromMolBlock)
output_table_1['SMILES'] = output_table_1['ROMol'].apply(Chem.MolToSmiles)
output_table_1['MolWt'] = output_table_1['ROMol'].apply(Descriptors.MolWt)
output_table_1['LogP'] = output_table_1['ROMol'].apply(Descriptors.MolLogP)

Node: scatter plot

来自 SDF 的数据在自定义 conda env 下的 python 脚本节点中处理良好。

完 !

分类:

人工智能

标签:

机器学习

作者介绍

StudentZero
V1