简化分子线性输入规范(SMILES,Simplified molecular-input line-entry system)是一种用ASCII字符串明确描述分子结构的规范,由David Weininger和Arthur Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司修改和扩展。
SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。
由于SMILES是用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。
SMILES对于每个结构的唯一性依赖于用来生成它的规范化算法,并被称为规范SMILES。规范SMILES的一个常见应用是索引和确保数据库中分子的唯一性。
1.原子用在方括号内的化学元素符号表示。
例如:[Au]表示“
DrugAI 认证博客专家 DrugAI 数据科学 生物医药 Fight Disease With Code ! Fight Disease With Data Technology !药学、医学、化学和生物与计算机和AI交叉的爱好者从业者。