티스토리 뷰

ChemDraw를 사용하면 SMILES를 화학구조로 변환할 수도 있고, 화학구조를 SMILES로 변환할 수 있습니다. 이 글에서는 SMILES가 무엇인지, 그리고 ChemDraw를 이용해서 SMILES와 화학구조를 자유롭게 변환하는 방법에 대하여 알아보겠습니다.

SMILES 표기법이란?

SMILES라고 하면 가장 먼저 떠오르는 단어는 '웃다'입니다. 하지만 화학에서 SMILES란, Simplified Molecular Input Line Entry System의 줄임말로, 1980년대 후반에 뉴 멕시코에 있는 회사 Daylight Chemical Information Systems가 만든 화학구조의 표기법입니다. 최근에는 AI 딥러닝과 화학의 융합연구가 활발해지면서 SMILES 구조의 활용이 폭발적으로 증가하고 있습니다.

화학을 공부하는 분들은 인터넷에서 시약이나 물질을 검색하면 아래 그림처럼 알파벳으로 길게 적혀있는 부분을 보신 적이 있으실 겁니다.

이 나열을 SMILES 표기법이라고 하는데, SMILES 표기법은  원자 (atom), 결합 (bond), 고리 (ring), 방향족 (aromaticity), 그리고 가지 (branch)로 크게 다섯 가지 요소로 이루어져 있습니다. 이 다섯 가지의 요소는 각자의 규칙을 갖고 있기 때문에 그 어떤 화학구조도 표기가 가능합니다. 위의 SMILES를 화학구조로 변환하면, 아래의 RGD peptide라는 물질이 그려집니다.

RGD peptide

SMILES에서 Structure로 변환하기

ChemDraw에는 SMILES 표기법을 Structure로 간단히 바꿀 수 있는 기능이 있습니다. 한 가지 예시로 아래의 SMILES를 가져와 보겠습니다.

CC1=CC2=C(C=C1C)N(C=N2)C3C(C(C(O3)CO)OP(=O)(O)OC(C)CNC(=O)CCC4(C(C5C6(C(C(C(=C(C7=NC(=CC8=NC(=C(C4=N5)C)C(C8(C)C)CCC(=O)N)C(C7(C)CC(=O)N)CCC(=O)N)C)[N-]6)CCC(=O)N)(C)CC(=O)N)C)CC(=O)N)C)O.[C-]#N.[Co+3]

보기만 해도 너무나 복잡한 나열입니다.

이 복잡한 SMILES 표기법을 ChemDraw 문서 창에 그리려면,

1. SMILES를 복사합니다. (ctrl+C)

2. ChemDraw 상단 메뉴의 Edit-Paste Special-SMILES를 클릭합니다.

그러면 아래의 그림처럼 화학구조가 나타납니다. 이 물질은 Vitamine B12의 구조입니다. 

비타민 B

단축키는 문서 창에서 'Alt+Ctrl+P'를 누르면 바로 화학구조가 나타납니다.

 

Structure를 SMILES로 변환하기

ChemDraw로 그린 구조를 SMILES 표기법으로 변환하는 방법도 있습니다. 보통 ChemDraw로 그린 구조를 SciFinder로 찾을 때 유용한 기능이니 알아두면 좋습니다.

Structure

위의 구조를 SMILES 표기법으로 변화하는 방법은 아래와 같습니다.

1. 구조를 선택합니다.

2. 상단 메뉴의 Edit-Copy As-SMILES를 선택합니다.

3. 붙여 넣기(Ctrl+V)를 하면 아래와 같이 SMILES 표기법으로 나타납니다.

O[Al]1N2C3=C4C=C(CCCC5)C5=CC4=C2/N=C6C7=C(C=C8C(CCCC8)=C7)C(/N=C9C%10=C(C=C%11C(CCCC%11)=C%10)/C(N/91)=N/C%12=N/C(C%13=C%12C=C(CCCC%14)C%14=C%13)=N\3)=N/6

단축키(Alt+Ctrl+C)를 사용하면 더욱 쉽게 SMILES로 변환할 수 있습니다.

 

프로그래밍을 하는 개발자분들이나 그분들과 협업을 하는 화학 연구자라면 ChemDraw를 이용하여 쉽게 SMILES와 Structure를 변환하여 효율적인 업무를 할 수 있습니다.