AI-DD의 IP 발생 구조: 5가지 주요 발생 지점
1. 데이터셋 자체 (Data Asset)
- 원천 데이터의 소유권: 환자 유래 데이터, 공개 DB (ex. ChEMBL, BindingDB), 사내 실험 데이터 등
- 정제 및 가공된 독자적 DB: 전처리, 어노테이션, 필터링된 커스텀 데이터셋
- 법적 고려: GDPR, HIPAA 등 프라이버시 규정 / 라이선스 조건 (예: non-commercial use only)
핵심 IP 포인트:
“AI 모델이 아니라, AI가 학습한 고유 데이터셋 자체가 IP의 시작점일 수 있다.”
2. 모델 알고리즘 자체 (AI Architecture)
- 자체 개발한 모델 구조: GCN, Transformer 등 커스터마이징된 네트워크 구조
- 모델 훈련 및 하이퍼파라미터 세팅: 성능 향상을 위한 최적화 노하우
핵심 IP 포인트:
“모델 구조나 파라미터는 특허보다 영업비밀로 보호되는 경우가 많다.”
3. AI가 제안한 약물 후보물질 (Generated Molecules)
- 새롭게 생성된 화합물 구조: SMILES or 3D 구조 기반
- 특허 가능성: 기존에 존재하지 않았던 고유 화합물일 경우, 화합물 특허(compound patent)로 출원 가능
- 경우에 따라: AI가 찾은 Repositioning 대상 물질 → 용도특허(use patent) 가능
핵심 IP 포인트:
“AI가 만든 화합물이라도, 사람이 구조를 확인하고 실험을 통해 효능을 검증한 경우 IP로 귀속된다.”
4. 타깃-질환 연관성 예측 (Mechanism Discovery)
- 신규 기전 제안 (MOA/Target Identification)
- 예: AI가 ‘이 질환은 이 GPCR과 연관이 있다’는 연관성을 도출함
- 특허화 가능성: 새로운 타깃에 대한 치료적 접근, 기전 기반 조합물
핵심 IP 포인트:
“AI가 제시한 기전도, 사람이 실험을 통해 검증하면 특허 가능성이 발생한다.”
5. 통합 솔루션/시스템 자체 (SaMD 또는 Platform IP)
- AI-DD 플랫폼 자체: 유저 인터페이스, 결과 시각화, 학습 구조 포함
- CDS/SaMD 등록 시 고려되는 소프트웨어 IP: FDA 등록된 소프트웨어는 별도 규제 및 보안 요건이 존재
핵심 IP 포인트:
“플랫폼 자체의 시스템 아키텍처, 알고리즘 파이프라인은 저작권/특허/영업비밀 보호 대상이다.”
IP 귀속의 실제 쟁점들
| 항목 | 실무적 이슈 |
|---|---|
| 데이터 수집 파트너와의 관계 | 데이터 소유권은 누구에게 있는가? (라이선스 계약 필요) |
| AI 모델 개발 외주 시 | 모델의 저작권/IP 귀속은 계약으로 명시해야 |
| 학계/병원과의 공동연구 | 공동 발명자인 경우, 특허 출원과 IP 이전은 명확한 합의 필요 |
| 화합물의 검증 주체 | AI가 만든 구조라도, 누가 실험하고 임상까지 갔는가가 IP 귀속 핵심 |
요약: AI-DD IP는 어디서 발생하는가?
| IP 발생 지점 | 보호 수단 | 예시 |
|---|---|---|
| 데이터셋 | 저작권, 계약 | 정제된 내부 DB |
| 알고리즘 | 영업비밀, 저작권 | Custom Transformer |
| 후보물질 | 화합물/용도 특허 | AI-generated compound |
| 기전 | 기전 특허 | Target–Disease 연결성 |
| 플랫폼 | SaMD, CDS 특허/상표 | AI-DD 시스템 구조 |
HWLL 통찰:
AI가 설계한 것은 ‘가능성’일 뿐입니다.
그 가능성을 의미로 전환한 사람의 손에 IP가 귀속됩니다.
즉,
“AI의 예측 → 인간의 해석 → 실험적 검증 → 법적 보호”
이 4단계에서 ‘의미를 설계한 주체’가 결국 지식재산의 주인이 됩니다.
Leave a Reply