Strands Agents와 MCP를 사용한 신약 개발 연구 어시스턴트 개발

신약 개발은 복잡하고 시간이 많이 소요되는 과정으로, 연구자들이 방대한 양의 과학 문헌, 임상시험 데이터, 분자 데이터베이스를 탐색해야 합니다. Genentech과 AstraZeneca 같은 생명과학 고객들은 AI 에이전트와 기타 생성형 AI 도구를 사용하여 과학적 발견의 속도를 높이고 있습니다. 이러한 조직의 개발자들은 이미 Amazon Bedrock Agents의 완전 관리형 기능을 사용하여 초기 약물 타겟 식별부터 의료진 참여에 이르기까지 모든 영역에서 도메인별 워크플로우를 신속하게 배포하고 있습니다.
하지만 더 복잡한 사용 사례에서는 오픈소스 Strands Agents SDK를 사용하는 것이 더 유리할 수 있습니다. Strands Agents는 AI 에이전트를 개발하고 실행하기 위한 모델 기반 접근 방식을 취합니다. 커스텀/내부 대규모 언어 모델(LLM) 게이트웨이를 포함한 대부분의 모델 제공업체와 호환되며, Python 애플리케이션을 호스팅할 수 있는 곳 어디서든 에이전트를 배포할 수 있습니다.
이 포스트에서는 Strands Agents와 Amazon Bedrock을 사용하여 신약 개발을 위한 강력한 연구 어시스턴트를 만드는 방법을 보여드립니다. 이 AI 어시스턴트는 모델 컨텍스트 프로토콜(MCP)을 사용하여 여러 과학 데이터베이스를 동시에 검색하고, 발견한 내용을 종합하여 약물 타겟, 질병 메커니즘, 치료법에 대한 포괄적인 보고서를 생성할 수 있습니다.

솔루션 개요

이 솔루션은 Strands Agents를 사용하여 고성능 파운데이션 모델(FM)을 arXiv, PubMed, ChEMBL과 같은 일반적인 생명과학 데이터 소스와 연결합니다. 모델 컨텍스트 프로토콜(MCP) 서버를 신속하게 생성하여 데이터를 쿼리하고 대화형 인터페이스에서 결과를 확인하는 방법을 보여줍니다.
함께 협업하는 전문 AI 에이전트들은 단일한 거대 에이전트보다 종종 더 나은 결과를 만들어낼 수 있습니다. 이 솔루션은 각각 고유한 FM, 명령어, 도구를 가진 하위 에이전트들의 “팀”을 사용합니다. 다음 플로우차트는 오케스트레이터 에이전트(주황색으로 표시)가 사용자 쿼리를 처리하고 정보 검색(녹색) 또는 계획, 종합 및 보고서 생성(보라색)을 위해 하위 에이전트들로 라우팅하는 방법을 보여줍니다.

이 포스트는 로컬 개발 환경에서 Strands Agents로 구축하는 것에 중점을 둡니다. AWS Lambda, AWS Fargate, Amazon EKS 또는 Amazon EC2에서 프로덕션 에이전트를 배포하려면 Strands Agents 문서를 참조하시기 바랍니다.

전제조건

이 솔루션은 Python 3.10+, strands-agents 및 여러 추가 Python 패키지가 필요합니다. 이러한 종속성을 관리하기 위해 venv나 uv와 같은 가상 환경을 사용하는 것을 강력히 권장합니다.
다음 단계에 따라 로컬 환경에 솔루션을 배포하세요.

1. GitHub에서 코드 리포지토리를 클론합니다. 해당 리포지토리에는 다양한 주제의 코드들이 존재하므로 필요한 특정 폴더만 현재 작업 경로에 복사하고 나머지는 삭제하는 방법을 사용했습니다.

git clone https://github.com/aws-samples/aws-ai-ml-workshop-kr.git
cp -r aws-ai-ml-workshop-kr/genai/aws-gen-ai-kr/20_applications/25_drug_discovery_agent ./
rm -rf aws-ai-ml-workshop-kr
cd 25_drug_discovery_agent

2. uv가 없는 환경이라면 아래 과정을 통해 설치를 진행합니다.

# 1. uv 설치
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 쉘 자동완성 설정 (bash 사용자의 경우)
if [ "$SHELL" = "/bin/bash" ]; then
  echo 'eval "$(uv generate-shell-completion bash)"' >> ~/.bashrc
  echo 'eval "$(uvx --generate-shell-completion bash)"' >> ~/.bashrc
fi

# 3. 설정 적용
source ~/.bashrc

# 4. uv 최신 버전으로 업데이트
uv self update

3. 가상 환경을 구성 후 필요한 Python 종속성을 설치합니다.

uv venv
source .venv/bin/activate
uv pip install -r requirements.txt

4. AWS 자격 증명을 환경 변수로 설정하거나, 자격 증명 파일에 추가하거나, 기타 지원되는 프로세스를 따라 구성합니다. 아래 코드는 자격 증명 파일에 프로파일을 추가하는 방법입니다. my-project 대신 원하는 프로파일명을 사용하고, 충분한 권한이 있는 IAM사용자의 AWS Access Key ID와 AWS Secret Access Key를 발급 받아 입력합니다. 이 블로그에서는 Default region name을 us-west-2로 진행합니다.

aws configure --profile my-project

다음 명령어를 통해 프로파일을 전환할 수 있습니다.

export AWS_PROFILE=my-project

5. 아래 코드를 활용하여 Tavily API 키를 .env 파일에 저장합니다.

Tavily 홈페이지를 접속하여 가입 후 API Key를 발급할 수 있으며, 무료 버전의 경우 1,000 API Credits/월 이므로 충분히 테스트를 진행할 수 있습니다.
아래 코드에서 발급 받은 API Key로 수정한 뒤 코드를 실행합니다.

cat > .env << EOF
TAVILY_API_KEY="YOUR_API_KEY"
EOF

6. AWS 계정에서 다음 Amazon Bedrock Foundation Models에 대한 액세스 권한이 필요합니다:
AWS 관리 콘솔 로그인 후 Amazon Bedrock console에 진입 후 좌측 메뉴 하단에 모델 액세스(Model access)를 클릭한 뒤, 위 네가지 모델 접근 권한을 활성화 합니다.
• Anthropic Claude 4 Sonnet
• Anthropic Claude 3.7 Sonnet
• Anthropic Claude 3.5 Sonnet
• Anthropic Claude 3.5 Haiku

7. 한국어로 원활하게 PDF를 생성하기 위해 한국어를 지원하는 폰트(예. 나눔고딕 폰트)의 ttf 파일을 다운로드하여 assets/로 이동하고 chat.py의 font_path를 변경해야 합니다.

절차

파운데이션 모델, MCP 도구, 하위 에이전트를 정의하여 Strands에서 연구 어시스턴트를 생성합니다. 이미 코드는 완성 되어 있으므로 작성된 코드의 핵심 부분만 살펴보겠습니다.

파운데이션 모델 정의

Strands Agents BedrockModel 클래스를 사용하여 Amazon Bedrock의 파운데이션 모델에 대한 연결을 정의하는 것부터 시작합니다. 기본 모델로 Anthropic Claude 3.7 Sonnet을 사용합니다.