Amazon Bedrock Data Automation(BDA)를 통해 멀티모달 콘텐츠로 부터 인사이트 도출하기
Amazon Bedrock Data Automation은 비정형 콘텐츠에서 인사이트를 자동으로 추출하여 애플리케이션 개발을 간소화합니다.
개요
멀티 모달 컨텐츠에 대한 인사이트를 자동으로 생성할 수 있으며. AI 애플리케이션을 빌드하고 테스트할 수 있는 플랫폼을 찾고 있었습니다.이때 Bedrock Data Automation이 정식 출시된 것을 확인하였고 관련 문서를 작성하게 되었습니다.
2025년 3월 정식 출시되었습니다.
Amazon Bedrock Data Automation이란?
Bedrock Data Automation(BDA)은 문서, 이미지, 비디오 및 오디오와 같은 비정형 콘텐츠에서 중요한 인사이트를 추출하는 프로세스를 간소화하는 클라우드 기반 서비스입니다. BDA는 생성형 AI를 활용하여 멀티모달 데이터를 구조화된 형식으로 변환하는 작업을 자동화하므로 개발자는 애플리케이션을 구축하고 복잡한 워크플로를 더 빠르고 정확하게 자동화할 수 있습니다.
- 문서 처리: BDA를 사용하면 분류, 추출, 정규화 또는 검증과 같은 복잡한 문서 처리 작업을 오케스트레이션할 필요 없이 대규모로 지능형 문서 처리(IDP) 워크플로를 자동화할 수 있습니다. 이렇게 하면 비정형 문서를 비즈니스별 정형 데이터 출력으로 변환할 수 있습니다. BDA 출력을 사용자 지정하여 기존 시스템 및 워크플로와 통합할 수 있습니다.
- 미디어 분석: 비정형 비디오에 의미 있는 인사이트를 추가합니다. 각 장면에 대한 요약을 생성하고, 안전하지 않거나 명시적인 콘텐츠를 식별하고, 비디오에 표시되는 텍스트를 추출하고, 광고 또는 브랜드에 따라 콘텐츠를 분류합니다. 그런 다음 이러한 인사이트를 활용하여 지능형 비디오 검색을 활성화하고, 컨텍스트 광고 배치를 개선하고, 브랜드 안전 및 규정 준수를 지원할 수 있습니다.
- 생성형 AI 어시스턴트: 문서, 이미지, 비디오 및 오디오에서 추출한 풍부한 형식별 데이터 표현을 제공하여 검색 증강 생성(RAG) 기반 질문에 답변하는 애플리케이션의 성능을 개선합니다.
BDA는 단일 인터페이스를 통해 멀티모달 콘텐츠를 처리할 수 있는 통합된 API 기반 환경을 제공하므로 여러 AI 모델 및 서비스를 관리하고 오케스트레이션할 필요가 없습니다. 시각적 근거 및 신뢰도 점수와 같은 기본 보호 기능을 통해 BDA는 추출된 인사이트의 정확성과 신뢰성을 개선하여 엔터프라이즈 워크플로에 더 쉽게 통합할 수 있도록 지원합니다.
콘솔을 확인해보면 여러가지 Use Case가 존재하여 여러 가지 설정 방안들을 안내하고 있습니다.

Process
지원되는 항목 확인
공식 문서를 참고하며 진행합니다.
1. 테스트 프로젝트를 활성화합니다.

2. 작동 방식을 확인합니다.
BDA의 경우 표준 출력과 사용자 지정 출력을 지원합니다.
표준 출력은 Bedrock에서 사전 정의된 출력으로 생성시 기본 사항입니다.
사용자 지정 출력은 표준에서 정의되지 않는 사용자 맞춤형 출력을 지원하며 RDB같은 시스템에 병합할 수 있는 형식으로 정보를 전송할 수 있습니다. 이를 위해 블루프린트를 생성할 수 있습니다. 기존의 블루프린트 또한 지원하지만 해당 내용은 변경할 수 없습니다. 따라서 새 블루프린트를 생성하여야합니다.

비디오 양식에 대한 표준 출력 방식입니다.

샘플 블루프린트의 경우 수정이 불가능합니다. 사용자 지정 블루프린트를 생성해야합니다.

하지만 사용자 지정 출력의 경우 아직까진 이미지와 문서 양식(PDF, JPEG, PNG, TIFF)만 지원합니다.

테스트
우선 데모를 사용하여 테스트해보았습니다.

옵션에서 활성화한 비디오 요약
, 비디오 챕터 요약
, 비디오 내 텍스트
항목이 식별되었습니다.



re:invent 내용과 Making Cut이라는 두 개의 데모를 생성하여 테스트해보았을 때 특징은 영상에 따라 출력되는 언어가 다르다는 점입니다. 기본적으로 한국어를 지원하지만 영상 속 주된 내용이 영어로 진행되는 경우 영어로 출력되는 것으로 확인됩니다.

사용자 데이터로 테스트하기 위해 프로젝트로 이동하여 테스트 버튼을 클릭합니다.

데모와 동일하게 데이터를 넣고 테스트를 수행합니다.
모든 옵션을 활성화했을 때 나오는 출력은 다음과 같습니다.

Bedrock Data Automation API
Bedrock Data Automation은 모든 AWS SDK와 함께 사용할 수 있습니다.
예를 들어 백엔드 문서 처리 애플리케이션에는 Java, .NET 또는 Rust를, 이미지, 비디오 또는 오디오 파일을 처리하는 웹 앱에는 JavaScript를, 최종 사용자가 제공한 콘텐츠를 처리하는 네이티브 모바일 앱에는 Swift를 각각 사용할 수 있습니다. 그 어느 때보다 손쉽게 멀티모달 데이터에서 인사이트를 도출할 수 있게 되었습니다.
- https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/bedrock-data-automation.html
- https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/bedrock-data-automation-runtime.html
현재 문서에서는 API 형식으로 테스트하지 않습니다. 자세한 코드 정보는 아래 포스트를 확인해주새요
비용 및 주의 사항
- 비용은 다음과 같이 청구됩니다.

- 서울 리전은 현재 지원하지 않습니다. 미국 동부(버지니아 북부)와 미국 서부(오리건)의 두 AWS 리전에서 교차 리전 추론을 통해 Amazon Bedrock Data Automation을 사용할 수 있습니다.
Reference
- https://aws.amazon.com/ko/blogs/korea/get-insights-from-multimodal-content-with-amazon-bedrock-data-automation-now-generally-available/
- https://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/bda.html
- https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/bedrock-data-automation.html
- https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/bedrock-data-automation-runtime.html