Amazon Bedrock Data Automation(BDA)를 통해 멀티모달 콘텐츠로 부터 인사이트 도출하기

Amazon Bedrock Data Automation은 비정형 콘텐츠에서 인사이트를 자동으로 추출하여 애플리케이션 개발을 간소화합니다.

개요

멀티 모달 컨텐츠에 대한 인사이트를 자동으로 생성할 수 있으며. AI 애플리케이션을 빌드하고 테스트할 수 있는 플랫폼을 찾고 있었습니다.이때 Bedrock Data Automation이 정식 출시된 것을 확인하였고 관련 문서를 작성하게 되었습니다.

2025년 3월 정식 출시되었습니다.

Amazon Bedrock Data Automation이란?

Bedrock Data Automation(BDA)은 문서, 이미지, 비디오 및 오디오와 같은 비정형 콘텐츠에서 중요한 인사이트를 추출하는 프로세스를 간소화하는 클라우드 기반 서비스입니다. BDA는 생성형 AI를 활용하여 멀티모달 데이터를 구조화된 형식으로 변환하는 작업을 자동화하므로 개발자는 애플리케이션을 구축하고 복잡한 워크플로를 더 빠르고 정확하게 자동화할 수 있습니다.

BDA는 단일 인터페이스를 통해 멀티모달 콘텐츠를 처리할 수 있는 통합된 API 기반 환경을 제공하므로 여러 AI 모델 및 서비스를 관리하고 오케스트레이션할 필요가 없습니다. 시각적 근거 및 신뢰도 점수와 같은 기본 보호 기능을 통해 BDA는 추출된 인사이트의 정확성과 신뢰성을 개선하여 엔터프라이즈 워크플로에 더 쉽게 통합할 수 있도록 지원합니다.

콘솔을 확인해보면 여러가지 Use Case가 존재하여 여러 가지 설정 방안들을 안내하고 있습니다.

Notion Image

Process

지원되는 항목 확인

공식 문서를 참고하며 진행합니다.

1. 테스트 프로젝트를 활성화합니다.

Notion Image

2. 작동 방식을 확인합니다.

BDA의 경우 표준 출력과 사용자 지정 출력을 지원합니다.

표준 출력은 Bedrock에서 사전 정의된 출력으로 생성시 기본 사항입니다.

사용자 지정 출력은 표준에서 정의되지 않는 사용자 맞춤형 출력을 지원하며 RDB같은 시스템에 병합할 수 있는 형식으로 정보를 전송할 수 있습니다. 이를 위해 블루프린트를 생성할 수 있습니다. 기존의 블루프린트 또한 지원하지만 해당 내용은 변경할 수 없습니다. 따라서 새 블루프린트를 생성하여야합니다.

Notion Image

비디오 양식에 대한 표준 출력 방식입니다.

Notion Image

샘플 블루프린트의 경우 수정이 불가능합니다. 사용자 지정 블루프린트를 생성해야합니다.

Notion Image

하지만 사용자 지정 출력의 경우 아직까진 이미지와 문서 양식(PDF, JPEG, PNG, TIFF)만 지원합니다.

Notion Image

테스트

우선 데모를 사용하여 테스트해보았습니다.

Notion Image

옵션에서 활성화한 비디오 요약, 비디오 챕터 요약 , 비디오 내 텍스트 항목이 식별되었습니다.

Notion Image
Notion Image
Notion Image

re:invent 내용과 Making Cut이라는 두 개의 데모를 생성하여 테스트해보았을 때 특징은 영상에 따라 출력되는 언어가 다르다는 점입니다. 기본적으로 한국어를 지원하지만 영상 속 주된 내용이 영어로 진행되는 경우 영어로 출력되는 것으로 확인됩니다.

Notion Image

사용자 데이터로 테스트하기 위해 프로젝트로 이동하여 테스트 버튼을 클릭합니다.

Notion Image

데모와 동일하게 데이터를 넣고 테스트를 수행합니다.

모든 옵션을 활성화했을 때 나오는 출력은 다음과 같습니다.

Notion Image

Bedrock Data Automation API

Bedrock Data Automation은 모든 AWS SDK와 함께 사용할 수 있습니다.

예를 들어 백엔드 문서 처리 애플리케이션에는 Java, .NET 또는 Rust를, 이미지, 비디오 또는 오디오 파일을 처리하는 웹 앱에는 JavaScript를, 최종 사용자가 제공한 콘텐츠를 처리하는 네이티브 모바일 앱에는 Swift를 각각 사용할 수 있습니다. 그 어느 때보다 손쉽게 멀티모달 데이터에서 인사이트를 도출할 수 있게 되었습니다.

현재 문서에서는 API 형식으로 테스트하지 않습니다. 자세한 코드 정보는 아래 포스트를 확인해주새요

비용 및 주의 사항

Notion Image

Reference