[ 매드타임스 최승은 기자] 인공지능 분야에서 스테빌리티 AI(Stability AI)는 최근 텍스트-이미지 모델의 진화에 있어 중요한 도약이 될 스테이블 디퓨전 3(Stable Diffusion 3)의 초기 프리뷰를 공개했다. 이 최신 버전은 다중 피사체 프롬프트 처리, 더 높은 이미지 품질 제공, 향상된 철자 능력 등에서 개선됐다고 스테빌리티 AI는 발표했다.
이 모델은 아직 일반적으로 출시되지 않았지만, 사용을 원하는 경우 프리뷰 대기자 명단에 등록해 이용할 수 있다. 접근권한을 얻게 되면 디스코드 서버 초대 메일을 받게 된다.
8억 개에서 80억 개의 파라미터를 지원하는 스테이블 디퓨전 3는 확산 트랜스포머 아키텍처와 흐름 매칭 기술을 결합한다. 이 확장 가능한 접근 방식은 고급 AI 도구에 대한 액세스를 대중화한다는 스테빌리티 AI의 목표에 부합하며, 사용자에게 창의적인 요구 사항을 가장 잘 충족할 수 있는 다양한 확장성 및 품질 옵션을 제공한다고 밝혔다.
스테이블 디퓨전 3의 출시는 이미지 생성 기술 분야에서 주목할 만한 발전을 의미한다. 이 도구는 DALL-E와 같은 다른 고급 AI 도구와 경쟁하며 사용자에게 텍스트 설명에서 사용자 지정 이미지를 생성할 수 있는 더욱 정교한 옵션을 제공한다.
한편, 스테빌리티 AI는 안전하고 책임 있는 인공지능 관행을 믿는다고 밝혔다. 즉 스테빌리티 AI가 나쁜 행위자에 의한 스테이블 디퓨전 3의 오용을 방지하기 위한 합리적인 조치를 취했으며 계속해서 합리적인 조치를 취하고 있다고 강조했다. 안전은 모델을 훈련하기 시작할 때 시작되며 테스트, 평가 및 배포 전반에 걸쳐 계속되며, 초기 프리뷰에 대비하여 수많은 안전 장치를 도입했다고 전했다. 우리는 연구자, 전문가 및 우리 커뮤니티와 지속적으로 협력함으로써 모델의 공개에 접근함에 따라 진실성을 가지고 더욱 혁신할 것으로 기대한다고 밝혔다.