Audion SDK

Audion SDK는 MAGO의 음성 AI 기능을 제공하는 SDK입니다. 이 디렉터리에는 Audion SDK를 언어별로 사용하는 방법이 정리되어 있습니다.

특징

  • 간편한 음성 AI 통합: 몇 줄의 코드로 강력한 음성 AI 기능을 애플리케이션에 추가

  • 다양한 입력 지원: 로컬 파일 및 URL을 통한 음성/비디오 처리

  • 광범위한 파일 형식: 주요 오디오 및 비디오 형식 지원

  • 유연한 Flow 시스템: 다양한 음성 AI 워크플로우 지원

  • 간단한 API: 직관적이고 사용하기 쉬운 언어별 SDK 제공

지원하는 Flow

  • audion_vu: Voice Understanding - 음성 인식 및 분석

  • audion_vh: Voice Highlight - 주요 음성 구간 추출

  • Custom Flow도 지원 가능합니다 ([email protected])

지원 파일 형식

오디오 형식

  • .wav - WAV (Waveform Audio File Format)

  • .mp3 - MP3 (MPEG-1 Audio Layer III)

  • .m4a - M4A (MPEG-4 Audio)

  • .ogg - OGG (Ogg Vorbis)

  • .flac - FLAC (Free Lossless Audio Codec)

  • .aac - AAC (Advanced Audio Coding)

  • .wma - WMA (Windows Media Audio)

  • .m4b, .m4p, .m4r, .m4v - 기타 MPEG-4 오디오 형식

비디오 형식

  • .mp4 - MP4 (MPEG-4 Part 14)

  • .mov - MOV (QuickTime File Format)

  • .avi - AVI (Audio Video Interleave)

  • .mkv - MKV (Matroska Video)

  • .webm - WebM

  • .wmv - WMV (Windows Media Video)

  • .flv - FLV (Flash Video)

  • .mpeg, .mpg - MPEG (Moving Picture Experts Group)

Last updated