Audion SDK
Audion SDK는 MAGO의 음성 AI 기능을 제공하는 SDK입니다. 이 디렉터리에는 Audion SDK를 언어별로 사용하는 방법이 정리되어 있습니다.
특징
간편한 음성 AI 통합: 몇 줄의 코드로 강력한 음성 AI 기능을 애플리케이션에 추가
다양한 입력 지원: 로컬 파일 및 URL을 통한 음성/비디오 처리
광범위한 파일 형식: 주요 오디오 및 비디오 형식 지원
유연한 Flow 시스템: 다양한 음성 AI 워크플로우 지원
간단한 API: 직관적이고 사용하기 쉬운 언어별 SDK 제공
지원하는 Flow
audion_vu: Voice Understanding - 음성 인식 및 분석audion_vh: Voice Highlight - 주요 음성 구간 추출Custom Flow도 지원 가능합니다 ([email protected])
지원 파일 형식
오디오 형식
.wav- WAV (Waveform Audio File Format).mp3- MP3 (MPEG-1 Audio Layer III).m4a- M4A (MPEG-4 Audio).ogg- OGG (Ogg Vorbis).flac- FLAC (Free Lossless Audio Codec).aac- AAC (Advanced Audio Coding).wma- WMA (Windows Media Audio).m4b,.m4p,.m4r,.m4v- 기타 MPEG-4 오디오 형식
비디오 형식
.mp4- MP4 (MPEG-4 Part 14).mov- MOV (QuickTime File Format).avi- AVI (Audio Video Interleave).mkv- MKV (Matroska Video).webm- WebM.wmv- WMV (Windows Media Video).flv- FLV (Flash Video).mpeg,.mpg- MPEG (Moving Picture Experts Group)
Last updated