いったんエッシェンシャルでいい

音声抽出

ffmpeg -i '/input.mp4' -vn -acodec copy '/output.aac'