Motherboard نشریهای با محوریت رسانه و فنآوری، در گزارش روز خود از فعالیت شرکتهای رسانهای بهخصوص فعالان حوزۀ صدابرداری، دوبله و انیمیشنسازی بر اساس هوشمصنوعی نوشت و گفت: «اخیراً سازندگان فیلمها و انیمیشنها، بهجای استفاده از صداپیشگان در تولیدات خود از هوشمصنوعی بهره میگیرند که این کار نه تنها ضربهزدن به روح متعالی هنر است بلکه بهنوعی فریفتن تماشاگر نیز به حساب میآید.»
این نشریه، اسنادی را فاش کرد که برمبنای آن، شرکتهای سازندۀ انیمیشن در قبال پرداخت مبالغی از صداپیشگان خواستند تا حق استفاده از صدایشان در بانک اطلاعاتی هوشمصنوعی را به دست آورند.این مطلب بدان معناست که در آینده، تولیدات سینمایی و انیمهها با صدای ساختگی این افراد که توسط هوشمصنوعی، کپیبرداری شده، پخش خواهد شد نه با صدای اصلی این افراد.
در همین حال، نیویورک تایمز نیز ایمیلهای شرکت اکتیویژن بلیزارد- یکی از بزرگترین ناشران بازی در جهان- را که به دفتر این خبرگزاری ارسال شده بود در سایت خود قرار داد. این اسناد نشان میداد این شرکت در حال کار بر روی ابزارهایی برای شبیهسازی صدا با کمک هوش مصنوعی است.
این گزارش مینویسد ناشرانی چون: Storytel ، پلتفرمهای رسانهای مانند MNTN برای کتابهای صوتی و محتوای رادیویی؛ ناشرانی مانند Embark Studios و Paradox Interactive فعال در حوزۀ بازیها و شرکت انیمهسازیThe Soul Publishing سرمایه گذاران استراتژیک این حوزهاند که فعالیت خود برای غنیسازی بانک صوتی بهکمک هوشمصنوعی را آغاز کردهاند.
این نشریه طی یک نظرسنجی از مخاطبان سریالها، انیمهها و کارتونها با این موضوع که “آیا تمایل دارند صدای واقعی هنرمندان و صداپیشگان را بشنوند یا صداهای تولیدشده با هوشمصنوعی و هنروران صدا” ، به نتایج جالبی رسید: حدودا 80 درصد مخاطبان محصولات ویدیویی بالای 18 سال عنوان کردند که دوست دارند صدای هنرمندان واقعی را بشنوند چون با آنها خاطره دارند؛ و اصلاً دوست ندارند صدای مصنوعی بشنوند.
این درحالی بود که مخاطبان گروه سنی 12 تا 18 سال، موافق این کار بودند؛ و مخاطبان کودک نیز نظر خاصی نداشتند. بهعبارت بهتر، برایشان فرقی نمیکرد که صدای واقعی یا صدای ساختگی با هوشمصنوعی بشنوند.
ElevenLabs، که اخیراً ۱۹ میلیون دلار از سرمایهگذارانی همچون Andreessen Horowitz و بنیانگذار DeepMind به دست آورده است اعلام کرد که قصد دارد در نهایت مدل هوش مصنوعی خود را به دوبله صوتی گسترش دهد.
این گزارش مینویسد در میانۀ این سرمایهگذاریها برای استفاده از هوشمصنوعی در دوبلۀ تولیدات رسانهای، استارتاپهایی مانند PaperCup و DeepDub She کاملاً مخالف این کارند و دلیل آنها این است که: «هرچند هوشمصنوعی کاملاً کپیبرداری شده بر مبنای صدای هنرپیشگان باشد و همان صدا را به گوش مخاطب برساند اما فاقد احساس و هیجان لازم است این صدای ساختگی قادر نیست بهراحتی احساسات، هیجان، خشم، عشق، شادی، حتی آوازخواندن هنروران صدا و لحنشان را از یک زبان به زبان دیگر منتقل کند. به نظر شما آیا آوای ساختگی بر اساس هوشمصنوعی میتواند غم موجود در صدای یک شخصیت بهخاطر جنگ و آوارگی، از دست رفتن یک دوست یا مواردی از این دست را منتقل کند؟ یا حتی شادی هیجانی و ابهت صدای دوستداشتنی شون کانری در انیمیشن شیرشاه، با هوشمصنوعی، قابل قیاس است؟!»