شرکت متا در این هفته، پیشنمایشی از یک مدل هوش مصنوعی مولد را منتشر کرد که میتواند در آینده صدای دستیار مجازی شخصی شما را با صدای فردی که میشناسید، جایگزین کند.
به گفته متا: «Voicebox میتواند صداهای با کیفیت بسازد و صداهای از پیش ضبط شده را ویرایش کند (مانند حذف صدای بوق خودرو یا پارس سگ در پسزمینه) و در عین حال محتوا و سبک صدا را حفظ کند. بعلاوه، این مدل چندزبانه است و میتواند به شش زبان، صحبتها را ایجاد کند.»
البته همانطور که میدانیم، این فناوری ممکن است راهی برای سوء استفاده برای افراد فاقد صلاحیت ایجاد کند. به همین دلیل، متا اعلام کرده است که در حال حاضر تصمیمی برای عرضه این مدل و یا کد آن به صورت عمومی ندارد. طبق اعلام این شرکت: «اگرچه ما اعتقاد داریم که مهم است تا با جامعه هوش مصنوعی تعامل داشته باشیم و به منظور پیشرفت هوش مصنوعی، تحقیقات خود را به اشتراک گذاریم، اما همزمان لازم است تا توازن درستی بین عدم محرمانگی و مسئولیت برقرار کرد.»
در حال حاضر تیم هوش مصنوعی متا، نمونههای صوت و مقالات علمی در رابطه با نتایجی که تاکنون به آن دست یافتهاند، منتشر کرده است.
در ویدیویی که این شرکت منتشر کرده است، ما قابلیتهای تبدیل متن به صوت توسط Voicebox را مشاهده میکنیم. در این ویدیو به توانایی تولید صوت در شش سبک مختلف، استفاده از صدای فرد برای خواندن متنی که به آن داده شده است، حذف نویز از صوت، تغییر کلمات از میان کلمات گفته شده و تغییر زبان یک صوت، اشاره شده است.