استخراج صدا در محل های شلوغ ممکن شد

کدخبر: 425368 ۱۳۹۷/۰۷/۲۲ ۱۲:۳۹:۰۲

لینک کپی شد

رکنا: استخراج صدای افراد از همهمه ممکن شد.

کدخبر: 425368 ۱۳۹۷/۰۷/۲۲ ۱۲:۳۹:۰۲

لینک کپی شد

زمانی که در محلی شلوغ انبوهی از افراد در حال صحبت کردن با یکدیگر هستند، به سختی می توان صدای فرد خاصی را تشخیص داد و از گفته های او مطلع شد، اما فناوری بر این چالش هم غلبه کرده است.

به گزارش ونچربیت، اگر چه برخی بلندگوهای هوشمند مانند گوگل هوم و آمازون اکو از توانایی های خوبی در این زمینه برخوردار هستند، اما آنها هم در تشخیص یک صدا از میان چند صدای همزمان دچار مشکل می شوند.

به تازگی محققان مرکز تحقیقاتی Idiap در سوئیس با همکاری گوگل راه حلی برای این مشکل یافته اند. آنها با طراحی دو شبکه عصبی مبتنی بر هوش مصنوعی و ترکیب کارکردهای آنها با یکدیگر استخراج صدای فرد هدف در یک جمع بزرگ و پرسروصدا را ممکن کرده اند.

از دو شبکه عصبی طراحی شده یکی وظیفه شناسایی صدای تک تک افراد و دیگری وظیفه استخراج آنها را بر عهده دارد. تلاش برای طراحی این سیستم از ابتدای سال جاری میلادی آغاز شده و آزمایش آن با موفقیت در آزمایشگاه هوش مصنوعی و علوم رایانه دانشگاه ام آی تی انجام گرفته است.

این سیستم که پیکسل پلیر نام دارد، با دریافت ویدئوهایی از یوتیوب توانسته صدای تک تک افراد هدف را از آنها استخراج کند. تغذیه این سیستم و افزایش توان یادگیری آن از طریق تغذیه آن با استفاده از انبوهی از نمونه های صدا صورت گرفته که تعداد آنها بالغ بر ۳۴ میلیون مورد است. میزان خطای این سیستم در ابتدا در حدود ۵۵.۹ درصد بوده که بعد از مدتی به ۲۳.۴ درصد کاهش یافته است.خواندنی های رکنا را در اینستاگرام دنبال کنید

اخبار وبگردی را در اینجا بخوانید:

ترامپ:در مورد حمله به ایران پاسخ نمی دهم ! / مگر احمقم !+ فیلم

گلزنی کریم بنزما در دیدار امشب الاتحاد مقابل الهلال
- مشاهده خبر

آی تی هوش مصنوعی کاهش افزایش نمونه

اخبار مرتبط

ویدئو

✅ خرید ساده و راحت
✅ صرافی معتبر کیف پول من
✅ ثبت نام سریع با شماره موبایل
✅ احراز هویت آنی با کد ملی و تاریخ تولد
✅ واریز لحظه‌ای به کیف پول شخصی شما

آیا دلار دیجیتال (تتر) گزینه مناسبی برای سرمایه گذاری است؟

استفاده از ویجت خرید ارز دیجیتال به منزله پذیرفتن قوانین و مقررات صرافی کیف پول من است.

قدرت گرفته از صرافی معتبر کیف پول من