متا مدل هوش مصنوعی جدیدی به نام SeamlessM4T معرفی کرده است که میتواند گفتار را از 101 زبان ترجمه کند و گامی به سوی ترجمه همزمان و لحظهای است. برخلاف روشهای سنتی که شامل چند مرحله برای ترجمه گفتار به متن، متن به متن، و سپس متن به گفتار است، این مدل ترجمه مستقیم گفتار به گفتار را ارائه میدهد که باعث افزایش دقت و کارایی میشود. SeamlessM4T در ترجمه متن 23 درصد دقیقتر از بهترین مدلهای موجود است و در حالی که مدل Google AudioPaLM زبانهای بیشتری (113 زبان) را پوشش میدهد، ترجمه آن فقط به انگلیسی محدود است، در حالی که SeamlessM4T به 36 زبان ترجمه میکند. کلید موفقیت این مدل استفاده از روشی به نام استخراج دادههای موازی است که در آن صدای یک ویدیو یا صوت با زیرنویسهای همزمان در زبان دیگر مرتبط میشود. این فرایند به مدل امکان داده تا الگوهای زبانی را بهتر بشناسد و ترجمههای دقیقتری را ارائه کند، حتی برای زبانهای کمتر شناختهشده.
به گفته پژوهشگران، مترجمان انسانی همچنان نقش حیاتی در فرآیند ترجمه دارند، زیرا فرهنگها و زمینههای مختلف زبانی را بهتر درک میکنند. برای مثال، در موارد حساس مانند پزشکی یا حقوق، ترجمههای ماشینی باید توسط انسان بررسی شوند تا از اشتباهات جدی جلوگیری شود. نمونهای از این مسئله ترجمه اشتباه عبارت "اجباری نیست" به "ضروری نیست" توسط Google Translate در سال 2021 بود که معنا را بهکلی تغییر داد. مشکلی که این مدلها با آن روبهرو هستند، کمبود دادههای آموزشی برای برخی زبانهاست. تیم SeamlessM4T برای حل این مشکل، مدل را با میلیونها ساعت داده صوتی پیشآموزش داده و توانایی تشخیص الگوهای عمومی زبان را بهبود بخشیده است.
این سیستم متنباز است که پژوهشگران امیدوارند باعث پیشرفت بیشتر آن شود. بااینحال، برخی کارشناسان معتقدند مدلهای موجود مانند Google Translate همچنان سریعتر و کاربردیتر هستند. یکی از هیجانانگیزترین جنبههای SeamlessM4T، امید به دستیابی به ترجمه همزمان در آینده نزدیک است. متا ادعا میکند که نسخه جدیدی از Seamless ساخته که به سرعت مترجمان انسانی نزدیک شده است. به گفته پژوهشگران، ترجمه همزمان میتواند تأثیر بزرگی در ارتباطات جهانی داشته باشد.
منبع خبر: technologyreview
پاسخ :