رونمایی از نرم‌افزار تبدیل گفتار به متن سخنرانی‌های رهبر انقلاب/ رهبری از کدام کلمات بیشتر استفاده می‌کنند؟

نسل جدید سامانه تبدیل گفتار فارسی به نوشتار با ارائه نسخه بیانات رهبر معظم انقلاب در بازه زمانی ۱۳۷۰ تا ۱۳۹۳ رونمایی شد.

نرم‌افزار تولیدی شرکت دانش‌بنیان عصر گویش‌پرداز، صبح امروز با حضور مسوول نهاد نمایندگی مقام معظم رهبری در دانشگاه صنعتی شریف رونمایی شد.
این سامانه تمامی سخنرانی‌ها، بیانات و کلاس‌های درس مقام معظم رهبری را از سال ۷۰ تاکنون به متن تبدیل کرده است.
سامانه تبدیل فایل‌های صوتی سخنرانی‌های مقام معظم رهبری که با فناوری‌ هوش مصنوعی و اختصاصی کردن موتور تشخیص گفتار طراحی شده این امکان را فراهم کرده که فایل‌های صوتی و ویدئویی ضبط شده از بیانات رهبر معظم انقلاب به صورت متن دربیاید.
این نرم‌افزار نسل دوم تکنولوژی تایپ گفتاری فارسی محسوب می‌شود که با بهره‌گیری از تجارب به کار گرفته شده در فناوری شرکت‌هایی مانند گوگل، مایکروسافت و آمازون، بومی‌سازی و پیاده‌سازی شده است.
سامانه تبدیل فایل صوتی به متن به صورت اختصاصی در فاز نخست برای بیانات مقام معظم رهبری رونمایی شده است و در فازهای بعدی این نرم‌افزار برای عموم کاربرد خواهد داشت.
دکتر هادی ویسی، مدیرعامل این شرکت دانش بنیان با بیان اینکه نسل اول نرم افزار تبدیل گفتار فارسی به نوشتار، دارای محدودیت هایی بود، افزود: محدودیت اول این که گفتار حتما باید به صورت کتابی می بود و گفتارهای محاوره‌یی با غلط های زیادی تبدیل به نوشتار می شد، ضمن این که وابستگی زیادی به صدای افراد داشت و باید حتما فرد موردنظر، چند جمله را به صورت آزمایشی برای نرم افزار می خواند تا صدای او برای سیستم نرم افزار، قابل تشخیص باشد و محدودیت سوم به بحث کیفیت صدا برمی گشت که در محیط های پر سر و صدا و همراه با پارازیت صوتی (اختلال صوتی)، دقت آن کاهش می یافت.
به گفته وی در نسل ارتقا یافته نرم افزار تبدیل گفتار فارسی به نوشتار، محدودیت های نسل قبلی تا حدود بسیار زیادی برطرف شده است و قابلیت استفاده در مصاحبه ها، سخنرانی ها و جلسات کاری را دارد.
نرم افزار تبدیل گفتار به متن
ویسی درباره نسخه اختصاصی رونمایی شده که سخنرانی‌های مقام معظم رهبری در ۲۳ سال گذشته را به متن تبدیل کرده است، گفت:
برنامه این نرم افزار در دو بخش اختصاصی سازی شده است. بخش اول به کلمات و ادبیات موضوع اختصاص دارد که در این بخش، بیش از سه میلیون کلمه در نرم افزار بارگذاری شده و بخش دوم نیز به مبحث صدا مربوط می شود و درعین حال، ساختار معنایی و انشایی و ادبیات را به نرم افزار اضافه کردیم و به اصطلاح مدل زبانی به نرم افزار دادیم.
وی درباره نحوه کارکرد این نرم افزار نیز توضیح داد: در این سامانه، فایل صوتی به صورت صدا یا ویدئو یا هر فرمت دیجیتال در نرم افزار، بارگذاری می شود و سامانه نیز پس از پردازش فایل، آن را به صورت متن نوشتاری تحویل می دهد.
ویسی تصریح کرد: نسخه جدید سامانه تبدیل گفتار فارسی به نوشتار، همچنین این ویژگی را دارد که در صورت مشکوک بودن به صحت یک کلمه، آن را به صورت رنگی نشان می دهد تا کاربر با دقت بیشتری آن را بررسی کند.
وی درباره سرعت و مدت زمان تبدیل گفتار به نوشتار نیز گفت: سرعت انجام این کار به سرعت پردازنده رایانه کاربران بستگی دارد و به عنوان مثال می توان یک سخنرانی یک ساعته را در مدت ۱۰ یا ۳۰ دقیقه و در صورت پایین تر بودن سرعت اینترنت در مدت یک ساعت به نوشتار تبدیل کرد.
ویسی در ادامه با اشاره به تحلیل انجام شده روی کلمات و متون سخنرانی‌های مقام معظم رهبری گفت: براساس این بررسی، رهبر معظم انقلاب در بیانات خود، ۶۰ هزار کلمه و واژه اختصاصی را به کار برده‌اند و این در حالی است که یک فرد عادی در طول عمر خود با کمتر از ۱۰هزار کلمه اختصاصی سروکار دارد. در همین حال بررسی‌های صورت گرفته از مجموعه متون شکسپیر نیز نشان می‌دهد که کل کلمات به کار رفته در این مجموعه حدود ۳۰ هزار کلمه بوده است که این امر نشان از حجم وسیع واژگان و غنای سخنان مقام معظم رهبری دارد.
وی ادامه داد: پردازش و تحلیل محتوای کلمات پرکاربرد در فرمایشات مقام معظم رهبری نیز حاکی از آن است که کلماتی مانند اسلامی، ملت، کشور، کار، اسلام، ایران، وجود، انقلاب، دنیا، سال، نظام، انسان، امام، دشمن، حرکت، روز، خدا، جمهوری، الهی و بزرگ ۲۰ کلمه پرکاربرد فرمایشات رهبر معظم انقلاب طی ۲۳ سال اخیر بوده است.

دیگر مطالب

Comments are closed, but trackbacks and pingbacks are open.