تایپ صوتی یا تبدیل گفتار به نوشتار یکی از زیر شاخههای فناوری شناسایی گفتار یا Speech Recognition است. از کاربردهای تایپ صوتی در گوشیهای هوشمند میتوان به نوشتن پیامک، ایمیل یا تایپ کردن در شبکههای اجتماعی (تلگرام، واتساپ و اینستاگرام) اشاره کرد.
* اگر میخواهید یک یا چند فایل صوتی را در گوشی اندرویدی یا آیفون خود تبدیل به متن کنید با سید علی ابراهیمی همراه باشید!
ترجمه متن با عکس گرفتن در مترجم گوگل
تایپ صوتی در اندروید
منظور از تایپ صوتی اندروید اپلیکیشن یا سرویسی است که به طور اختصاصی عملیات تایپ صوتی را برای گوشیهای هوشمند دارای سیستم عامل اندروید انجام میدهد. اپلیکیشنهای بسیاری هستند که این عملیات را برای گوشیهای اندرویدی انجام میدهند اما از بین نمونههای موجود در بازار، تنها سرویس تایپ صوتی گوگل یا گوگل ویس تایپینگ (Google Voice Typing) است که بر روی تعداد زیادی از زبانها فارسی این سرویس را ارائه میدهد. سایر اپلیکیشنها یا سرویسهای تایپ صوتی معمولا بر روی یک یا تعداد بسیار محدودی زبان کاربرد دارند.
مزایا تایپ صوتی اندروید چیست؟
به طور کلی کاربرد تایپ صوتی برای تبدیل گفتار به نوشتار است و بر روی سیستمهای اندروید نیز این چنین می باشد. ممکن است استفاده از تایپ صوتی بر روی گوشیهای هوشمند کمی کاربرد خصوصیتری داشته باشد و کاربران میتوانند از تبدیل گفتار به نوشتار برای کارهای روزمره و روتین خود همانند پیام دادن و یادداشت کردن استفاده نمایند. تایپ صوتی بر روی گوشیهای اندرویدی به طور کلی دارای مزیتهای زیر میباشد.
سرعت فوقالعاده
قدرت تایپ کلمات یک فرد عادی بین 38 تا 40 کلمه در دقیقه، سرعت تایپ یک فرد نیمه حرفه ای بین 60 تا 70 کلمه در دقیقه و سرعت تایپ یک فرد حرفه ای 90 تا 100 کلمه در درقیقه است! اما سرعت تایپ فارسآوا تقریبا 10 برابر یک تایپیست حرفه ای است و حدود 1000 کلمه در دقیقه سرعت دارد!!!
دسترسی بالا
از آنجایی که تایپ صوتی بر روی پلتفرمهای متفاوتی در دسترس است، در گوشیهای هوشمند نیز میتوان در هر کجا از آن استفاده کرد. دیگر لازم نیست همانند روشهای قدیمی یک جا نشسته و ساعتها به تایپ کردن مشغول شوید.
دقت بالا
یک تایپیست معمولی به صورت میانگین از هر 100 کلمه در 8 کلمه را اشکال تایپی دارد. در صورتی که با استفاده از سیستم تبدیل گفتار به نوشتار میزان خطا تا حد زیادی کاهش مییابد. زیرا به جای نوشتن کلمات با استفاده از کیبورد، کلمات مستقیما به سرویس هوش مصنوعی گفته شده و او نیز آنها را به نوشته تبدیل کرده است.
چگونه تایپ صوتی اندروید را فعال کنیم؟
همانطور که بالاتر به آن نیز اشاره شد، برای استفاده از تایپ صوتی میتوانید از اپلیکیشن و یا سرویسهای مختلفی که در بازار وجود دارند بهره ببرید. مشکلی که در این زمینه وجود دارد آن است که کاربر فارسی زبان برای استفاده از تایپ صوتی تا حدودی با مشکل مواجه است. زیرا به دلیل اینکه هوش مصنوعی و تبدیل گفتار به نوشتار در کشور حوزه بسیار جدید و نوپایی است محصولات محدودی در این زمینه وجود دارند و نمونههای خارجی مشابه نیز اکثرا بر روی زبان فارسی سرویسی ارائه نمیدهند.
شاید بتوان گفت کاربر فارسی زبان از بین سرویسهای خارجی تنها میتواند از تایپ صوتی گوگل استفاده کند که آن هم در برخی اوقات کاربر را با مشکل مواجه میکند. زیرا که سرویس گوگل بر روی زبان فارسی متمرکز نشده و تنها گفتار عام زبان فارسی را میفهمد. لذا زمانی که کاربر با گویش خاص صحبت میکند و یا اصطلاحات خاصی به کار میبرد این سرویس قادر به تشخیص نیست. لذا برای کاربران فارسی زبان بهتر است تا به سراغ سرویسی بروند که به طور اختصاصی بر روی زبان فارسی متمرکز باشد. خوشبختانه از بین نمونههای محدودی که در بازار داخلی وجود دارند موارد با کیفیت و کاربردی نیز پیدا میشوند.
آموزش فعال سازی تایپ صوتی گوگل
کیبورد گوگل که به نام جیبورد (Gboard) شناخته میشود از قابلیتهای کاربردی و متنوعی برخودار است. از مزایا این کیبورد ارائه دو نسخه برای گوشیهای اندرویدی و ios است، بنابراین امکان استفاده از کیبورد گوگل در گوشیهای آیفون و آیپدهای اپل هم وجود دارد. یکی از نقاط قوت کیبورد مجازی گوگل در گوشیهای موبایل، توانایی تبدیل صدا به متن است.
مراحل فعال سازی Gboard
- برای فعال سازی صفحه کلید گوگل نیاز به نصب اپلیکیشن جیبورد (Gboard) است، این اپلیکیشن را میتوان از گوگل پلی دانلود کرد.
* طبق گفتههای گوگل، اپلیکیشن جیبورد (Gboard) فقط در اندروید 7 یا ios 9 به بالا کار خواهد کرد. (دیده شد که در اندرویدهای پایینتر هم نصب شده است!) - بعد از نصب اپلیکیشن نیاز به به فعال سازی کیبورد گوگل است، برای این کار وارد تنظیمات گوشی خود شوید و در قسمت مدیریت کیبورد، اقدام به فعال سازی کیبورد گوگل کنید. (در این مرحله کیبورد گوگل از شما اخطار میدهد که ممکن است جیبورد بتواند تمام متنهایی را که تایپ میکنید، از جمله دادههای شخصی مانند رمزهای عبور و شماره کارت اعتباری را جمعآوری کند.)
- در مرحله بعدی باید کیبورد پیش فرض خود را تغییر دهید و کیبورد گوگل را به عنوان کیبورد اصلی خود انتخاب کنید.
- اگر کارهای بالا را انجام داده باشید الان کیبورد گوگل شما فعال شده است و میتوانید از آن استفاده کنید، برای شخصی سازی کیبورد گوگل هم میتوانید وارد اپلیکیشن Gboard شوید و اقدام به تغییر قالب یا اضافه کردن زبان جدید را انجام دهید.
اضافه کردن زبان فارسی به کیبورد گوگل
- اپلیکیشن Gboard را باز کنید و در قسمت زبان (languages) زبان با انتخاب گزینه اضافه کردن کیبورد (ADD KEYBOARD) زبان فارسی را انتخاب کنید و از بین کیبوردهای پیشنهادی یکی را انتخاب کنید.
- یکی از برنامههای که در آن تایپ میکنید مانند پیامک یا دفترچه یادداشت را باز کنید و بر روی قسمت وارد کردن متن را لمس کنید. وقتی که کیبورد گوگل در پایین صفحه ظاهر شد.
- میتوانید برای تغییر دادن زبان نوشتن، بر روی دکمهای با آیکون کرهی زمین در پایین کیبورد کلیک کنید تا زبان کیبورد تغییر کنید.
- برای تغییر کیبورد کافیست دست خود را بر روی آیکون کره زمین نگه دارید تا قسمت تغییر کیبورد (Change keyboard) برای شما باز شود، شما میتوانید در این قسمت کیبورد خود را تغییر دهید.
آیا اپلیکیشن داخلی وجود دارد که تایپ صوتی اندروید تخصصی برای زبان فارسی انجام دهد؟
یکی از محصولاتی که به صورت تخصصی تایپ صوتی اندروید در زبان فارسی انجام میدهد، محصول فارس آوا شرکت عامر اندیش میباشد. به جرئت میتوان گفت این محصول یکی از با کیفیتترین محصولات حال حاضر بازار حال حاضر ایران میباشد. محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاسِت موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهرهمندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکتهای بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.
محصول فارس آوا دارای قابلیت های زیر می باشد:
- تبدیل گفتار به متن فارسی با دقت و سرعت بالا
- بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
- تبدیل گفتار به متن بصورت همزمان (Real-Time)
- تشخیص گفتار و صوت در محیطهای نویزی
- پشتیبانی از انواع لهجهها و گویشها
- قابلیت تبدیل گفتار محاورهای به متن
- پشتیبانی از انواع فرمتهای صوتی و ویدیویی
- تبدیل گفتار انگلیسی به متن انگلیسی
- غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
- ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
- ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
- قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
- بهرهمندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
- تبدیل گفتار به نوشتار به کمک هوش مصنوعی